pythonで2つのデータフレームを比較して差分の行を出したい!
ある日のデータと次の日のデータを比較して差分抽出したいです。
使いたいシーンとしては、日々スクレイピングしていて、差分行を抽出し、
新着情報としてメールとかlineするとかしたいのです。
調べてみると、compare関数があるとのこと。
なんだこの結果は。。。。
扱いづらすぎる。。。。
差分列だけ?そもそも見方もわからん。。
色々試行錯誤すること3時間。。。
結局、aを主キーとすると
print(df1[~df1['a'].isin(df2['a'])])
これですね!
ふー。疲れた。。
pythonでのデータ抽出基礎はこちらを参考にしてください。
sefatherprogram.hatenadiary.jp
応用編はこちら。※時々拡張していきます。
sefatherprogram.hatenadiary.jp
これぐらいの抽出方法を理解するだけで、こんなwebアプリが作れます。
sefatherprogram.hatenadiary.jp
さらにデータ分析するとこんなことも。
ご参考まで。
sefathershiawase.hatenablog.com
sefathershiawase.hatenablog.com
sefathershiawase.hatenablog.com