Gmailの売上情報をスクレイピングする前に解析する-農家のGAS(2)
前振りで終わった前回。
今回もまだ準備編です。
売上情報メールの構造を解析する
具体的なプログラミングに入る前に、「何をどうしたいか」を明確にしておく必要がありそうです。
なにせ、「何をやったらいいかわかんない初学者」ですからね。
まず、売上情報メールの構造を確認します。
必要なのは、基本的に赤い部分です。
- どの店舗で
- 何が
- 何個
- 何円で売れたのか
野菜番号というのは、1~4まであります。
逆に言えばそれしかない。
野菜1でニンニクを売っても、オクラ売っても、なんでもいいわけです。
管理するのは各自という事ですね。
定形の文字だけ拾えば良いというのは、スクレイピングするのには好都合だと思います。
(野菜の種類が変わっても、拾い上げる文字は変わらないので)
という事で、売上情報メールの中から拾い出したい部分はだいたい見えてきました。
店舗ごとに情報を分割する
店舗ごとにわけて売上情報が届くのであれば、まずは店舗ごとの区分けに文字情報を分割しましょう。
イメージとしてはこんな感じ
店舗1の文字情報・店舗2の文字情報・・といった感じで、大きく区分けします。
店舗名は固定なので、条件を付けるのもそんなに難しくないと思っています。
分割した店舗ごとの情報を、さらに商品ごとに分割する
店舗1の区分けで分割された文字情報。
この中で、さらに「野菜番号」ごとに分割していきましょう。
この場合なら、野菜3と野菜1で分割します。
これも、「野菜番号」が4種類しかないので、拾い出しやすいですね。
スクレイピングした文字情報を表形式に並び替える
ここまで拾い出した(スクレイピング)情報を、わかりやすく表形式にするとこんな感じになるでしょうか。
こうやって表形式に自動で出力出来れば、あとは在庫管理なり売上金額の管理なり、売れ筋店舗の解析なり、なんでもやれるようになります。
このようにまずはゴールを作ってから、それに向かってGASの何を調べ学べば良いか考えていきたいと思います。
という事で、次回はいよいよGASのプログラミング実践編に入ります。