Gmailの売上情報をスクレイピングする前に解析する-農家のGAS(2)

前振りで終わった前回。

今回もまだ準備編です。

売上情報メールの構造を解析する

具体的なプログラミングに入る前に、「何をどうしたいか」を明確にしておく必要がありそうです。

なにせ、「何をやったらいいかわかんない初学者」ですからね。

まず、売上情報メールの構造を確認します。

必要なのは、基本的に赤い部分です。

  • どの店舗で
  • 何が
  • 何個
  • 何円で売れたのか

野菜番号というのは、1~4まであります。

逆に言えばそれしかない。

野菜1でニンニクを売っても、オクラ売っても、なんでもいいわけです。

管理するのは各自という事ですね。

定形の文字だけ拾えば良いというのは、スクレイピングするのには好都合だと思います。

(野菜の種類が変わっても、拾い上げる文字は変わらないので)

という事で、売上情報メールの中から拾い出したい部分はだいたい見えてきました。

店舗ごとに情報を分割する

店舗ごとにわけて売上情報が届くのであれば、まずは店舗ごとの区分けに文字情報を分割しましょう。

イメージとしてはこんな感じ

店舗1の文字情報・店舗2の文字情報・・といった感じで、大きく区分けします。

店舗名は固定なので、条件を付けるのもそんなに難しくないと思っています。

分割した店舗ごとの情報を、さらに商品ごとに分割する

店舗1の区分けで分割された文字情報。

この中で、さらに「野菜番号」ごとに分割していきましょう。

この場合なら、野菜3と野菜1で分割します。

これも、「野菜番号」が4種類しかないので、拾い出しやすいですね。

スクレイピングした文字情報を表形式に並び替える

ここまで拾い出した(スクレイピング)情報を、わかりやすく表形式にするとこんな感じになるでしょうか。

こうやって表形式に自動で出力出来れば、あとは在庫管理なり売上金額の管理なり、売れ筋店舗の解析なり、なんでもやれるようになります。

このようにまずはゴールを作ってから、それに向かってGASの何を調べ学べば良いか考えていきたいと思います。

という事で、次回はいよいよGASのプログラミング実践編に入ります。