統計局の調査データを、順にPythonでグラフ化していこうチャレンジを始めました。
よくわからない状態ではありましたが、とりあえず最新の「労働力調査」の月次調査(2024年8月)の1個目の統計表をダウンロードして円グラフを作ってみたりしたのですが、これだとあまりPythonの練習にならないことに気づき、「API機能」に手を出してみることにしました。
とりあえず、「就業状態別15歳以上人口(2000年1月~)」という統計表のデータが取得できるようになったのですが、正直よくわからず、
読み込めるようになったデータをDataFrameにして私でも理解できる形にしようとしています。
調査年月のDataFrameができたので、あとは調査結果のデータと紐づけるだけ!と思ったら、調査結果のデータが調査年月の15倍の行数分ありました。
ショックを受けつつも、
調査結果の方のDataFrameを「@cat02」と「@cat03」で抽出して、カテゴリ名をつけて、調査年月のDataFrameに足していけばいいんじゃないか?と思いついたところまでが前の記事です。
やってみたいと思います。
まずは、「15歳以上人口」(@cat02が00)の「総数」(@cat03が0)のデータのみを抽出してみると、
調査年月と同じ行数です!!
微妙にカラムの名前が違ったので、足すところだけにして名前をつけてマージしました。
いけそうです。
この調子で全部やってみます。
とりあえず、15歳以上人口について、3種類(総数、男、女)を入れ終わりました。
でも、これをあと4回やるのは正直つらい。
名前も決まってるんだから、for文で回せるんじゃないか?と思います。
けど、今日はもう挫折です。
明日がんばります。
今日お世話になったサイトは以下でした。