アラフォーから始める数字のお勉強

世の中を知らなすぎる文系が数字に挑戦するブログです

労働力調査からグラフをつくる(16)/グラフにするデータを作り直す

 

 

 

統計局の調査データを、順にPythonでグラフ化していこうチャレンジを始めました。

 

よくわからない状態ではありましたが、とりあえずいろいろ試行錯誤して、「API機能」に手を出し、「就業状態別15歳以上人口(2000年1月~)」という統計表のデータが取得できるようになりました。


読み込めるようになったデータをDataFrameにして、ひとまず折れ線グラフにしてみたのですが、「数値とグラフのマークされている位置が合ってない!」ということで、データが文字列になっていたのに気づいて、グラフにした部分のデータだけ数字にして落ち着くグラフができたところです。

 

数値はまだあって全部文字列になっていたので、ちょっとやり方を考えなければなりません。

 

 

 

とりあえず昨日思いついた通り、グラフを作る用のDataFrameにするときにデータをfloatにしてみました。

 

改めてイチからやってみる

調査年月と調査結果データをそれぞれ1回DataFrameにして

調査結果のカラム名になる部分もDataFrameにして

for文で回して1個のDataFrameにするときに、pd.to_numericで文字列をfloatにした

見た目だけじゃなく、ちゃんとfloatになってます

 

で、同じく折れ線グラフにしてみました。

せっかくなので今回は「15歳以上人口」の(総数)じゃなくて、(男)(女)です。

それっぽいグラフになった

 

数は違うけど、形はほぼほぼ同じ感じのグラフになりました。

人口って女性の方が多いんですね。知らなかった。