統計局の調査データを、順にPythonでグラフ化していこうチャレンジを始めました。
よくわからない状態ではありましたが、とりあえず最新の「労働力調査」の月次調査(2024年8月)の1個目の統計表をダウンロードして円グラフを作ってみたりしたのですが、これだとあまりPythonの練習にならないことに気づき、「API機能」に手を出してみることにしました。
とりあえず、「就業状態別15歳以上人口(2000年1月~)」という統計表のデータが取得できるようになったので、
読み込めるようになったデータをDataFrameにして私でも理解できる形にして、ひとまずplotlyを使って折れ線グラフにしてみたところです。
ただやっぱりしっくりこないので、「レンジセレクター」というのをつけてみたいと思います。
レンジセレクターをつけると、横軸(x軸)の範囲を可変にできるようです。
調査年月のデータはただの文字だったので、まずはそこから調査年月の日付のデータの列を作りました。
それで、レンジセレクターをつけてみた。
やっぱりでこぼこしている。
ちょっと心当たりがあったので、仕方なく、読み込んだ元のjsonファイルを見に行ってみると、descriptionというところに次のように書いてありました。
労働力調査では結果を算出するための基礎となる人口(ベンチマーク人口)として推計人口を用いています。
1982年から5年ごとに算出の基礎となるベンチマーク人口の基準を切り替えており、それぞれ切替えに伴う変動があります。
長期時系列表や速報では、2005年10月から2021年12月までの期間を含む数値を、基準切替え後のベンチマーク人口に基づいて遡及又は補正した時系列接続用数値に置き換えて掲載しています。
結果原表及びデータベース収録の数値は、公表当時の数値です。
このため、当該期間は、長期時系列表の数値とデータベースの数値とで異なる場合があります。
いや、関係なさそう。
だって、私が気になっているでこぼこは2017年くらいから最近までずっとだもん。
やっぱり、どっかで何かを間違えたのか?
と思ってよく見てみたら、数値とグラフのマークされている位置が合ってない!
これは大事になりそうです。
とりあえず、今日参考にしたサイト