プログラム練習記13日目_エクセルデータの取り込みと操作
データは取り込めるものの…
今日もプログラム練習記から。
第13日目となりましたが、絶賛壁にぶつかっています。
今日もデータの練習にと、e-Statからデータを取り込みました。
「地域特産野菜生産状況調査長期累年長期累年統計表一覧」
という農水省の提供しているデータです。
地域特産野菜とは、流通量は多くないけれども取引されている野菜、つまり少し変わり種の野菜の取引データです。
クレソンもこちらの統計で記録されていますので、
今日の目標はクレソンと時系列の部分を抜き出してグラフにすることです。
まずはデータの取り込み
データをe-Statのサイトよりエクセルファイルでダウンロードして、
google colaboratoryのファイルマークよりインポートします。
やり方は、画面左側のファイルマークをクリック。
右側に広がったらアップロードボタンを押して、アップロードしたいファイルを選択。
取り込まれたら右クリックして「パスをコピー」を使ってコピーして貼り付けます。
取り込みは下記のように「pd.ExcelFile」メソッドでとりこみました。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#excelファイルの「取り込み
xls_file = pd.ExcelFile('/content/地域特産野菜生産状況調査長期累年長期累年統計表一覧.xls')
table = xls_file.parse('収穫量')
table.head()
df = pd.DataFrame(table)
df
データの操作
とりこみまではできたのですが、
データの操作でつまずいています。
「.T」で表の行と列を入れ替えたり、
#dataframeの行と列の入れ替え
df.T
#reset_インデックスとset_インデックス
df.reset_index()
df.set_index('Unnamed: 1')
インデックスを品目名にして、columnsに時系列を取り込みたかったのですがうまく操作できず(;´・ω・)
エクセルならこのとおり!
エクセルだと操作方法がわかるので、
クレソンと時系列の部分を見比べるグラフは簡単につくれました。
クレソンの生産量は減っていっているのがトレンドのようです。
ピークの約三分の一か…
クレソンの知名度を上げなければなりませんね!!
エクセルにまだpythonではかなわない現状です( ˘•ω•˘ )
エクセルスゴイ。
近況、高原クレソンはじまりました。
最後に簡単に最近の近況を。
猛暑日の続く九州ですが、久住ではクレソン育っています!
とはいえ、さすがに今年は暑すぎます。
陽射しがよく当たるクレソンは葉色が変わって少し枯れてしまっています。
台風も発生してしばらく猛暑が続くそうです。
なんとか大暑のこの時期を乗り切ってほしいです。
まとめ
プログラム練習の13日目、私はまたもや壁にぶつかりました。
今日は農水省のデータを使い、クレソンの時系列データをグラフ化することが目標です。
データの取り込みは問題なく進みましたが、操作がうまくいかず、苦戦しています。
Pythonでのデータ操作は難しく、エクセルなら簡単にできるのに、と感じました。
エクセルでのグラフ作成はスムーズに進み、クレソンの生産量が減少していることがわかりました。
この現象を変えなければ、と意気込んでいます。
九州の猛暑にも負けず、クレソンは成長中ですが、今年の暑さは厳しく、葉が枯れかけています。
これからの気候に負けず、乗り切ってほしいものです。