ngtokuの日記

主に雑記帳です。SNSではngtokuのID取れなかったんで、別のIDでやってます。

pandasでexcel取り込んでプロット

作業ログ的に記録。
作業はAnaconda上のNotebookで。

データは以下を使用。
CO2 emissions (metric tons per capita) | Data

上記excelの "Data" シートの内容を取り込んでプロット。
全行だと多すぎるので、とりあえず2-10行目を出力。

import pandas as pd
import numpy as np
book = "/(ファイルパス)/API_EN.ATM.CO2E.PC_DS2_en_excel_v2_10134430.xls"
sheet="Data"
excel = pd.ExcelFile(book)
df = excel.parse(sheet, skiprows=3) # 上3行を飛ばして4行目から取り込み
df = df.iloc[:, np.r_[1, 4 : 59]] # 1960-2014
df = df.dropna() # NaNの含まれる行を削除
df = df[2:10] # 2行目から10行目まで
df = df.set_index("Country Code") # インデックス値を"Country Code" の列に指定
df.T.plot() # 行列を入れ替えてプロット

グラフはこうなった。
f:id:ngtoku:20181008012523p:plain

コメント入れたので特に説明は不要だろう。