Python
概要
ここでは私が学んだPythonの使い方を書いていきます。
#matplotlib の使い方
#python #informatics
%matplotlib inline
import matplotlib.pyplot as plt
散布図
plt.scatter(df['median_income'], df['median_house_value'])
ヒストグラム
plt.hist(df['median_house_value'], bins=50)
ボックスプロット(箱ひげ図)
plt.boxplot((df['total_bedrooms'], df['population']))
#pandas の使い方
#python
#informatics
#インポート
import pandas as pd
#データの読み込み
##tsv
pd.read_csv( 'foo.txt', sep='\t' )
#ざっとながめる
df.describe()
#要素の出現回数
vc = df['state'].value_counts()
# 任意の列だけ取り出したい場合
df[['name', 'kcal']]
# datetime列をindexにする
df.set_index('datetime', inplace=True)
#任意の行だけ取り出したい場合
df[100:106]
# 条件を指定して抽出
df[df['kcal'] > 450]
# queryメソッドを使うと、複数条件の指定で、特定カラムだけ出力もできる
df[['name', 'kcal']].query('kcal > 450 and name == "豚肉の生姜焼"')
# カラム名を変更する(y を sales に変換)
df.rename(columns={'y': 'sales'}, inplace=True)
# weather列の集計
df['weather'].value_counts()
df.groupby(['month', 'period'])['sales'].sum()