Python

概要

ここでは私が学んだPythonの使い方を書いていきます。

#matplotlib の使い方

#python #informatics

%matplotlib inline

import matplotlib.pyplot as plt

散布図

plt.scatter(df['median_income'], df['median_house_value'])

ヒストグラム

plt.hist(df['median_house_value'], bins=50)

ボックスプロット(箱ひげ図)

plt.boxplot((df['total_bedrooms'], df['population']))

#pandas の使い方

#python

#informatics

#インポート

import pandas as pd

#データの読み込み

##tsv

pd.read_csv( 'foo.txt', sep='\t' )

#ざっとながめる

df.describe()

#要素の出現回数

vc = df['state'].value_counts()

# 任意の列だけ取り出したい場合

df[['name', 'kcal']]

# datetime列をindexにする

df.set_index('datetime', inplace=True)

#任意の行だけ取り出したい場合

df[100:106]

# 条件を指定して抽出

df[df['kcal'] > 450]

# queryメソッドを使うと、複数条件の指定で、特定カラムだけ出力もできる

df[['name', 'kcal']].query('kcal > 450 and name == "豚肉の生姜焼"')

# カラム名を変更する(y を sales に変換)

df.rename(columns={'y': 'sales'}, inplace=True)

# weather列の集計

df['weather'].value_counts()

df.groupby(['month', 'period'])['sales'].sum()