head 上の部分だけを表示する
データフレーム.head()
merge データフレームを結合する
pd.merge(データフレーム1, データフレーム2, on="参考にする列の名前", how="left")
欠損値(NaN)を確認する
データフレーム.isnull().sum()
groupby 要素をグループ化して処理する
データフレーム.groupby("カラム名").count()データフレーム.groupby("カラム名").mean()
describe 各列の要約統計量を取得
DataFrame.describe()
K-means法でクラスタリング
from sklearn.cluster import KMeans
frmm sklearn.preprocessing import StandardScaler
sc = StandardScaler()
DATAFRAME_sc = sc.fit_transform(DATAFRAME)
kmeans = KMeans(n_clsters=4, random_state=0)
clusters = kmeans.fit(DATAFRAME_sc)