python

head 上の部分だけを表示する

データフレーム.head()

merge データフレームを結合する

pd.merge(データフレーム1, データフレーム2, on="参考にする列の名前", how="left")

欠損値(NaN)を確認する

データフレーム.isnull().sum()

groupby 要素をグループ化して処理する

データフレーム.groupby("カラム名").count()データフレーム.groupby("カラム名").mean()

describe 各列の要約統計量を取得

DataFrame.describe()

K-means法でクラスタリング

from sklearn.cluster import KMeans
frmm sklearn.preprocessing import StandardScaler
sc = StandardScaler()
DATAFRAME_sc = sc.fit_transform(DATAFRAME)

kmeans = KMeans(n_clsters=4, random_state=0)
clusters = kmeans.fit(DATAFRAME_sc)

アーカイブ

もっと見る