目次
ウィキペディアより、コピーした内容をDataFrameにする
このコピーするread_clipboard()はcolaboratoryでは使用不可
import pandas as pd
# ウィキペディアより井上尚弥の戦績
inoue_df = pd.read_clipboard()
inoue_df
pd.read_excel()でexcelファイルをデータフレームにする
# 1つ階層が上の「ファイル情報取得」フォルダの「titanic.xlsx」のエクセルファイルを参照
excel_df = pd.read_excel('../excelファイル情報取得/titanic.xlsx')
# 呼び出し
excel_df
pd.read_csvでcsvファイルからデータフレームにする
# 1つ階層が上の「ファイル情報取得」フォルダの「titanic.csv」のエクセルファイルを参照
csv_df = pd.read_csv('../excelファイル情報取得/titanic.csv')
# 呼び出し
csv_df
# 上記excel_dfと同じ結果
特定のカラム(列)を抜き出す
csv_df['Pclass']
# もしくは
csv_df.Pclass
複数カラムの情報を取得
csv_df[['PassengerId', 'Name', 'Sex', 'Age']]
取得したデータを新しいデータフレームとする
new_df = pd.DataFrame(csv_df, columns=['PassengerId', 'Name', 'Sex', 'Age'])
カラムを追加
new_df_plus_column = pd.DataFrame(csv_df, columns=['PassengerId', 'Name', 'Sex', 'Age', 'Country'])
# 出力
new_df_plus_column
カラムの値を一括代入
new_df_plus_column['Country'] = "みんな不明"
# 出力
new_df_plus_column
Seriesからカラムに値を代入
country = pd.Series(["日本", "韓国", "中国"], index =[0, 1, 5])
new_df_plus_column['Country'] = country
# 出力
new_df_plus_column.head(6)
カラムを削除する
del new_df_plus_column['Country']
辞書型からデータフレームを作る
# 辞書型を作成
data = {'都市': ['大阪', '京都', '和歌山', '奈良'], '人口':[100, 200, 300, 400]}
city_info = pd.DataFrame(data)
# 呼び出し
city_info