訓練/テストデータのカラム名を日本語からRenameするのが面倒くさい方向け
一括でrenameできるようにカラム名変換用の辞書を作りました。
{
"種類": "Type",
"地域": "Region",
"市区町村コード": "MunicipalityCode",
"都道府県名": "Prefecture",
"市区町村名": "Municipality",
"地区名": "DistrictName",
"最寄駅:名称": "NearestStation",
"最寄駅:距離(分)": "TimeToNearestStation",
"取引価格(総額)": "TradePrice",
"坪単価": "PricePerUnit",
"間取り": "FloorPlan",
"面積(㎡)": "Area",
"取引価格(平方メートル単価)": "UnitPrice",
"土地の形状": "LandShape",
"間口": "Frontage",
"延床面積(㎡)": "TotalFloorArea",
"建築年": "BuildingYear",
"建物の構造": "Structure",
"用途": "Use",
"今後の利用目的": "Purpose",
"前面道路:方位": "Direction",
"前面道路:種類": "Classification",
"前面道路:幅員(m)": "Breadth",
"都市計画": "CityPlanning",
"建ぺい率(%)": "CoverageRatio",
"容積率(%)": "FloorAreaRatio",
"取引時点": "Period",
"改装": "Renovation",
"取引の事情等": "Remarks"
}
変換後の名前はこちらを参考にしました。
不動産取引価格情報取得API - API操作説明
またカラム名を一括で変換する際は下記のようにjsonファイルを使ってください。
import json
import pandas as pd
# ↑のjsonファイルをnames.jsonで保存してある前提
with open("names.json", "r", encoding="utf-8") as f:
d = json.load(f)
train = pd.read_csv("train_data.csv")
test = pd.read_csv("test_data.csv")
train = train.rename(columns=d)
test = test.rename(columns=d)