wakame
一括でrenameできるようにカラム名変換用の辞書を作りました。
{
"種類": "Type",
"地域": "Region",
"市区町村コード": "MunicipalityCode",
"都道府県名": "Prefecture",
"市区町村名": "Municipality",
"地区名": "DistrictName",
"最寄駅:名称": "NearestStation",
"最寄駅:距離(分)": "TimeToNearestStation",
"取引価格(総額)": "TradePrice",
"坪単価": "PricePerUnit",
"間取り": "FloorPlan",
"面積(㎡)": "Area",
"取引価格(平方メートル単価)": "UnitPrice",
"土地の形状": "LandShape",
"間口": "Frontage",
"延床面積(㎡)": "TotalFloorArea",
"建築年": "BuildingYear",
"建物の構造": "Structure",
"用途": "Use",
"今後の利用目的": "Purpose",
"前面道路:方位": "Direction",
"前面道路:種類": "Classification",
"前面道路:幅員(m)": "Breadth",
"都市計画": "CityPlanning",
"建ぺい率(%)": "CoverageRatio",
"容積率(%)": "FloorAreaRatio",
"取引時点": "Period",
"改装": "Renovation",
"取引の事情等": "Remarks"
}
変換後の名前はこちらを参考にしました。
またカラム名を一括で変換する際は下記のようにjsonファイルを使ってください。
import json
import pandas as pd
# ↑のjsonファイルをnames.jsonで保存してある前提
with open("names.json", "r", encoding="utf-8") as f:
d = json.load(f)
train = pd.read_csv("train_data.csv")
test = pd.read_csv("test_data.csv")
train = train.rename(columns=d)
test = test.rename(columns=d)
arenzero
付属データと名称が微妙に違うのうっとうしくないですか? あとデータ中での名称も微妙に違う… 役に立つかもってことで付属データと一致してるdict置いときます.
pair = [("所在地コード","市区町村コード"),("建蔽率","建ぺい率(%)"),("容積率","容積率(%)"),("駅名","最寄駅:名称"), ("地積","面積(㎡)"),("市区町村名","市区町村名"),('前面道路の幅員','前面道路:幅員(m)'), ("前面道路の方位区分","前面道路:方位"),("前面道路区分","前面道路:種類"),("形状区分","土地の形状"), ("用途区分","都市計画")]
(discription,train)の順です.