訓練/テストデータのカラム名を日本語からRenameするのが面倒くさい方向け

一括でrenameできるようにカラム名変換用の辞書を作りました。

{
    "種類": "Type",
    "地域": "Region",
    "市区町村コード": "MunicipalityCode",
    "都道府県名": "Prefecture",
    "市区町村名": "Municipality",
    "地区名": "DistrictName",
    "最寄駅:名称": "NearestStation",
    "最寄駅:距離(分)": "TimeToNearestStation",
    "取引価格(総額)": "TradePrice",
    "坪単価": "PricePerUnit",
    "間取り": "FloorPlan",
    "面積(㎡)": "Area",
    "取引価格(平方メートル単価)": "UnitPrice",
    "土地の形状": "LandShape",
    "間口": "Frontage",
    "延床面積(㎡)": "TotalFloorArea",
    "建築年": "BuildingYear",
    "建物の構造": "Structure",
    "用途": "Use",
    "今後の利用目的": "Purpose",
    "前面道路:方位": "Direction",
    "前面道路:種類": "Classification",
    "前面道路:幅員(m)": "Breadth",
    "都市計画": "CityPlanning",
    "建ぺい率(%)": "CoverageRatio",
    "容積率(%)": "FloorAreaRatio",
    "取引時点": "Period",
    "改装": "Renovation",
    "取引の事情等": "Remarks"
}

変換後の名前はこちらを参考にしました。

不動産取引価格情報取得API - API操作説明

またカラム名を一括で変換する際は下記のようにjsonファイルを使ってください。

import json
import pandas as pd

# ↑のjsonファイルをnames.jsonで保存してある前提
with open("names.json", "r", encoding="utf-8") as f:
     d = json.load(f)

train = pd.read_csv("train_data.csv")
test = pd.read_csv("test_data.csv")

train = train.rename(columns=d)
test = test.rename(columns=d)

Aws4 request&x amz signedheaders=host&x amz signature=ac0dcc5f444303caf1541ca591f5a2af2ea36c2c554dbe2dde52a7fd8d6d7edb
arenzero

付属データと名称が微妙に違うのうっとうしくないですか? あとデータ中での名称も微妙に違う… 役に立つかもってことで付属データと一致してるdict置いときます.

pair = [("所在地コード","市区町村コード"),("建蔽率","建ぺい率(%)"),("容積率","容積率(%)"),("駅名","最寄駅:名称"), ("地積","面積(㎡)"),("市区町村名","市区町村名"),('前面道路の幅員','前面道路:幅員(m)'), ("前面道路の方位区分","前面道路:方位"),("前面道路区分","前面道路:種類"),("形状区分","土地の形状"), ("用途区分","都市計画")]

(discription,train)の順です.

Favicon
new user
コメントするには 新規登録 もしくは ログイン が必要です。