PysparkにID
、COMPANY
などの大文字の列があるデータフレームがあります。
これらの列名をid
company
などにしたい。要件に応じて、すべての列を基本的に小文字または大文字に変換します。
列のデータ型が同じになるようにしたいと思います。
どうすればそれができますか?
DataFrameのcolumns
フィールドを使用
df = // load
for col in df.columns:
df = df.withColumnRenamed(col, col.lower())
または、@ zero323が示唆したように:
df.toDF(*[c.lower() for c in df.columns])