単純なCSVからXMLへの変換-Python

Question

CSVからXMLへの変換を自動化する方法を探しています。

映画のリストを含むCSVファイルの例を次に示します。

XML形式のファイルは次のとおりです。

<collection shelf="New Arrivals"> <movietitle="Enemy Behind"> <type>War, Thriller</type> <format>DVD</format> <year>2003</year> <rating>PG</rating> <stars>10</stars> <description>Talk about a US-Japan war</description> </movie> <movietitle="Transformers"> <type>Anime, Science Fiction</type> <format>DVD</format> <year>1989</year> <rating>R</rating> <stars>8</stars> <description>A schientific fiction</description> </movie> <movietitle="Trigun"> <type>Anime, Action</type> <format>DVD</format> <episodes>4</episodes> <rating>PG</rating> <stars>10</stars> <description>Vash the Stampede!</description> </movie> <movietitle="Ishtar"> <type>Comedy</type> <format>VHS</format> <rating>PG</rating> <stars>2</stars> <description>Viewable boredom</description> </movie> </collection>

私はいくつかの例を試しましたが、Python DOMおよびSAXを使用してcsvおよびXML形式を読み取ることができますが、変換の簡単な例を見つけるために今のところ私は持っています。

import csv f = open('movies2.csv') csv_f = csv.reader(f) def convert_row(row): return """<movietitle="%s"> <type>%s</type> <format>%s</format> <year>%s</year> <rating>%s</rating> <stars>%s</stars> <description>%s</description> </movie>""" % ( row.Title, row.Type, row.Format, row.Year, row.Rating, row.Stars, row.Description) print ('
'.join(csv_f.apply(convert_row, axis=1)))

しかし、私はエラーが出ます：

 File "moviesxml.py", line 16, in module print ('
'.join(csv_f.apply(convert_row, axis=1))) AttributeError: '_csv.reader' object has no attribute 'apply'

私はPythonにかなり慣れていないので、どんな助けでも大歓迎です！

私はPython 3.5.2。を使用しています。

ありがとう！

リサ

robertoia · Accepted Answer

可能な解決策は、最初にcsvをPandasにロードしてから、行ごとにXMLに変換することです。

import pandas as pd df = pd.read_csv('untitled.txt', sep='|')

以下のようにロードされたサンプルデータ（セパレータなどを想定）を使用します。

 Title Type Format Year Rating Stars \ 0 Enemy Behind War,Thriller DVD 2003 PG 10 1 Transformers Anime,Science Fiction DVD 1989 R 9 Description 0 Talk about... 1 A Schientific fiction

次に、カスタム関数を使用してxmlに変換します。

def convert_row(row): return """<movietitle="%s"> <type>%s</type> <format>%s</format> <year>%s</year> <rating>%s</rating> <stars>%s</stars> <description>%s</description> </movie>""" % ( row.Title, row.Type, row.Format, row.Year, row.Rating, row.Stars, row.Description) print '
'.join(df.apply(convert_row, axis=1))

このようにして、xmlを含む文字列を取得します。

<movietitle="Enemy Behind"> <type>War,Thriller</type> <format>DVD</format> <year>2003</year> <rating>PG</rating> <stars>10</stars> <description>Talk about...</description> </movie> <movietitle="Transformers"> <type>Anime,Science Fiction</type> <format>DVD</format> <year>1989</year> <rating>R</rating> <stars>9</stars> <description>A Schientific fiction</description> </movie>

ファイルなどにダンプできます。

この素晴らしい答えですに触発されました

編集：投稿した読み込み方法（または実際にデータを変数に読み込むバージョン）を使用します。

import csv f = open('movies2.csv') csv_f = csv.reader(f) data = [] for row in csv_f: data.append(row) f.close() print data[1:]

我々が得る：

[['Enemy Behind', 'War', 'Thriller', 'DVD', '2003', 'PG', '10', 'Talk about...'], ['Transformers', 'Anime', 'Science Fiction', 'DVD', '1989', 'R', '9', 'A Schientific fiction']]

そして、少し変更してXMLに変換できます。

def convert_row(row): return """<movietitle="%s"> <type>%s</type> <format>%s</format> <year>%s</year> <rating>%s</rating> <stars>%s</stars> <description>%s</description> </movie>""" % (row[0], row[1], row[2], row[3], row[4], row[5], row[6]) print '
'.join([convert_row(row) for row in data[1:]])

同じ結果を得る：

<movietitle="Enemy Behind"> <type>War</type> <format>Thriller</format> <year>DVD</year> <rating>2003</rating> <stars>PG</stars> <description>10</description> </movie> <movietitle="Transformers"> <type>Anime</type> <format>Science Fiction</format> <year>DVD</year> <rating>1989</rating> <stars>R</stars> <description>9</description> </movie>