web-dev-qa-db-ja.com

Python:文字列(科学表記法)を浮動小数点に変換します

Numpyでgenfromtxtを使用して、テキストと数字を含む大きな.csvファイルをインポートしようとしています。興味があるのは2列だけです。ほとんどのインポートは次のように整理されています。

def importfile(root):
    data = root.entry.get()
    atw = np.genfromtxt(data, delimiter=",",
                        skip_header=1,
                        skip_footer=2,
                        autostrip=True,
                        usecols=(25,26),
                        dtype=("|S10"))
    elem = atw[:,0]
    concs = atw[:,1]

    print(elem)
    print(concs)

それぞれelemとconcsの出力:

['Na2O' 'MgO' 'Al2O3' 'SiO2' 'P2O5' 'SO3' 'Cl' 'K2O' 'CaO' 'TiO2' 'Cr2O3'
'MnO' 'FeO' 'NiO' 'Cu2O' 'ZnO' 'Ga2O3' 'SrO' 'Y2O3']

['3.76E+00' '1.31E+01' '1.14E+01' '4.04E+01' '1.24E+00' '5.89E-02'
'2.43E-02' '1.53E+00' '1.49E+01' '2.87E+00' '6.05E-02' '1.96E-01'
'1.17E+01' '3.69E-02' '8.73E-03' '1.39E-02' '1.93E-03' '1.88E-01'
'5.58E-03']

Concs文字列をfloatに変換するためにさまざまな方法を試しましたが、concsが科学表記法であるという事実が気に入らないようです。concs値をfloatに変換する方法はありますか?ご支援いただきありがとうございます。

16
Dr. Toboggan

float関数はこれを行うことができます:

>>> float('1.31E+01')
13.1

またはリストの場合:

>>> map(float, ['3.76E+00', '1.31E+01', '1.14E+01'])
[3.76, 13.1, 11.4]
17
RichieHindle
 with open( datafile,'r' ) as inData:
     for line in inData:
          j = list( map( float,   filter( None  , [ x for x in line.strip().split(',') ] )) )

このページに私をもたらした同様の問題を解決するので、ちょうど一般的に述べました。

0
mist42nz

多分それは誰にとっても役立つでしょう、私は同様の問題を抱えており、カンマをドットで置き換えることを含むDataFrame列にpandas to_numericを適用することについてstackoverflowで見つけました

import re
import pandas as pd
atw[cc] = pd.to_numeric(atw[cc].apply(lambda x: re.sub(',', '.', str(x))))
0
Yury Wallet