web-dev-qa-db-ja.com

matplotlib:欠損データを無視してポイント間に線を描画

折れ線グラフとしてプロットしたいデータのセットがあります。シリーズごとに、一部のデータが欠落しています(ただし、シリーズごとに異なります)。現在、matplotlibは、欠落データをスキップする線を描画しません。たとえば、

import matplotlib.pyplot as plt

xs = range(8)
series1 = [1, 3, 3, None, None, 5, 8, 9]
series2 = [2, None, 5, None, 4, None, 3, 2]

plt.plot(xs, series1, linestyle='-', marker='o')
plt.plot(xs, series2, linestyle='-', marker='o')

plt.show()

線にギャップのあるプロットになります。 matplotlibにギャップを介して線を引くように指示するにはどうすればよいですか? (データを補間する必要はありません)。

50
gravenimage

この方法でNaN値をマスクできます。

import numpy as np
import matplotlib.pyplot as plt

xs = np.arange(8)
series1 = np.array([1, 3, 3, None, None, 5, 8, 9]).astype(np.double)
s1mask = np.isfinite(series1)
series2 = np.array([2, None, 5, None, 4, None, 3, 2]).astype(np.double)
s2mask = np.isfinite(series2)

plt.plot(xs[s1mask], series1[s1mask], linestyle='-', marker='o')
plt.plot(xs[s2mask], series2[s2mask], linestyle='-', marker='o')

plt.show()

これはにつながります

Plot

70
Thorsten Kranz

@Rutger KassiesのQouting( link ):

Matplotlibは、連続した(有効な)データポイント間にのみ線を引き、NaN値にギャップを残します。

Pandasを使用している場合の解決策:

#pd.Series 
s.dropna().plot() #masking (as @Thorsten Kranz suggestion)

#pd.DataFrame
df['a_col_ffill'] = df['a_col'].ffill(method='ffill')
df['b_col_ffill'] = df['b_col'].ffill(method='ffill')  # changed from a to b
df[['a_col_ffill','b_col_ffill']].plot()
5

補間なしでは、データからNoneを削除する必要があります。これは、系列のNoneに対応するX値を削除する必要があることも意味します。これを行うための(ugい)ライナーが1つあります。

  x1Clean,series1Clean = Zip(* filter( lambda x: x[1] is not None , Zip(xs,series1) ))

ラムダ関数は、None値に対してFalseを返し、リストからx、seriesのペアをフィルタリングしてから、データを元の形式に再圧縮します。

2
Adam Cadien

パンダのソリューション:

import matplotlib.pyplot as plt
import pandas as pd

def splitSerToArr(ser):
    return [ser.index, ser.as_matrix()]


xs = range(8)
series1 = [1, 3, 3, None, None, 5, 8, 9]
series2 = [2, None, 5, None, 4, None, 3, 2]

s1 = pd.Series(series1, index=xs)
s2 = pd.Series(series2, index=xs)

plt.plot( *splitSerToArr(s1.dropna()), linestyle='-', marker='o')
plt.plot( *splitSerToArr(s2.dropna()), linestyle='-', marker='o')

plt.show()

splitSerToArr関数は、パンダでプロットするときに非常に便利です。これは出力です: enter image description here

2
Markus Dutschke

価値があるかもしれないものについては、試行錯誤の末、Thorstenのソリューションに明確化を加えたいと思います。このアプローチを試した後、他の場所を見たユーザーの時間を節約できれば幸いです。

使用中に同じ問題で成功することができませんでした

from pyplot import *

でプロットしよう

plot(abscissa[mask],ordinate[mask])

import matplotlib.pyplot as pltを使用して適切なNaNを処理する必要があるように見えましたが、その理由はわかりません。

1
JimP