pythonで株価情報取得アプリを作成する方法

Question

私はPythonでプログラミングするのが初めてです。

グーグルファイナンスから株価を取得するアプリケーションを作りたいです。 1つの例はCSCO（Cisco Sytems）です。次に、そのデータを使用して在庫が特定の値に達したときにユーザーに警告します。また、30秒ごとに更新する必要があります。

問題は、データを取得する方法がわからないことです。

誰かアイデアはありますか？

Ben Hoffstein · Accepted Answer

このモジュールは Corey Goldberg の厚意により提供されています。

プログラム：

import urllib import re def get_quote(symbol): base_url = 'http://finance.google.com/finance?q=' content = urllib.urlopen(base_url + symbol).read() m = re.search('id="ref_694653_l".*?>(.*?)<', content) if m: quote = m.group(1) else: quote = 'no quote available for: ' + symbol return quote

使用例：

import stockquote print stockquote.get_quote('goog')

Update：正規表現を変更して、Google Financeの最新の形式（2011年2月23日現在）に一致させます。これは、画面のスクレイピングに依存する場合の主な問題を示しています。

hongtao · Answer

現在（2015）については、Google Finance APIは非推奨になっています。ただし、pypiモジュール googlefinance を使用できます。

Googlefinanceをインストールする

$pip install googlefinance

現在の株価を取得するのは簡単です：

>>> from googlefinance import getQuotes >>> import json >>> print json.dumps(getQuotes('AAPL'), indent=2) [ { "Index": "NASDAQ", "LastTradeWithCurrency": "129.09", "LastTradeDateTime": "2015-03-02T16:04:29Z", "LastTradePrice": "129.09", "Yield": "1.46", "LastTradeTime": "4:04PM EST", "LastTradeDateTimeLong": "Mar 2, 4:04PM EST", "Dividend": "0.47", "StockSymbol": "AAPL", "ID": "22144" } ]

Googleファイナンスは、リアルタイムの株価データを提供するソースです。 yahoo-finance など、yahooの他のAPIもありますが、NYSEおよびNASDAQ株式の場合、15分遅れます。

Peter Party Bus · Answer

import urllib import re def get_quote(symbol): base_url = 'http://finance.google.com/finance?q=' content = urllib.urlopen(base_url + symbol).read() m = re.search('id="ref_(.*?)">(.*?)<', content) if m: quote = m.group(2) else: quote = 'no quote available for: ' + symbol return quote

Ref _（。*？）を使用してm.group（2）を使用すると、参照IDが在庫から在庫に変更されるため、より良い結果が得られることがわかりました。

Chad Skeeters · Answer

HTMLParserを使用して、Googleがhtmlに配置したメタタグの値を取得することをお勧めします

<meta itemprop="name" content="Cerner Corporation" /> <meta itemprop="url" content="https://www.google.com/finance?cid=92421" /> <meta itemprop="imageUrl" content="https://www.google.com/finance/chart?cht=g&q=NASDAQ:CERN&tkr=1&p=1d&enddatetime=2014-04-09T12:47:31Z" /> <meta itemprop="tickerSymbol" content="CERN" /> <meta itemprop="exchange" content="NASDAQ" /> <meta itemprop="exchangeTimezone" content="America/New_York" /> <meta itemprop="price" content="54.66" /> <meta itemprop="priceChange" content="+0.36" /> <meta itemprop="priceChangePercent" content="0.66" /> <meta itemprop="quoteTime" content="2014-04-09T12:47:31Z" /> <meta itemprop="dataSource" content="NASDAQ real-time data" /> <meta itemprop="dataSourceDisclaimerUrl" content="//www.google.com/help/stock_disclaimer.html#realtime" /> <meta itemprop="priceCurrency" content="USD" />

このようなコードで：

import urllib try: from html.parser import HTMLParser except: from HTMLParser import HTMLParser class QuoteData: pass class GoogleFinanceParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) self.quote = QuoteData() self.quote.price = -1 def handle_starttag(self, tag, attrs): if tag == "meta": last_itemprop = "" for attr, value in attrs: if attr == "itemprop": last_itemprop = value if attr == "content" and last_itemprop == "name": self.quote.name = value if attr == "content" and last_itemprop == "price": self.quote.price = value if attr == "content" and last_itemprop == "priceCurrency": self.quote.priceCurrency = value if attr == "content" and last_itemprop == "priceChange": self.quote.priceChange = value if attr == "content" and last_itemprop == "priceChangePercent": self.quote.priceChangePercent = value if attr == "content" and last_itemprop == "quoteTime": self.quote.quoteTime = value if attr == "content" and last_itemprop == "exchange": self.quote.exchange = value if attr == "content" and last_itemprop == "exchangeTimezone": self.quote.exchangeTimezone = value def getquote(symbol): url = "http://finance.google.com/finance?q=%s" % symbol content = urllib.urlopen(url).read() gfp = GoogleFinanceParser() gfp.feed(content) return gfp.quote; quote = getquote('CSCO') print quote.name, quote.price

phkahler · Answer

Yahooからデータを取得したい場合に備えて...簡単な関数を次に示します。これは、通常のページからデータを削り取りません。コメントでこれを説明しているページへのリンクがあると思っていましたが、今は表示されません。特定のフィールドを要求するためにURLにマジックストリングが追加されています。

import urllib as u import string symbols = 'AMD ibm gm kft'.split() def get_data(): data = [] url = 'http://finance.yahoo.com/d/quotes.csv?s=' for s in symbols: url += s+"+" url = url[0:-1] url += "&f=sb3b2l1l" f = u.urlopen(url,proxies = {}) rows = f.readlines() for r in rows: values = [x for x in r.split(',')] symbol = values[0][1:-1] bid = string.atof(values[1]) ask = string.atof(values[2]) last = string.atof(values[3]) data.append([symbol,bid,ask,last,values[4]]) return data

ここで、魔法の文字列を説明するリンクを見つけました： http://cliffngan.net/a/1

Andreas Jung · Answer

http://docs.python.org/library/urllib.html 任意のURLを取得します。

それとは別に、JSON形式でデータを提供するいくつかのWebサービスをよりよく見る必要があります。

それ以外の場合は、独自に解析などを実装する必要があります。

Yahoo.comで株を入手するためにスクリーンスクラップすることは、成功への正しい道とは思えません。

Bill the Lizard · Answer

最初に Google Finance APIs を見てください。ただし、Python APIまたはラッパーは表示されません。データに直接アクセスするための唯一のオプションはJavaおよびJavaScriptのようです。また、 cURL を使い慣れていて、システムで使用できる場合は、それを使用することもできます。

Ryan Castillo · Answer

開始するもう1つの良い場所は、Googleファイナンス独自のAPIです： http://code.google.com/apis/finance/ ファイナンスいくつかのサンプルコードについては、ガジェット。