web-dev-qa-db-ja.com

自然言語処理のチュートリアル

最近 coursera についてのクラス「自然言語処理」に参加しましたが、構文解析、IR、およびQ&Aなどのその他の興味深い側面について多くのことを学びました。それに関する実践的な知識。自然言語処理に関する優れたオンラインチュートリアルや書籍を誰かが私に提案できますか?

ありがとう

24
Dude

JurafskyとMartinの Speech and Language Processing(2008 edition) を読むことができます。これは、この分野の標準的な教科書です。それは長く、さまざまなトピックがあるので、あなたの興味に本当に当てはまる章だけを読むことをお勧めします。

さらに、学習する最良の方法は、ほぼ間違いなく、実際にNLPアルゴリズムを最初から実装することです。いくつかの標準的なタスク(言語モデリング、テキスト分類、POSタグ付け、NER、解析)を選択し、さまざまなアルゴリズム(ngramモデル、HMM、Naive Bayes、MaxEnt、CKY)を一から実装して、それらが機能する仕組みを実際に理解できます。また、実装をテストするための無料のデータセットを見つけることも難しくありません。

最後に、優れた特定のNLPアルゴリズムのチュートリアルはたくさんあります。たとえば、HMMを構築する場合は、 Jason Eisnerのチュートリアル をお勧めします。これには、EMを使用した平滑化および教師なしトレーニングも含まれます。教師なしのナイーブベイズトレーニングにギブスサンプリングを実装する場合は、 Philip Resnikのチュートリアル をお勧めします。

34
dhg

ジュラフスキーとマーティンの本の他に、クリストファー・D・マニングとヒンリッヒ・シュッツェの 統計的自然言語処理の基礎 も広く使用されています。 IRについては、Manningら。 Introduction to Information Retrieval も書いており、サイトでオンラインで読んだりダウンロードしたりできます。

9
Kenston Choi

自然言語にどのように取り組むことができるかについての実践的な知識が必要な場合は、それを実装する必要があります。 PythonでNLTK(Natural Language Proecessing Toolkit)を使用することをお勧めします。 PythonでNLPを実装するのは簡単です。

このリンクを参照できます http://nltk.org/

または、オンラインで試すこともできます http://cst.dk/online/pos_tagger/uk/

7
Gunjan

特定の本を読む代わりに、紙の海に飛び込むのも良い考えかもしれません。 http://www.aclweb.org 、たとえば、NLPに関する多くのトピックが含まれています。それらの論文を通じて、より多くの論文への参照を得ることができます。そのうちのいくつかは、NLPの特定のブランチの基礎です。そして、それらは異なる著者によって書かれたので、あなたはある観点からあまり影響を受けないでしょう。

1
Kun Wu

あなたがJava開発者である場合、LingPipeを使用してNLPシステムのコンポーネントを構築する方法のチュートリアルの広範なリストが http://alias-i.com/lingpipe/demosにあります。 /tutorial/read-me.html 。完全な開示私はそれらのチュートリアルのいくつかと以下の本の1つを書きました。

より産業指向の本がいくつかあります。

1)Javaによる自然言語処理、Richard M Reese著

これは、さまざまなオープンソースツールキット(LingPipeを含む)でいくつかの一般的なタスクを実行する方法をカバーしています。

2)JavaおよびLingPipeクックブックを使用した自然言語処理(英語)ペーパーバック:Breck Baldwin、Krishna Dayanidhi

この本は、「コンポーネントを構築する」レベルでタスク駆動であり、テキスト駆動のほとんどのNLPシステムを駆動する主要なテクノロジーをカバーしています。翻訳は対象外です。最初の本よりも詳細に説明されており、LingPipeチュートリアルよりも広い範囲をカバーしていますが、チュートリアルよりも詳細が少ない場合があります。

ブレック

1
Breck Baldwin

TeLeMaCo と呼ばれる教材のハブがあります。 NLPのさまざまな側面に関するリソースを見つけることができ、Webで見つけた資料を簡単に追加できます。