Luceneによる品詞タグ付け

私はチャットアプリケーションの感情認識システムを構築しています。その中核部分は、ユーザが入力したテキスト内の動詞を見つけることであり、これは品詞タグ付け者で行うことができる。 Luceneで品詞タグを作成することは可能ですか?そうでない場合は、私が使える良いオープンソース/フリーソフトウェアパッケージやシステムは何ですか?

1
動詞を見つけることは、セマンティックロールラベリング(SRL)ではなく、品詞(POS)タグ付けと呼ばれます。 SRLは、セマンティック述語(これは動詞である必要はない)の引数の型を検出することに関するものです。 POSタガーやSRLシステムが感情認識に役立てるために何をすると思いますかはっきりしません。最後に、「Luceneでこのようなシステムを構築する」ということはどういう意味ですか? Luceneを使用して構築しますか?結果をLuceneにフィードしますか?
追加された 著者 jogojapan,
あなたのコメント@ jogojapanに応じて編集されました。
追加された 著者 dmh,

1 答え

Luceneから、あなたはおそらくMahoutを使いたいでしょう。私は、Lucoutの感情分析のためにMahoutのBayes分類器を使用しました。これはかなりうまく機能し、設定が比較的簡単でした。私は、Mahout + Luceneと他の何かの大きな利点は、それがより良くスケールすることだと思います。

あなたがMahoutが気に入らなければ、これを行うためのオープンソースのフレームワークがたくさんあります。私はNLTKが非常にユーザーフレンドリーであることを発見しました。しかし、Luceneとうまく統合されているとは思えません。

0
追加された