テキスト分類分類ポインタ

私はさまざまなアルゴリズムを使用して文書を分類および分類するための非常に簡単なプログラムを開発しようとしています。私の問題は、初心者ですから、簡単なチュートリアルのための良い記事やウェブサイトが見つからないということです。私はかなりのリソースを読んでいると私は多くのことを学んだが、各ドキュメント、サイトなどは、私はそれが異なる方法を問題を分析し、異なる手法を使用して読んで、私は混乱しているので、実際の実装を開始するために私に指摘できる良いリソースはありますか?

また、実際のテストデータを探しています。具体的には分類されているドキュメントを探していますので、アルゴリズムを「フィード」することができます。どんな助けもありがたい。ありがとう。

0
あなたがJavaでプログラミングしているなら、このあなたの質問はあなたにとって良い助けになるでしょう
追加された 著者 GETah,

1 答え

Pythonについては、テキスト分類に関するscikit-learnチュートリアルを参照してください。 。実行するデモスクリプトも参照してください。 20のニュースグループのベンチマークで、数多くの異なるテキスト分類アルゴリズム(Naive BayesとSVMを含む)データセット。 [免責事項:私はこれらのことを共に書いた。]

Wekaについては、チュートリアルをご覧ください。

1
追加された
ありがとう、私は現在、データセットを探していますが、それはかなり便利ですが、私はJavaのプログラムは、Pythonの例は非常に混乱しているようです。またWEKAの場合は前に試しましたが、実際には適切な文書はありません。 WEKAのチュートリアルはあまり意味がありません。他のJavaメソッドやそのポインタを知っていますか?お返事ありがとうございます。
追加された 著者 skay-,