Javaで単語を解析するために使用できるライブラリ

私は多くのカテゴリ(日付、年、時間、名前、句読点、電子メールなど)でそれらの単語に合った単語のタイプを発見しようとしています。私はこれを検出する独自のコードを作っていましたが、ANTLRやJavaCCのようなライブラリが見つかりました。

私がしたいことは、これらの図書館のためのタックですか?はいの場合、私は何を使うべきですか?そうでない場合は、私がこれに使うことができるものがありますか?

どのような勧告ですか? JavaCC、ANTRL、もう少しありますか?私はJavaCCがいくつかのクラスを生成しているのを見ていますが、トークン化のようにしたくないものがあります。

0
もしあなたがJythonを使うオプションを持っていれば、それを使ってNLTKを使うことができると思いますので、あなたのJavaプロジェクトでそれを使用してください。
追加された 著者 Arnab Datta,

1 答え

あなたが必要とするパーサーのパワフルさに依存します。非常に強力なもの(JavaCCやANTLRなど)が必要な場合は、それらを使用してください。

シンプルなものが必要な場合は、通常の辞書検索パーザを構築することができますJavaの式、または多分 StringTokenizer (あなたの例が非常に単純な場合)。

2
追加された
はい、私は強力な何かが必要だと思う、私は自然言語処理のためになります。私は質問の例のようなものを検出することができますか?
追加された 著者 Renato Dinhani,
はい、私は多くのNLPライブラリを勉強しましたが、私が探しているものではありません。この特定の識別は、私がやっている主要なプロセスの一部にすぎません。私はこれらの図書館が私をもっと助けてくれるはずです。
追加された 著者 Renato Dinhani,
自然言語処理は、単に日付や名前などを見つけるよりも深い話題です.NLPは、言語の要素だけでなく、言語の意味や意図と関係しています。 NLPの場合は、おそらくその問題に近づくように設計されたAPI /ライブラリを探すことになります。
追加された 著者 jefflunt,