Androidで音声から音声成分を検出するにはどうすればよいですか?

リアルタイムでオーディオストリームの音声部分を検出する簡単な方法は何ですか?私はMFCC、FFTなどを使用することについて悩みました。しかし、私はそれがどのように行われるべきかの明確な説明を見つけることができませんでした。

さらに、wavファイルを分析してそこに存在する人間の発話の存在を検出できるPCプログラムがありますか?

0
私はスピーチを認識する必要はありません - 私はスピーチ/ nponスピーチとしてそれを分類する必要があります
追加された 著者 Dony George,

1 答え

このトピックは非常に複雑です...;簡単な解決方法や明確な説明はありません。既存の技法およびアルゴリズムが多数存在する。現代の技術には、FFTやケプストラム解析などの些細なDSPアルゴリズムだけでなく、人工知能と機械学習アルゴリズムも含まれます。しかし、Sphinx-4はJavaで書かれているので、自然にクロスプラットフォームなのです。

http://cmusphinx.sourceforge.net/sphinx4/

私はそれを試していないので、使いやすさについては何も言い表せませんが、最高のアルゴリズムが特許を取得し、実際には本当に高価であることを確認してください...

2
追加された