化学は機械学習を必要としますか?

多くの科学分野(例えば、生物学、医学、心理学、統計学、物理学)において、機械学習および人工知能技術は、データを分析するためにますます普及しつつある。化学でもそうですか?

22
@chrishmorrisようこそChemistry.SEへ!このサイトをよく知るには、ツアー​​をご覧ください。私はあなたの答えをコメントに変換しました。なぜなら、この状態では、このサイトの哲学に本当に適合しないからです。
追加された 著者 Martin - マーチン,
chemistryworld.com には、化学における機械学習に関する素敵な記事があります。
追加された 著者 Big Crank,
ここでの主な課題は、化学における大規模な公開データセットの不足です。データを取得することができれば、機械学習のテクニックがよく働きます。
追加された 著者 chrishmorris,

4 答え

短い答えは「はい」です。機械学習、データマイニング、AIなどの技術は化学に非常に役立ちます。

私は、機械学習、エキスパートシステム、化学における統計分析の多くが長い間遡ったフレッドの答えに完全に同意します。これは、分析化学において特に真実であり、既知の化合物のライブラリーに対して質量分析またはNMRまたはIRを適合させる。

今私はあなたのタグ "計算化学"を見て、ここにいくつかの新しいアプリケーションがあります。基本的には、量子力学を通常必要とする性質(例えば、生成熱、双極子モーメントなど)を予測できるかどうかということです。

いくつかのグループがこれを試していますが、これまでに成功した試みの1つは、 Anatole von Lilienfeld をご覧ください。

研究者らは、5000分子以上の景観では、新しい分子の噴霧エネルギーを予測する誤差がハイブリッドDFTの5kcal/mol精度に近づく10kcal/mol以下に低下することを発見しました。 「ハイブリッドDFTを使用して分子の噴霧エネルギーを計算すると、1つのCPUで平均1時間かかります」とvon Lilienfeld氏は述べています。 '機械学習では、ミリ秒です。'

力場、半経験的量子力学などをパラメータ化するために、機械学習、進化アルゴリズムなどを使用する従来の方法がある。

基本的に、データが大量にある場合、機械学習のテクニックは、データを分析して他の目的に使用する有効な方法です。

22
追加された

はい。化学ではまったく新しいことではありません。 40年以上前の化学AIアプリケーションに関する論文を見つけることができます。

迅速に処理する必要がある大量のデータがあります。例えば、HPLCのダイオードアレイ検出器は、数百の波長で1分間に多数のスペクトルを収集することができ、そのデータを使用して、カラムから流出する2つの密接に溶出する化合物を区別し、場合によっては同定する必要があります。知的で自動化されたデータ分析とパターン認識が必須です。多くの「人工鼻」センサには同様の要件があります。彼らは "これらのジャガイモは乾いた腐敗に感染していますか?"のような質問に答えるために神経網を使うことができます。また、分析化学のさまざまな分野でエキスパートシステムを使用しています。

Hugh Cartwrightの素敵な概要があります:

Using Artificial Intelligence in Chemistry and Biology: A Practical Guide (CRC Press)

Applications of Artificial Intelligence in Chemistry (Oxford University Press)

Development and Uses of Artificial Intelligence in Chemistry (Reviews in Computational Chemistry, Volume 25, Wiley)

13
追加された

化学で人工知能を使用しないと、化学は唯一の分野であり、それを使用することはありません。 しかし、真実は、多くの人工知能が、化学においてすでに使用されていることがわかっていなくても、すでに消滅しているということです。

人工知能は、化学におけるほとんどすべての問題を解決することができます。

An interesting article for this can be found in wikipedia https://en.wikipedia.org/wiki/Artificial_intelligence_in_chemistry

多くの化学者は、人工知能は難しいと考えていますが、実際は非常に簡単です。基本的なコンピュータ知識を持つ化学者は、6〜7日でそれを学び、何百万もの方法で化学に配備することができます。

人工知能のアプリケーションはWileyによって開発されました。これはchemplannerと呼ばれるソフトウェアです。これは、人間が数秒で考えることができる世界のあらゆる有機分子を合成することができます。世界。 したがって、この人工知能ソフトウェアの助けを借りれば、世界のあらゆる有機分子を合成することができます。

5
追加された
非常に純粋な分析。 AIは車であると考えてください。あなたが働く車を与えられたら、数日後にそれを運転することを学ぶことができます。しかし、あなたが車を作る必要があるならば、それははるかに難しい命題です。また、ほとんどのAIには厄介な隠し機能があります。 AIは決定を下しますが、人間がその決定がなぜ行われたのかを理解できるようにその決定を説明することはさらに困難な問題です。
追加された 著者 4dgaurav,

私はこのパーティーに少し遅れていることを知っていますが、ここ数年、機械学習を化学に応用するには、潜在的に非常に重要な開発がありました。どちらも分子動力学に適用されます。

第1に、潜在的に明白な観察の1つは、分子動力学シミュレーションを実行する場合、使用される時間ステップが有意義な特性を計算するのに十分小さいと仮定すると、各時間ステップが前の時間ステップと高度に相関するということである。これらの時間ステップのいくつかを訓練フェーズとして使用した後、後続の時間ステップを極めて迅速に最小限の精度でシミュレートすることができるため、機械学習にとっては完璧な状況です。このアイデアとその分子動力学への応用については、参考文献を参照してください。 [1]。これは、機械学習を巧みに使いこなすことを意味するので、これは巨大であり、以前よりもはるかに長い時間スケールでMDが可能である可能性があります。

興味深い点として、MDシミュレーションはしばしば異常な、しかしおそらく重要な構成がサンプリングされるために行われることが重要な点です。これは、機械学習がオフになり、珍しい構成から再び学習を開始できるように、いわゆる決定エンジンを実装しなければならないことを意味する。これは、参考文献にも記載されています。 [1]。

第2の重要な発展は、MDシミュレーションで非常に一般的に使用される分子力場の構築にあります。これらの力場の目的は、Schrodinger方程式を近似的に解くよりもはるかに高速であることです。機械学習から開発されたフォースフィールドは、通常の力場が直面する2つの問題を潜在的に解決する。第一に、通常の力場は、それらが開発された非常に特定の状況においてのみ有効である。主に、それらは構築された機能的な形式によって制限されています。機械学習には訓練セットが必要であるという問題もあるが、機械学習力フィールドは適応性があり、以前に遭遇しなかった構成を訪問したときにより堅牢になることができる。第二に、機械学習力場は、ゼロから完全に開始することなく、新しい原子および分子タイプに拡張することができる。結局のところ、同じ物理法則が異なる要素に適用されるので、力場は、これらの同じ法則がどのように異なる要素に適用されるかをおおよそ学ぶ必要があります。基本的には、ゼロから開始するよりも高速です。このような考察は、参考文献で見つけることができる。 [2]。

私はまた、機械学習がQM法を用いた反復回数が少なくて済む最適化された幾何学的形状の推測を提供する方法として、ある時点で論文を見てきました。また、私は大規模な水クラスタのような複雑な潜在的なエネルギー面で新しい最小値を見つけるための機械学習の使用に関する論文を見てきたと思います。これは最適化ポイントに関連しています。

基本的に、可能性は無限です。


[1] Botu, V., & Ramprasad, R. (2015). Adaptive machine learning framework to accelerate ab initio molecular dynamics. International Journal of Quantum Chemistry, 115(16), 1074-1083.

[2] Botu, V., Batra, R., Chapman, J., & Ramprasad, R. (2016). Machine learning force fields: construction, validation, and outlook. The Journal of Physical Chemistry C, 121(1), 511-522.

4
追加された