2020年08月前半 kwh_rd100の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 08月前半の注目論文 BEST3 を紹介させて頂きます。

1)Machine Learning Meets Mechanistic Modelling for Accurate Prediction of 
Experimental Activation Energies

(機械学習が機械的モデリングと出会い、実験的な活性化エネルギーを正確に予測)
https://doi.org/10.26434/chemrxiv.12758498.v1
2)GraSeq: Graph and Sequence Fusion Learning forMolecular Property Prediction
(GraSeq:分子特性予測のためのグラフと配列の融合学習)
http://www.meng-jiang.com/pubs/graseq-cikm20/graseq-cikm20-paper.pdf
3)A Bayesian Inference Framework for Compression and Prediction ofQuantum States
(量子状態の圧縮と予測のためのベイズ推定フレームワーク)
https://arxiv.org/abs/2008.03595

202008-前半 注目論文①

1)Machine Learning Meets Mechanistic Modelling for Accurate Prediction of 
Experimental Activation Energies

(機械学習が機械的モデリングと出会い、実験的な活性化エネルギーを正確に予測)

[エグゼクティブサマリー]

 求核芳香族置換(SNAr)反応のために、反応物と生成物の従来の物理的な有機的特徴に加えて、遷移状態の特徴を取り入れた機械学習モデルを作成。選択ガウス過程回帰モデルは、外部試験セットにおいて平均絶対誤差0.77kcal/molを、特許反応データを用いた反応予測において86%の正解率を、それぞれ達成した。

[kwh_rd100のコメント]

 密度汎関数理論を用いた遷移状態モデリングではまだ困難な反応予測を高精度で実現していることが素晴らしい。更に、この反応予測は、比較的少ないデータ数(50~150)のときに最も高精度(データ数150以上では従来QSAR法と同等もしくは同等以下)になることから、実務的な効果も大きい。

202008-前半 注目論文②

2)GraSeq: Graph and Sequence Fusion Learning forMolecular Property Prediction
(GraSeq:分子特性予測のためのグラフと配列の融合学習)
http://www.meng-jiang.com/pubs/graseq-cikm20/graseq-cikm20-paper.pdf

[エグゼクティブサマリー]

 分子特性予測のためのジョイントグラフ・配列表現学習モデルGraSeqの提案。2種類の入力(分子グラフとSMILES文字列)からそれぞれ抽出した情報を、グラフニューラルネットワークリカレントニューラルネットを相補的な組合せによってモデル化し、教師なし学習のマルチタスクロスを利用した学習により、高精度を実現した。

[kwh_rd100のコメント] 

 SMILES表記分子グラフは有望な結果を得ているが、分子特性(原子クラスターや化学結合など)を保持したまま、両者の機能を相補的に統合して改善を図ることに真正面から取り組み、成功した事例。限られたサイズのラベル付きデータセットを用いて、化学物質の再構成や様々な作業を行い、高精度を実現しており興味深い。実装の公開が待ち遠しい。

202008-前半 注目論文③

3)A Bayesian Inference Framework for Compression and Prediction of Quantum States
(量子状態の圧縮と予測のためのベイズ推定フレームワーク)
https://arxiv.org/abs/2008.03595

[エグゼクティブサマリー]

 基底選択の限界尤度を最適化すると、モデルの追加の相互検証を必要とせず、モデルのスパース性と精度のバランスがとれた表現が得られるので、与えられた波動関数データをコンパクトでありながら非常に表現力豊かなガウスプロセス状態(GPS)モデルに圧縮できる。

[kwh_rd100のコメント] 

 教師あり学習スキームを適用して、ターゲット状態の特定のデータからガウスプロセス状態(GPS)の形で相関する多体状態のコンパクトで正確な表現を学習する方法の概要を提示しており、魅力的である。このガウスプロセス状態(GPS)のコンパクトで解釈可能な関数形式は、限られた観測データ、高い励起状態の検出などの問題にも適用可能であり、今後の実用展開が楽しみである。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)