2020年12月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 12月後半の注目論文 BEST3 を紹介させて頂きます。

1)Mapping the Space of Chemical Reactions Using Attention-Based Neural Networks
 (注意ベースのニューラルネットワークを使用した化学反応の空間のマッピング)
 https://arxiv.org/abs/2012.06051v1
2)Powerful Statistical Tests for Ordered Data
 (順序データの強力な統計的検定)
 https://doi.org/10.26434/chemrxiv.13373351.v1
3)Machine Learning of Free Energies in Chemical Compound Space Using Ensemble
 Representations:  Reaching Experimental Uncertainty for Solvation

 (アンサンブル表現を使用した化合物空間における自由エネルギーの機械学習:
 実験的溶媒和精度の達成)
 https://arxiv.org/abs/2012.09722

202012-後半 注目論文①

1)Mapping the Space of Chemical Reactions Using Attention-Based Neural Networks
 (注意ベースのニューラルネットワークを使用した化学反応の空間のマッピング)
 https://arxiv.org/abs/2012.06051v1

[エグゼクティブサマリー] 

 自然言語処理法(BERTモデル)で学習した表現は、データ駆動型の反応フィンガープリントとして、反応中心や反応剤と反応剤の分割を知らなくても反応空間をマッピングできる。分類精度は98.2%。実装あり。https://rxn4chemistry.github.io/rxnfp/

[kwh_rd100のコメント]

 トランスベースのモデルが各クラスの原子環境の特徴を学習しているので、化学的な解釈根拠を提示しつつ、注釈のない単純なテキストベースの化学反応の表現から反応クラスを高精度で推測できるのが素晴らしい。何百万もの反応を含む反応データセットにおける、効率的な最近傍探索結果の蓄積が待ち遠しい。

202012-後半 注目論文②

2)Powerful Statistical Tests for Ordered Data
 (順序データの強力な統計的検定)
 https://doi.org/10.26434/chemrxiv.13373351.v1

[エグゼクティブサマリー]

 ノイズの影響を受ける1次元の順序付けられたデータからのモデルの推論において、従来は定量化せずに視覚的にチェックしていた残差について、残差の兆候の実行の長さの分布に基づいた検定統計量の提案。シャノン情報分布を利用。実装あり。https://doi.org/10.26434/chemrxiv.13373351.v1

[kwh_rd100のコメント]

 シャノン情報分布はシフトされたガンマ分布に従うため、3つのパラメーターのみで要約でき、検定統計量がピアソンのカイ2乗検定や一般的な符号ベースの検定よりも強力であることが有り難い。例示されている、X線(SAX/WAXS)または中性子(SANS)を使用した小角および広角の溶液散乱実験の分析以外への適用結果の報告が待ち遠しい。

202012-後半 注目論文③

3)Machine Learning of Free Energies in Chemical Compound Space Using Ensemble
 Representations:  Reaching Experimental Uncertainty for Solvation

 (アンサンブル表現を使用した化合物空間における自由エネルギーの機械学習:
 実験的溶媒和精度の達成)
 https://arxiv.org/abs/2012.09722

[エグゼクティブサマリー]

 構成空間の近似サンプリングに計算効率の高いボルツマン平均を使用する表現に基づいた、自由エネルギーの機械学習アプローチにより、分子集合体の特性予測において、最先端の溶媒和モデルと同等以上の精度低計算コストの両立を実現した。116kの有機分子(QM9内の全ての力場互換分子)の溶媒和自由エネルギー予測で実証した。

[kwh_rd100のコメント]

 116kの有機分子(QM9データベース内のすべての力場互換分子)の予測される溶媒和自由エネルギーの分析を通じて示し、溶媒和が最も多いシステムと最も少ないシステムを特定し、水素の観点から準線形構造特性の関係を再発見しており、今後の展開が楽しみである。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)