2020年09月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 09月後半の注目論文 BEST3 を紹介させて頂きます。

1)Transfer Learning as Tool to Enhance Predictions of Molecular Properties Based on 2D Projections
(2D投影に基づく分子特性の予測を強化するツールとしての転移学習)
https://onlinelibrary.wiley.com/doi/full/10.1002/adts.202000148

2)Chemical Property Prediction Under Experimental Biases
(実験的バイアスの下での化学的性質の予測)
https://arxiv.org/abs/2009.08687

3)Electron-Passing Neural Networks for Atomic Charge Prediction in Systems with Arbitrary Molecular Charge
(任意の分子電荷を持つシステムにおける原子電荷予測のための電子通過ニューラルネットワーク)
https://doi.org/10.26434/chemrxiv.12980150.v1

202009-後半 注目論文①

1)Transfer Learning as Tool to Enhance Predictions of Molecular Properties Based on 2D Projections
(2D投影に基づく分子特性の予測を強化するツールとしての転移学習)
https://onlinelibrary.wiley.com/doi/full/10.1002/adts.202000148

[エグゼクティブサマリー]

 有機化合物の水溶性の予測において、転移学習CNNと分子の2D画像との組み合わせにおいて、視覚的な化学的特徴(ドメイン知識)に基づいてトレーニングした単純なDNN(パラメーター計33)が、計算時間と予測精度が大幅な性能向上する。

[kwh_rd100のコメント]

 化学者に馴染み深い分子の2D画像が、機械学習タスクで直接使用できることを実証した意義は大きい。転移学習と2D分子表現の組み合わせに、専門家のドメイン知識を注入(≒トレーニング)により大幅な性能向上を実現している。よって、ドメイン知識の反映方法を更なる工夫などにより、高度なグラフベースと同等以上の精度を実現する日が待ち遠しい。

202009-後半 注目論文②

2)Chemical Property Prediction Under Experimental Biases
(実験的バイアスの下での化学的性質の予測)
https://arxiv.org/abs/2009.08687

[エグゼクティブサマリー]

 実験データセットの偏りを緩和するため、分子構造を処理できるグラフニューラルネットワーク(GNN)と逆プロペンシティスコアリング(IPS)や領域不変表現学習(DIRL)とを組み合わせたバイアス緩和手法の提案。QM9データセットを用い、実用的な偏りのある4通りのシミュレーション結果から、DIRLとGNNとの組合せにはまだ改善の余地があるものの、IPSとGNNとの組合せではバイアス緩和性能の向上を確認できた。

[kwh_rd100のコメント]

 データセットが様々な理由により偏っていることがあり、その偏った分布への過剰適合が課題となり得る。このため、本研究のバイアス緩和手法により、データセットの偏りがあっても統計的に有意に性能が向上できたことが素晴らしい。有効性を確認できなかったDIRL法についてはドメイン分類器による最終的な予測器の情報排除による性能向上の可能性に言及しており、今後の展開が期待できる。

202009-後半 注目論文③

3)Electron-Passing Neural Networks for Atomic Charge Prediction in Systems with Arbitrary Molecular Charge
(任意の分子電荷を持つシステムにおける原子電荷予測のための電子通過ニューラルネットワーク)
https://doi.org/10.26434/chemrxiv.12980150.v1


[エグゼクティブサマリー]

 ニューラルネットワークスキームを導入し、デカルト座標と全システム電荷から原子電荷分割に直接マッピングすることにより、小さなトレーニングセットで荷電および中性の薬物およびタンパク質様分子の高精度な原子電荷分割を達成した。分子間相互作用による微妙な電荷移動や分極効果を忠実に再現することにも成功している。

[kwh_rd100のコメント]

 本手法では、単一のモデルと任意のスケーリング、各特定の電荷状態で追加のエンコーディングやトレーニングデータは不要でありながら、高精度な総電荷を保存する。物理的に意味のある原子電荷は、分子力学、機械学習によるポテンシャル、あるいはケミカルインフォマティックス向けの特徴量として利用できることから、荷電系を含む大規模なデータセットへの適用結果の公開が待たれる。

さいごに

  読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)