計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年02月後半の注目論文BEST3 を紹介させて頂きます。
1)Structural reduction of chemical reaction networks based on topology
(トポロジーに基づく化学反応ネットワークの構造的縮小)
https://arxiv.org/abs/2102.07687
2)A Could graph neural networks learn better molecular representation for drug discovery?
A comparison study of descriptor-based and graph-based models
(グラフニューラルネットワークは、創薬のためのより良い分子表現を学ぶことができますか?
記述子ベースのモデルとグラフベースのモデルの比較研究)
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-020-00479-8
3)Learning Neural Generative Dynamics for Molecular Conformation Generation
(分子コンフォメーション生成のための神経生成ダイナミクスの学習)
https://arxiv.org/abs/2102.10240
目次
202102-後半 注目論文①
1)Structural reduction of chemical reaction networks based on topology
(トポロジーに基づく化学反応ネットワークの構造的縮小)
https://arxiv.org/abs/2102.07687
[エグゼクティブサマリー]
化学反応の速度論やパラメータを実験的に決定困難な系における構造と機能の関係を明らかにするべく、化学反応ネットワークのトポロジー変化を(共)ホモロジー群の変化として捉えて、その変化を代数的トポロジーのツールで追跡する。大腸菌の代謝経路の数値シミュレーション等で性能実証した。

[kwh_rd100のコメント]
論文記載の方法は、元の定常状態の特性を維持しながら反応ネットワーク数を減らすことができるので、代謝経路などの大規模かつ複雑な反応システムであっても効率的に扱える魅力がある。化学反応ネットワークのホッジ分解とラプラス演算子、影響度指数の分解、サブネットワークにおける創発的保存電荷の役割等、トポロジー初心者であっても論理展開をフォローできるように配慮されていることもありがたい。
202102-後半 注目論文②
2)A Could graph neural networks learn better molecular representation for drug discovery?
A comparison study of descriptor-based and graph-based models
(グラフニューラルネットワークは、創薬のためのより良い分子表現を学ぶことができますか?
記述子ベースのモデルとグラフベースのモデルの比較研究)
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-020-00479-8
[エグゼクティブサマリー]
GCNやAttentive FPなどの非常に複雑で特殊なグラフベースの方法は、大規模またはマルチタスクのデータセットの一部で卓越したパフォーマンスを発揮する。しかしながら、11種類の公開テストで比較したところ、予測の精度、計算可能性、および解釈可能性を平均して見ると、記述子ベースのモデル(SVM、XGBoostなど)が、グラフベースと同等以上の予測を達成することを示した。

[kwh_rd100のコメント]
既製の軽量記述子ベースのモデルが、複雑かつ特殊なグラフベースの深層学習モデルと同等以上の精度、計算可能性、および解釈可能性を示すことを実証した意義は大きいと解する(≒個人的に「好き」)。計算コストの観点は実用上も重要であるから、本論文の結果は予測精度と計算効率のバランスを確保していく上での目安にもなる。
202102-後半 注目論文③
3)Learning Neural Generative Dynamics for Molecular Conformation Generation
(分子コンフォメーション生成のための神経生成ダイナミクスの学習)
https://arxiv.org/abs/2102.10240
[エグゼクティブサマリー]
所与の分子グラフについて、step1)ガウシアン事前分布から潜在変数を描き、それを条件付きグラフ連続フロー(CGCF)を介して所望の距離行列に変換する step2)生成した距離に従って可能な3次元座標を探索する、step3)エネルギーベースの傾斜モデルを用いたMCMC手続きにより、コンフォメーション最適化する、分子構造生成のための新しい確率論的フレームワークの提案。標準的なベンチマークにおいて、この手法が既報内容を凌駕する性能を発揮することを示した。
[kwh_rd100のコメント]
フローベースモデルとエネルギーベースモデルの利点を組み合わせて、複雑なマルチモーダル幾何学的分布と高度に分岐した原子相関をモデル化するという発想が素晴らしい。QM9(低分子の標準的なデータセット)におけるコンフォメーション生成[Table2]および距離モデリング[Table3]で、優れたパフォーマンスを示しており、著者らが将来課題として掲げているタンパク質などの複雑な高分子に関する結果にも注目したい。
さいごに
読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。