2020年02月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020 年 02 月後半の注目論文 BEST3 を紹介させて頂きます。

1)kGCN: A Graph-Based Deep Learning Framework for ChemicalStructures
(kGCN:化学構造のグラフベースの深層学習フレームワーク)
DOI: 10.26434/chemrxiv.11859684.v1
2)Compositionally-Restricted Attention-Based Network for Materials Property Prediction
(材料特性予測のための組成的に制限された注意ベースのネットワーク)
DOI: 10.26434/chemrxiv.11869026.v1
3)A self-attention based message passing neural network for predicting
 molecular lipophilicity and aqueous solubility
(分子親油性と水溶性を予測するための自己注意に基づくメッセージパッシングニューラルネットワーク)
DOI: 10.1186/s13321-020-0414-z

202002-後半 注目論文①

1)kGCN: A Graph-Based Deep Learning Framework for ChemicalStructures
(kGCN:化学構造のグラフベースの深層学習フレームワーク)
DOI: 10.26434/chemrxiv.11859684.v1

[エグゼクティブサマリー]
 前処理用の化学構造に基づいたグラフ表現の自動作成、モデル調整用の神経回路網のハイパーパラメーターの自動最適化のためのベイズ最適化、統合グラディエントなどの機能を含めることにより、予測モデルの構築事前予測結果の利用に必要な3つのステップを実行できる「説明可能な AI」。マルチモーダル予測も可能。応用例として、1)化合物とタンパク質の相互作用および2)反応予測と可視化の2つを提示。実装あり。https://github.com/clinfo/kGCN

[kwh_rd100のコメント]
 様々なプログラミングスキルレベルのユーザーサポートのため、kGCN は、3系統のインターフェイス、すなわち第 1 は KNIME を用したGUI、第2はコマンドライン、第3は Jupyter Notebook を提供している。デモはグラフの分類タスクのためのグラフ畳み込みネットワークのTensorFlow実装 (TensorFlow2 対応はコミット)。GitHub 実装では、Jupyter Notebook が使える環境があればトレース可能なレベルで説明がなされており、好感が持てる。

202002-後半 注目論文②

2)Compositionally-Restricted Attention-Based Network for Materials Property Prediction
(材料特性予測のための組成的に制限された注意ベースのネットワーク)
DOI: 10.26434/chemrxiv.11869026.v1

[エグゼクティブサマリー]
無機化合物の組成情報のみを取得して材料特性を予測する、組成的に制限されたアテンションベースのニューラルネットワークツールCrabNetの提案。CrabNetの強力な学習と自己注意能力を実証するために、意図的に組成が制限されたElement-Derived Matrix(EDM) 表現と追加の化学知識を使用した化学組成の特徴づけに成功。高速な推論速度と強力な予測機能を有しながらもハードウェア要件が低いこともメリットの一つ。PyTorch 実装あり。 https://github.com/anthony-wang/CrabNet

[kwh_rd100のコメント]
 CrabNet の回帰にかかる強力な学習と 自己注意に基づく材料特性予測の精度は高い。注意ベースのモデル採用により、材料固有の問題について新しい考え方が可能になることは間違いなく、ドメイン固有の知識との統合により、更なるパフォーマンス向上も期待できる。しかし、これが直ちに著者が期待するように、「外挿モデリングの共通語」になるか否かは議論の余地があると考える。

202002-後半 注目論文③

3)A self-attention based message passing neural network for predicting
 molecular lipophilicity and aqueous solubility
(分子親油性と水溶性を予測するための自己注意に基づくメッセージパッシング
ニューラルネットワーク)
DOI: 10.1186/s13321-020-0414-z

[エグゼクティブサマリー]
 Deepchem の Message Passing Neural Network (MPNN) に、自己アテンションメカニズムを導入した SAMPN と呼ばれるグラフニューラルネットワークフレームワークを適用し、非ブラックボックス化、計算効率ならびに予測性能の向上を実現した。PyTorch 実装あり。https://github.com/tbwxmu/SAMPN

[kwh_rd100のコメント]
 アテンションメカニズムの適用により、親油性/溶解性に関する新しい洞察を提供可能とし、従来の深層学習の弱点とされるブラックボックスから脱却し、 化学構造から分子特性を直接最適化できる道を切り開いた意義は大きい。 メッセージパッシングニューラルネットワーク (MPNN) は、マルチターゲットモデルとしてもトレーニング可能であり、計算効率と予測性能が高いことから、このアプローチを他用途の QSAR に適用したケースが報告されるのが待ち遠しい。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、  このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)