2020年09月前半 kwh_rd100の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 09月前半の注目論文 BEST3 を紹介させて頂きます。

1)Using Domain-specific Fingerprints Generated Through Neural Networksto Enhance Ligand-based Virtual Screening
 (ニューラルネットワークで生成したドメイン固有の指紋を使用して、リガンドベースの仮想スクリーニングを強化!)
 https://doi.org/10.26434/chemrxiv.12894800.v1
2)GraSeq: Graph and Sequence Fusion Learning for Molecular Property Prediction
 (電子構造計算のための量子HF/DFT埋め込みアルゴリズム:複雑分子系へのスケーリング)
 https://arxiv.org/abs/2009.01872
3)Scalar Coupling Constant Prediction Using Graph Embedding Local Attention Encoder
 (グラフ埋め込みローカル注意エンコーダを使用したスカラー結合定数予測)
 https://arxiv.org/abs/2009.04522

202009-前半 注目論文①

1)Using Domain-specific Fingerprints Generated Through Neural Networksto Enhance Ligand-based Virtual Screening
 (ニューラルネットワークで生成したドメイン固有の指紋を使用して、リガンドベースの仮想スクリーニングを強化!)
 https://doi.org/10.26434/chemrxiv.12894800.v1

[エグゼクティブサマリー]

 類似性探索ニューラル(ネットワーク)フィンガープリントの概念を導入した。このニューラルフィンガープリントは、グラフニューラルネットワーク(GNN)よりも、ECFP4 を入力として使用した従来の多層パーセプトロン(MLP)に基づいた方が高性能を示した。 


[kwh_rd100のコメント]

 活性・非活性キナーゼ阻害剤のデータセットを用いて、既知のキナーゼ阻害剤の空間と、クエリの分子構造に関する情報とを結びつけた情報を用いると、フィンガープリントの性能向上ができることは素晴らしい。期待されたグラフ畳み込みネットワークは、標準的な多層パーセプトロンの性能と一致するフィンガープリントを生成できず、この低性能原因が畳み込み由来の「過学習」であり、多くのグラフニューラルネットワークの表現力の欠如も指摘しており、興味深い論文である。

202009-前半 注目論文②

2)GraSeq: Graph and Sequence Fusion Learning forMolecular Property Prediction
 (電子構造計算のための量子HF/DFT埋め込みアルゴリズム:複雑な分子システムへのスケーリング)
 https://arxiv.org/abs/2009.01872

[エグゼクティブサマリー]

 量子計算アルゴリズムで定義された活性化合物(アクティブスペース (AS) で定義される)と、HF や DFT レベルの理論で解かれた不活性環境化合物に分割する。基底状態エネルギーの計算収束のために埋め込みポテンシャルを再帰的に更新して、これをHFまたはDFTレベル計算に埋め込むスキームの提案。H2O, N2, CH2, O2, ピリジンで性能実証した。

[kwh_rd100のコメント]

 提案された反復 DFT 埋め込みスキームを使用すると、選択した AS に関係なく、CASSCF 計算結果を上回る単一のピリジン分子のエネルギー補正項を取得可能なことは驚きである。このスキームが、任意の数の電子を持つ大規模な分子系へのスケールアップできるか否かに関する続報を待ちたい。

202009-前半 注目論文③

3)Scalar Coupling Constant Prediction Using Graph Embedding Local Attention Encoder
 (グラフ埋め込みローカル注意エンコーダを使用したスカラー結合定数予測)
 https://arxiv.org/abs/2009.04522

[エグゼクティブサマリー]

 結合長、結合角、および二面角の観点から、結合システムの新しい不変構造表現のためにローカル自己注意エンコーダー (GELAE) モデルを埋め込むグラフを提案し、グラフの隣接行列に埋め込まれたローカル自己注意モジュールが、結合システムの特徴を効果的に抽出し、修正された分類損失関数を使用して、ネットワーク学習させることで量子化学計算の標準に近いスカラ結合定数 (SCC) 予測精度を達成した。

[kwh_rd100のコメント]

 さまざまな構造表現、モジュールおよび損失関数を比較した結果、従来の化学結合構造表現よりも、この回転および並進不変構造表現が SCC 予測精度向上につながることを提示している。スケーリングされた回帰損失の代わりに分類ベースの損失関数の使用が有用なことは興味深い。今後の研究では、他の結合型の予測を検討し、与えられた結合定数から三次元分子構造を逆に生成するアルゴリズムをさらに検討していくとのこと、成果を期待したい。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)