2020年04月後半 kwh_rd100 の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 04月後半の注目論文 BEST3 を紹介させて頂きます。

1)Generating Tertiary Protein Structures via an Interpretative Variational Autoencoder
(解釈的可変オートエンコーダーを用いたタンパク質三次構造の生成)
https://arxiv.org/abs/2004.07119

2)Molecular Design Using Signal Processing and Machine Learning: Time-Frequency-like Representation and Forward Design
(信号処理と機械学習を用いた分子設計 時間周波数的表現とフォワードデザイン)
https://arxiv.org/abs/2004.10091

3)cgbind: A Python Module and Web App for Automated Metallocage Construction and Host-Guest Characterization
(cgbind:自動化メタロケージ構築とホスト-ゲスト特性評価のためのPythonモジュールとWebアプリ)
https://doi.org/10.26434/chemrxiv.12146106.v1

202004-後半 注目論文①

1)Generating Tertiary Protein Structures via an Interpretative Variational Autoencoder
(解釈的可変オートエンコーダーを用いた三次構造の生成)
https://arxiv.org/abs/2004.07119

[エグゼクティブサマリー] 

グラフの解釈可能な深層生成モデルをタンパク質の構造予測に適用した初めての研究。新規な三次構造をサンプリングするための潜在空間を直接明らかにし、構造的な意味を持つ軸や因子を強調し、ディープモデルのブラックボックスを開放する生成モデルの可能性を実証するべく、タンパク質構造の生成と解釈の問題に対する解釈的グラフ変分自動エンコーダー(DCO-VAE)の開発した。

[kwh_rd100のコメント]

 生成型ディープラーニングに触発された、タンパク質の機能的に関連した3次元構造を生成するためのアプローチの提案。生成されたコンタクトマップの局所的な部分が明らかな傾向(例えば、収縮やスケッチ)を示し、コンタクトマップとそれに対応するタンパク質構造の形成における潜在的な意味的要因を示している。このため、タンパク質の折り畳みを制御する意味的要因を発見できる解釈可能なモデルとなっており、素晴らしい。

202004-後半 注目論文②

2)Molecular Design Using Signal Processing and Machine Learning: Time-Frequency-like Representation and Forward Design
(信号処理と機械学習を用いた分子設計 時間周波数的表現とフォワードデザイン)
https://arxiv.org/abs/2004.10091

[エグゼクティブサマリー]

 第一原理量子力学(QM)と機械学習(ML)と信号処理(SP)技術の統合(QM↔SP↔ML)、すなわち、分子の時間周波数依存性表現を、分子の構造的、幾何学的、エネルギー的、電子的、熱力学的特性をコード化し、これをDFTなどの第一原理計算で訓練された深層学習(DNN)への入力として用いると、分子フォワードデザインのための強力な手法となる。実装あり:https://github.com/TABeau/QM-SP-ML

[kwh_rd100のコメント]

 QM9データセット(133,855個の分子と19の物性からなる)を用いた性能テスト結果は良好(全エネルギーの平均絶対誤差(MAE)<1kcal/mol、軌道エネルギーのMAE<0.1ev)。著者らが主張しているように、時間周波数のような表現と分子の構造、エネルギー、電子、熱力学的特性との間に明確な関係が存在することは間違いない。これらの物理的描像が更に明確化してくると、この手法が最適な分野も明確になるはず。続報にも注目したい。

202003-後半 注目論文③

3)cgbind: A Python Module and Web App for Automated Metallocage Construction and Host-Guest Characterization
(cgbind:自動化メタロケージ構築とホスト-ゲスト特性評価のためのPythonモジュールとWebアプリ)
https://doi.org/10.26434/chemrxiv.12146106.v1

[エグゼクティブサマリー]

 対応するリンカーのSMILES文字列のみからメタロケージ構造を自動生成し、結合親和性はリンカーと基質SMILESの両方の入力から評価する。精度は半経験的計算と同等以上。
Webアプリ:cgbind.chem.ox.ac.uk
 実装:https://github.com/duartegroup/cgbind

[kwh_rd100のコメント]

拡張性のあるPythonモジュールであり、超分子構造のハイスループット仮想スクリーニングへの応用は容易と思われる。
・リンカーを変更してメタロケージを構築し、タイトな錯形成を探索するのではなく、ケージを基質の周りに構築して結合を最大化する「メタロケージの逆設計」も進行中とのこと、その成果公開が待ち遠しい。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、  このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)