2020年05月前半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 05月前半の注目論文 BEST3 を紹介させて頂きます。

1)CReM: chemically reasonable mutations framework for structure generation
(CReM:構造生成のための化学的に妥当な変異フレームワーク)
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-020-00431-w

2)Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning
(強化学習を使用して合成アクセス可能な化学空間をナビゲートする学習)
https://arxiv.org/abs/2004.12485

3)Learning Machine Reasoning for Bioactivity Prediction of Chemicals
(化学物質の生物活性予測のための学習機械推論)
https://doi.org/10.26434/chemrxiv.12269480.v1

構造生成のための化学的に妥当な変異フレームワーク

1)CReM: chemically reasonable mutations framework for structure generation
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-020-00431-w

[エグゼクティブサマリー]

 基本的な発想は、同一のコンテキスト内のフラグメントが交換可能であるというコンテキストを考慮すると、一致する分子ペアに似ているから、交換可能なフラグメントのデータベースを作成し、それを化学的に有効な構造の生成に使用できるはず。よって、入力化合物データベースのカスタマイズにより、間接的にではあるものの生成する構造のレベルアップは図ることが可能になる。
実装:https://github.com/DrrDom/crem

Fig. 1 Generation of a database of interchangeable fragments and new molecules
Fig. 9 Distributions of physicochemical parameters of compounds generated during stochastic exploration of chemical space in comparison with the same parameters of compounds of the initial ChEMBL data set used for generation of the fragment database

[kwh_rd100のコメント]

 合成的に実現可能な化合物の小さなライブラリを使用しても、合成の実現可能性が予測され、多様な構造のセットを生成できることが魅力。ただし、フラグメントデータベースのサイズと生成される構造の新規性と多様性の間はトレードオフになることに注意が必要。

強化学習を使用して合成アクセス可能な化学空間をナビゲートする学習

2)Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning
https://arxiv.org/abs/2004.12485

[エグゼクティブサマリー] 

 合成可能な低分子の空間をナビゲートする、フォワード合成のための強化学習(RL)アプリケーションPGFSの提案。遷移確率関数を用い、複数の可能性のある生成物が存在する分岐的な合成経路に直接拡張可能。実装:https://github.com/99andBeyond/Apollo1060

[kwh_rd100のコメント] 

 デノボドラッグデザインにおけるフォワード合成のための強化学習(RL)の最初のアプリケーション。大規模な状態空間と階層的なアクションを伴う高次元の連続作用空間を確保しており、反復&仮想&多段階な合成プロセスのすべての時間ステップで有効な化学反応に、市販の低分子ビルディングブロックを対象としているのが魅力。分岐的な合成経路への適用報告が待ち遠しい。

化学物質の生物活性予測のための学習機械推論

3)Learning Machine Reasoning for Bioactivity Prediction of Chemicals
https://doi.org/10.26434/chemrxiv.12269480.v1

[エグゼクティブサマリー]

 QSARモデリングにおける計算推論と因果関係の提案。特定の生物活性ドメインから得られたベクトルを使用して、別のドメインで同様の動作をする化学物質を見つけるために使用できることを提示した。順次成長する原子中心の部分構造のリストを用いて、一連の近傍検索によって生成した高レベル記述子は、トレーニングデータで明示的に表されていないクエリ分子の特徴の新しい組合せを処理できる。

[kwh_rd100のコメント]

 トレーニングデータでは明示的に表されていないクエリ分子の特徴の新しい組み合わせを処理できることが最大の魅力。教師なしトレーニングを利用して連続的な分子フィンガープリントを構築することを除けば、この方法論には勾配最適化や統計的フィッティングが入っていないのがユニーク。

さいごに

  読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)