2019年12月後半 kwh_rd100の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2019 年 12月後半の注目論文 BEST3 を紹介させて頂きます。

1)Black Box Recursive Translationsfor Molecular Optimization
(分子最適化のためのブラックボックス再帰翻訳)
https://arxiv.org/abs/1912.10156

2)Recreation of the Periodic Table with anUnsupervised Machine Learning Algorithm
(教師なし機械学習アルゴリズムを使用した周期表の再作成)
https://arxiv.org/abs/1912.10708

3)Attribute driven inverse materials design using deep learning Bayesian framework
(深層学習ベイジアンフレームワークを使用した属性駆動型逆材料設計)
https://www.nature.com/articles/s41524-019-0263-3

201912-後半 注目論文①

1)Black Box Recursive Translationsfor Molecular Optimization
(分子最適化のためのブラックボックス再帰翻訳)
https://arxiv.org/abs/1912.10156

[エグゼクティブサマリー]
 Black Box Recursive Translation (BBRT) は、分子特性最適化のための新しい推論方法。文献でよく知られているシーケンスおよびグラフベースの分子表現を翻訳機に繰り返しフィードバック (BBRT適用) すると、翻訳モデルの選択によらず、各ステップで分子特性が向上する。モデルにフィードバックする出力の選択は、簡単なランキング手法で決定するので、結果の解釈は比較的容易。

[kwh_rd100のコメント]
 分子最適化を翻訳問題としてキャストし、既存のモデリングアプローチにより、シーケンスとグラフベースの両方から、制約なしで複数プロパティの最適化問題を解決するアプローチは新鮮。また、分子トレースの任意の時点で、ユーザーが「ブレークポイント」を導入できるので、複数のターゲット物性がトレードオフな関係にある場合に、さじ加減をコントロールできるのでありがたい。今後の課題として挙げられている教師データが少ない場合 (=アノテーションの収集に費用がかかる低リソース設定) への対応 (≒機能拡張) が待ち遠しい。 
 可能ならば、別論文「ランダム化された SMILES 文字列により、分子生成モデルの品質が向上する」(https://jcheminf.biomedcentral.com/articles/10.1186/s13321-019-0393-0) 記載の手法と、最適化性能を対比してみたい。

201912-後半 注目論文②

2)Recreation of the Periodic Table with an Unsupervised Machine Learning Algorithm
 (教師なし機械学習アルゴリズムを使用した周期表の再作成)
 https://arxiv.org/abs/1912.10708

[エグゼクティブサマリー]
 高次元データをオンデマンドでさまざまなレイアウトで表形式に自動変換できる、ジェネレーティブトポグラフィックマッピング (GTM) に基づく教師なし機械学習アルゴリズム (周期表ジェネレーター: PTG) 。この PTG は、自己組織化マップ (SOM) とは異なり、周期性も明らかにできている点で、有用性が高い。

[kwh_rd100のコメント]
 表形式の構築は高次元データの次元を減らす作業とも言える。正方形の表は、現在最も一般的な周期表とかなり似ているが、たとえば H と He の配置は、標準的な周期表では遠く離れて配置されているが、 PTG では H と He をもっと近づけることを提案している。
 この論文では形成エネルギーの予測のみに焦点を当てて、 2種類のレイアウト (正方形と円錐状) を提示しているが、これ以外にもトポロジー活用により、多様な特性を設計目標に対応したレイアウトがありそう。より洗練された表形式表示の出現を期待したい。

201912-後半 注目論文③

3)Attribute driven inverse materials design using deep learning Bayesian framework
(深層学習ベイジアンフレームワークを使用した属性駆動型逆材料設計)
https://www.nature.com/articles/s41524-019-0263-3

[エグゼクティブサマリー]
 ターゲットとする特性を備えた材料設計のために、ディープラーニングベースの逆予測フレームワーク SLAMDUNCS を開発。ベイズ推論を使用して、リチウムイオン電池用の高安定性電解質、OTFT 用の n および p 型有機半導体、有機太陽電池で使用する小さな有機アクセプター分子について、ターゲット特性を有するデータベースにはない新規分子構造の生成に成功した事例を提示。データセットとコードの公開あり(https://github.com/piyushtagade/SLAMDUNCS)。

[kwh_rd100のコメント]
 論文では有機分子データベースでトレーニングされているため、逆問題は有機空間の HOMO、LUMO、レドックスポテンシャル等のみ。このアプローチは効率的かつ堅牢で、特性に関連する構造情報を(SMILES 表現のように)デジタル化できれば、多様なデータセットを学習することにより複雑な材料設計にも適用可能。ということは、この手法を ポリマーに適用するためには、BigSMILES ( https://pubs.acs.org/doi/10.1021/acscentsci.9b00476)などを適用すればOKかも。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できるように、 2020 年も尽力致します。記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、 このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

是非フォローしてください

最新の情報をお伝えします

コメントを残す(投稿者名のみ必須)