2019年10月前半 kwh_rd100の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2019年10月前半の注目論文BEST3を紹介させて頂きます。

  1. Predicting Materials Properties with Little Data Using Shotgun Transfer Learning
    (Shotgun Transfer Learning を使用して、少ないデータで材料特性を予測する) https://doi.org/10.1021/acscentsci.9b00804
  2. Bayesian Optimization for Materials Design with Mixed Quantitative and Qualitative Variables
    (定量的変数と定性的変数が混在する材料設計のためのベイズ最適化)
    https://arxiv.org/abs/1910.01688v1
  3. Linking synthesis and structure descriptors from a large collection of synthetic records of zeolite materials
    (ゼオライト材料の合成記録の大規模なコレクションからの合成記述子と構造記述子のリンク)
    https://www.nature.com/articles/s41467-019-12394-0

201910-前半 注目論文①

Shotgun Transfer Learning Predicting Materials Properties with Little Data Using Shotgun Transfer Learning
(Shotgun Transfer Learningを使用して、少ないデータで材料特性を予測する) https://doi.org/10.1021/acscentsci.9b00804

[エグゼクティブサマリー]
 現状では、材料データの量と多様性が不十分なために、最近の機械学習の著しい進歩の恩恵を活用できていない。そこで、XenonPy.MDL (小有機分子、ポリマー、無機結晶材料の材料特性をカバーした事前学習済みモデル ライブラリ) を用いた機械学習を使用した材料特性予測 (転移学習) により、 数十個の材料データのみでモデルを構築し、 更に 戦略的なモデル転送による 外挿予測にも成功した。転移学習は、材料科学のさまざまな分野、たとえば小分子からポリマー、無機化学から有機化学に至るまで、さまざまな特性にわたって重要な転移性を有する。実装あり( https://github.com/yoshida-lab/XenonPy)。

[kwh_rd100雑感]
 事前学習済みのモデルを新しいタスクに適応させるプロセスは、経験豊富な専門家が過去に取得した知識またはメモリを暗黙的に利用して、かなり経験の少ないタスクの合理的な推論を実行するシナリオに似ている。転移学習は、非常に小さなデータセットであっても、機械学習による予測は非常に高いレベルであることは証明されている。この論文では、異なるプロパティ間でのモデル遷移、例えば、分子とポリマー、有機物質と無機物質、および実測データと理論値といった明らかな依存関係を持つプロパティの間の多数の重要なモデル遷移に成功している。GitHub 実装があるため、トレースは容易であり、材料科学における転移学習の適用性&有用性についての評価がより明確化するはず。

201910-前半 注目論文②

Bayesian Optimization for Materials Design with Mixed Quantitative and Qualitative Variables
(定量的変数と定性的変数が混在する材料設計のためのベイズ最適化)
https://arxiv.org/abs/1910.01688

[エグゼクティブサマリー]
 ベイズ最適化 (BO) は、計算材料工学の材料設計に注目されているが、従前の方法では、材料の組成、微細構造の形態、および処理条件などの定性的要因は、最初にダミー変数で数値化してからベイズ最適化していたために、定性的レベル間の複雑な相関関係を把握できなかった。そこで、 定性的要因を潜在変数(LV)化してベイズ最適化(BO)に統合した。その結果、モデル予測精度向上のみならず、定性的要因間の相関についても有意な視覚化に成功した。例示はハイブリッド有機-無機ペロブスカイトの成分最適化等。

[kwh_rd100雑感]
 このベイジアン最適化(BO)アプローチでは、既存の材料データベースを活用したベイジアン推論と「オンデマンド」シミュレーション/実験を介して、未知の設計空間を順次探索しており、人間の推論構造に近いのが魅力。例示された太陽電池の光吸収性能の改善はわかりやすい。本手法を、定性的および定量的設計変数が共存する他の困難なエンジニアリング最適化問題に適用したケースにも期待したい。

201910-前半 注目論文③

Linking synthesis and structure descriptors from a large collection of synthetic records of zeolite materials
(ゼオライト材料の合成記録の大規模なコレクションからの合成記述子と構造記述子のリンク)
https://www.nature.com/articles/s41467-019-12394-0

[エグゼクティブサマリー]
  ゼオライト は、 速度論的に制御された経路を介して準安定相として形成されるため、その長い歴史にもかかわらず、合成プロトコルと生成物構造との関係を明確に説明できなかった。そこで、機械学習により、実験データに隠されたパターンを抽出し、ゼオライト化学に対する物理化学的、構造的、および経験的洞察を合理化した。機械学習モデルから抽出された合成記述子により、適切な重要度を持つ構造記述子を識別した。構造記述子に基づく結晶構造の類似性ネットワークは、データセット外のものを含む、従来見逃していた合成的に類似した材料の存在を示唆した。当該新規構造ゼオライトを実際に合成して、合成記述子と構造記述子とのリンクを完成させた。

[kwh_rd100雑感]
  材料合成における機械学習の恩恵も、広く認識されてきたものの、 複数の結晶相を有するゼオライトなどの速度論的に制御された経路を介して合成される材料は、原料の組成、加熱時間、加熱温度、および有機分子の種類などの合成プロトコルのわずかな変化によっても生成物が異なってくるため、理論計算によって詳細を表現することは極めて困難であった。そこで、機械学習のパターン認識機能を活用して、高次元で大量のエントリを持つ化学空間から最も重要な合成記述子を抽出し、構造記述子とリンクさせ、従来見逃していた新規構造を見出し、これを実証した意義は極めて大きい。ゼオライト以外に、複数の安定配座を有する有機分子やポリマーへの展開が期待される。なお、本論文の機械学習に関する記述は良い意味で丁寧であり、初学者でもストーリー展開を把握しやすい。

さいごに

  読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、 このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

関連する記事

コメントを残す(投稿者名のみ必須)