2019年12月前半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2019 年 12月前半の注目論文 BEST3 を紹介させて頂きます。

  1. Unsupervised discovery of solid-state lithium ion conductors
    (固体リチウムイオン伝導体の教師なし発見)
    https://www.nature.com/articles/s41467-019-13214-1
  2. Noisy, sparse, nonlinear: 
    Navigating the BermudaTriangle of physical inference with deep filtering

    (ノイズの多い、まばらな、非線形:
    物理フィルタリングのバミューダトライアングルを深いフィルタリングでナビゲートする)
    https://arxiv.org/abs/1912.04345
  3. Molecular Generative Model Based OnAdversarially Regularized Autoencoder
    (敵対的に正規化されたオートエンコーダに基づく分子生成モデル) https://arxiv.org/abs/1912.05617

201912-前半 注目論文①

Unsupervised discovery of solid-state lithium ion conductors
 (固体リチウムイオン伝導体の教師なし発見)
 https://www.nature.com/articles/s41467-019-13214-1

[エグゼクティブサマリー]
 教師なし学習を適用して、無機結晶構造データベースからすべての既知の Li含有化合物をスクリーニングし、階層クラスタリングを経て、ab initio 分子動力学 (AIMD) 計算で高スループットスクリーニングにより、既知のシステムとは異なる構造と化学的性質を有する固体リチウムイオン伝導体 (SSLC) の発見に成功した。この材料発見を導くための教師なし学習スキームは、データ不足の課題を回避し、少数の既知の例を使用して新しい材料を識別し、構造と特性の関係に関する独自の洞察を提供できる。 R 言語の実装あり。 https://github.com/tri-na?tab=repositories

[kwh_rd100のコメント]
 材料開発でよくある2つの課題を見事に解決している。第1の課題は、希望する特性を示す材料はごく少数であり、特性の悪い材料のデータはほとんどないことである。第2の課題は、機械学習モデルのパラメーター化が、プロパティデータの分散とエラーの影響を非常に受けやすいことである。そこで、著者らは、機械学習モデルの適用範囲を材料空間全体に拡張し、ラベルのないデータを用いた教師なし学習により、良い例と悪い例の間に境界線を引き、良い例に似た候補を特定している。つまり、各材料候補のターゲット材料特性を「正確な予測」するのではなく、第一原理計算による探索のために大幅に絞り込まれた「材料候補リスト」を得ることに、教師なし学習の目的を切り替えている。こうすれば、限られた量の低品質データしかなくてもスクリーニングを実行でき、高価な第一原理のコストを大幅削減できるからである。

201912-前半 注目論文②

Noisy, sparse, nonlinear: 
Navigating the Bermuda Triangle of physical inference with deep filtering

(ノイズの多い、まばらな、非線形:
物理フィルタリングのバミューダトライアングルを深いフィルタリングでナビゲートする)
https://arxiv.org/abs/1912.04345

[kwh_rd100のコメント]
 TeaNet は、原子間ポテンシャルの堅牢性とニューラルネットワークの表現力を上手く両立されている。このネットワークでは、グラフの畳み込みはEAMポテンシャル(電子理論に基づいた挿入原子法 (Embedded Atom Method) パラメーターの数が多く、実験値と合わせ易い)に関連付けられ、スタックされたネットワークモデルは反復電子総エネルギー緩和計算に関連付けられている。ユークリッドベクトルとテンソル値はモデルに組み込まれ、方向依存のハミルトニアン情報の伝搬を再現している。ポリマーへの適用可否は不明。

201912-前半 注目論文③

Molecular Generative Model Based OnAdversarially Regularized Autoencoder
(敵対的に正規化されたオートエンコーダに基づく分子生成モデル) https://arxiv.org/abs/1912.05617

[エグゼクティブサマリー]
 VAEGAN の両方の利点を活用して各モデルの制限を克服するアプローチ。標的分子の特性は、まず潜在ベクトルから解きほぐされ、分子構造と特性を独立して制御するため、所望の値が潜在ベクトルに組み込まれる。実装あり。https://github.com/gicsaw/ARAE_SMILES

[kwh_rd100のコメント]
 敵対的に正規化されたオートエンコーダー(ARAE)上に構築された分子生成モデル。変分オートエンコーダー (VAE) のような潜在変数モデルに基づいているものの、以下2点が異なる。第1の相違点は、潜在変数の分布は、事前定義された関数による近似ではなく、生成的敵対ネットワーク (GAN) のような訓練データから敵対訓練によって直接取得している。第2の相違点は、敵対訓練において、離散分子構造(スカラー)ではなく、連続潜在ベクトルを使用していることである。離散変数を扱う際の困難さを回避できるからである。QM9 データセットのみならず、EGFR 阻害剤の設計に適用し、開発したARAEがさまざまな化学用途に使えることをアピールしている。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。励ましのコメントも嬉しいです。万一、記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただければと思っております。
 また、 このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

是非フォローしてください

最新の情報をお伝えします

コメントを残す(投稿者名のみ必須)