2019年9月前半の注目論文BEST3

はじめまして。新スタッフのkwh_rd100です

 この度、計算化学.com のスタッフに加えて頂いた kwh_rd100 です。興味ある分野は、量子化学計算、機械・深層学習などで、最新トピックをヒーヒー言いながらウォッチしております。各種計算ソフト(量子化学ならばGaussian、 機械・深層学習 ならば TensorFlow や PyTorch など)のエンドユーザーでもあります。未だに XYZ 座標(直交座標)系よりも Z-matrix(内部座標系)の方が好きです。管理人さんが強いハード関係は弱いです。

 ご承知のように、機械学習・深層学習分野は「日進月歩」ならぬ「秒進日歩」で急激な進化を遂げています。これを踏まえて、各種の計算ソフト群をツールと割り切って使う立場から、今月前(後)半の注目論文とか、 速報性を重視した Python/R の計算化学/機械・深層学習に関係する話題など、様々な角度からの情報提供を行って参ります。これらの記事が、読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。

2019年9月前半のkwh_rd100注目論文BEST3

  1. Quantum Chemistry in the Age of Quantum Computing
    (量子コンピューティングの時代における量子化学)
    https://pubs.acs.org/doi/10.1021/acs.chemrev.8b00803
  2. Molecular Transformer: A Model for Uncertainty-Calibrated Chemical Reaction Prediction
    (分子トランスフォーマー:不確実性を較正した化学反応予測のモデル)
    https://pubs.acs.org/doi/10.1021/acscentsci.9b0057
  3. Anthropogenic biases in chemical reaction data hinder exploratory inorganic synthesis
    (化学反応データにおける人為的バイアスは、探索的無機合成を妨げる)
    https://www.nature.com/articles/s41586-019-1540-5

201909-前半 注目論文①

Quantum Chemistry in the Age of Quantum Computing
(量子コンピューティングの時代における量子化学)
https://pubs.acs.org/doi/10.1021/acs.chemrev.8b00803

[エグゼクティブサマリー]
 量子化学関連のアルゴリズムと結果概要のレビュー。量子コンピューターは、分子の電子構造などについて正確な結果を効率的に提供できるが、現状では、従来からの量子化学計算手法を量子コンピューティングにそのまま載せているレベルに留まっている。今後は、量子コンピューティング向けの新しいアプローチが必要となる。

[kwh_rd100雑感]
 Google、IBM、Intel、Microsoft やベンチャー企業の Rigetti Computing などがメインプレーヤーとなり、量子コンピュータ開発が世界的に活発化している。集積度の急激な向上(72量子ビット化)や、量子状態の持続(コヒーレンス)時間も数百マイクロ秒に到達した。この結果、Google や IBM は量子コンピュータを利用して、小規模分子(LiH, BeH2, 水分子など)の量子化学計算には成功している。

 しかし、実用的な化学薬品や創薬・新材料の設計・開発に役立つレベルとなると、最低でも 100 万~1 億量子ビット程度の集積化が必要とされている。現状の集積度化のトレンドが続くと仮定しても、100 万量子ビットの実現は 2035 年頃と予想されている。このため、量子コンピューティング向けの新しいアルゴリズム開発も希求されている。

[参考文献]
1)量子コンピュータの量子化学計算への応用の現状と展望
https://www.slideshare.net/NakataMaho/ss-117321322
2)Scalable Quantum Simulation of Molecular Energies(Received 7 April 2016; published 18 July 2016)
https://journals.aps.org/prx/pdf/10.1103/PhysRevX.6.031007
3)量子コンピュータ開発の進展~化学薬品・創薬・新材料開発の加速に向けて
https://stfc.nistep.go.jp/horizon2030/index.php/ja/weekly-weakly-signals/qbit20190208

201909-前半 注目論文②

Molecular Transformer: A Model for Uncertainty-Calibrated Chemical Reaction Prediction
(分子トランスフォーマー:不確実性を較正した化学反応予測のモデル)
https://pubs.acs.org/doi/10.1021/acscentsci.9b0057

[エグゼクティブサマリー]
 反応物、試薬、及び生成物の SMILES 記法(SMILES)文字列(テキストベースの表現)との間の機械翻訳問題として、有機反応の結果予測の機械学習モデル。手作りルールは不要で、高い予測精度(90%以上)を示す。反応経路のランク付けに使用できる不確実性スコアもある。実装あり(https://rxn.res.ibm.com)。

[kwh_rd100雑感]
 モデルが反応物、試薬分割せずに入力を処理することができるのが最大のメリット。 実装 (https://rxn.res.ibm.com/) は無料で、完全にインタラクティブなプラットフォームを提供している。 入力されたデータは AI モデルに供給され、将来の予測の精度の向上に寄与する。2019年9月15日時点で、予測反応の合計は 5.1 万件余り。まさしく「富める者はますます富み、貧しき者はますます貧しくなる」という格言が当て嵌まる。

201909-前半 注目論文③

Anthropogenic biases in chemical reaction data hinder exploratory inorganic synthesis
(化学反応データにおける人為的バイアスは、探索的無機合成を妨げる)
https://www.nature.com/articles/s41586-019-1540-5

[エグゼクティブサマリー]
 化学反応の機械学習モデルの構築では、実質的に実行不可能な選択肢(溶解度や酸性度などの物性値、コストや安全性にかかる制限)を除外した実験条件の全てから、ランダムサンプリングするのが得策である。 サンプリング範囲に従来検討されてこなかった反応も含めることにより、人為的バイアスの影響に対処し、反応予測の精度を向上できるからである。

[kwh_rd100雑感]
 材料科学分野では機械学習が積極的に活用されている。しかし、機械学習技術を使用して集約データのパターンを抽出すると、それらのデータのバイアスが増幅される可能性があることがよく知られている。 たとえば、主に白い顔で訓練された顔認識アルゴリズムは、他の民族の人々の顔を区別することができない。

 よって、人間が生成したデータセットでトレーニングされたモデルは、ランダムに生成された反応条件を使用してデータセットでトレーニングされたモデルよりも、反応の成功または失敗を予測するのにそれほど成功しないこと、すなわち、研究者は機械学習に用いられるデータに存在する人為的なバイアスに気を付けることがポイントとなる。

さいごに

 この計算化学、機械学習・深層学習分野でこのような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

 また、 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。 

関連記事

コメントを残す(投稿者名のみ必須)