2019年11月後半 kwh_rd100の注目論文BEST3

計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2019 年 11 月後半の注目論文 BEST3 を紹介させて頂きます。

1) Earthmover-based manifold learning for analyzing molecular conformation spaces
(分子立体配座空間を分析するための地ならしベースの多様体学習)
https://arxiv.org/abs/1911.06107
2)Unifying machine learning and quantum chemistry with a deep neural network for molecular wavefunctions
(分子波動関数のためのディープニューラルネットワークによる機械学習と量子化学の統合)
Nat. Commun. 2019, 10, 5024.
DOI: 10.1038/s41467-019-12875-2
3)Inference of chemical reaction networks based on concentration profiles using an optimization framework
(最適化フレームワークを使用した濃度プロファイルに基づく化学反応ネットワークの推論)
AIP 2019, in press.
DOI: 10.1063/1.5120598

201911-後半 注目論文①

1)Earthmover-based manifold learning for analyzing molecular conformation spaces
(分子立体配座空間を分析するための地ならしベースの多様体学習)
https://arxiv.org/abs/1911.06107

[エグゼクティブサマリー]
 分子配座空間を分析するために、拡散マップフレームワークで一般的なユークリッド距離の代わりに Earthmover’s distance (EMD) を用いることにより、酵素等の柔軟なポリマー固有の立体構造空間をキャプチャするために必要なサンプル数を著しく減少させることに成功した。高速ウェーブレット近似なので扱いやすく、ノイズに対してロバスト。実装あり(https://github.com/nathanzelesko/earthmover)

[kwh_rd100のコメント]
 この EMD ベースの多様体学習を利用して、連続的な不均一性を備えたクライオ電子顕微鏡 (構造生物学者が原子分解能で構造を解明するために使用する手法の一つ) のデータセットの分析のみならず、他の3Dビデオ信号等の変動性を分析し、対象物の動きをより適切にモデル化するのに有効。なお、 計算負荷を軽減するために、高速ウェーブレット近似が導入されてはいるものの、 公開されている Python3系プログラム(https://github.com/nathanzelesko/earthmover) を用いた場合、論文記載の図の再現だけで数時間以上を要する模様。 更なる演算スピード up にも期待したい。

201911-後半 注目論文②

2)Unifying machine learning and quantum chemistry with a deep neural network for molecular wavefunctions
(分子波動関数のためのディープニューラルネットワークによる機械学習と量子化学の統合)
DOI: 10.1038/s41467-019-12875-2

[エグゼクティブサマリー]
分子組成と原子位置の関数として、分子電子構造の正確な機械学習モデルを提供する深層学習フレームワーク SchNOrb (SchNet for Orbitals) の開発。このSchNOrb は、各化学的特性に特化した機械学習モデルの構築ではなく、分子配置空間全体の電子構造(基底状態の波動関数)を高精度予測し、分子反応ダイナミクス中の豊富な化学的解釈への道を切り開いた。

[kwh_rd100のコメント]
従来、機械学習では特定の予測目的 (例えば、HOMO-LUMO ギャップ) に対して、量子化学 (基準) 計算の結果を使って予測モデルを構築していたため、別の目的 (例えば生成エンタルピー) を予測するには、新たなモデル構築が必要であった。
しかし、この SchNOrb は波動関数を予測する方式なので、様々な基底状態の物性予測に使えるモデルを構築しており、予測された波動関数は機械学習と量子化学とのインターフェイスとして機能しており、いわば量子化学と機械学習の相乗効果を実現しているとも言える。

201911-後半 注目論文③

3)Inference of chemical reaction networks based on concentration profiles using an optimization framework
(最適化フレームワークを使用した濃度プロファイルに基づく化学反応ネットワークの推論)
DOI: 10.1063/1.5120598

[エグゼクティブサマリー]
 時系列濃度データがない場合でも、定常状態の濃度データのみから、混合整数線形プログラム (MILP) を活用して、 反応ネットワークの相互作用構造を学習し、 複雑な非線形(生)化学ネットワークを推論(再構築)するアプローチ 。バッチ反応器やプラグフロー反応器など、様々な反応器モデルにそのまま適用可能。MATLABを用いて、複数の合成反応例とカルビン回路への適用例あり。

[kwh_rd100のコメント]
 時系列濃度データ(連続した時間軸で反応成分の濃度を同時測定)を得ることは、経済的and/or技術的に困難であり、定常状態付近でしか反応に関与する化学種の濃度把握ができないことが大半である。そこで、この測定可能な定常状態の濃度データのみから、観測された化学量論的部分空間を推論(再構築)するため、問題を最適化問題のクラス、特に混合整数線形プログラム(MILP)にキャストしている。この発想の転換がユニーク。論文中には適用したアルゴリスムについて丁寧な記述がなされているので、MATLABが使える環境における実装のハードルは低いと思われる。

(参考)混合整数線形問題(MILP)とは、決定変数の一部が整数変数でなければならないという制約を持つ、 線形計画問題のことで、「施設配置問題+輸送・配送問題」などに応用されている。凸多面体の頂点を探せばよいわけではなく、離散変数が現れるので「解に近い方向」を微分によって求めることもできない。このため、原則、離散変数の全通り探索が必要となる。しかし、全探索では大規模な問題を現実的な速度で解くことができなくなるため、探索の途中で得られる情報を使いながらツリー構造の途中のノード以下を計算の対象から除外する手法 (分枝限定法) が多用されている。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、  このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

関連する記事

是非フォローしてください

最新の情報をお伝えします

コメントを残す(投稿者名のみ必須)