計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年01月前半の注目論文 BEST3 を紹介させて頂きます。
1)Improving Sample and Feature Selection with Principal Covariates Regression
(主共変量回帰によるサンプルと特徴の選択の改善)
https://arxiv.org/abs/2012.12253
2)Machine Learning-Based Model Selection and Parameter Estimation from Kinetic Data
of Complex First-Order Reaction Systems
(複雑な一次反応システムの速度論データからの機械学習ベースのモデル選択とパラメータ推定)
https://doi.org/10.26434/chemrxiv.13483335.v1
3)Auto-Encoding Molecular Conformations
(分子コンフォメーションの自動エンコード)
https://arxiv.org/abs/2101.01618
目次
2021年01月-前半 注目論文①
1)Improving Sample and Feature Selection with Principal Covariates Regression
(主共変量回帰によるサンプルと特徴の選択の改善)
https://arxiv.org/abs/2012.12253
[エグゼクティブサマリー]
主共変量回帰法(PCovR)に触発されて、特徴行列の低ランク近似に基づくCUR分解と、サンプルや特徴量の多様性を最大化する最遠ポイントサンプリング(FPS)を採用した教師なし学習に、回帰目標の特徴選択を組み合わせたものの提案。サンプル数を半減しても所定精度を維持。PCov-CUR または PCov-FPS の実装あり(https://github.com/cosmo-epfl/scikit-cosmo)。


[kwh_rd100のコメント]
シンプルなPCov-FPSとPCov-CUR、非線形性を組み込むための拡張性を、大幅な精度低下なしで実現しており、様々な回帰のユースケースに適用可能な点が魅力。代表的な応用例として、分子や物質の原子スケールについて議論しているのでイメージを把握しやすい。
2021年01月-前半 注目論文②
2)Machine Learning-Based Model Selection and Parameter Estimation from Kinetic Data
of Complex First-Order Reaction Systems
(複雑な一次反応システムの速度論データからの機械学習ベースのモデル選択とパラメータ推定)
https://doi.org/10.26434/chemrxiv.13483335.v1
[エグゼクティブサマリー]
厳密な理論的条件を満たすか否かに関係なく、高度な統計手法(グループエラスティックネット等)を適用して、実験者の観点から、少数のパラメーターで動力学を記述できる適切なモデルを構築した。バクテリオロドプシン光サイクルの速度論パラメーター等の再現にて性能実証。

[kwh_rd100のコメント]
分光法データの分析において、一般的とされているグローバル多指数フィッティングの深刻な弱点があることを示した上で、グループエラスティックネット等は多波長分光データ(シミュレーションと実験の両方)について高精度なフィッティングに成功しており、興味深い。ただし、理論的な検証は今後の課題となっていることには留意して頂きたい。
2021年01月-前半 注目論文③
3)Auto-Encoding Molecular Conformations
(分子コンフォメーションの自動エンコード)
https://arxiv.org/abs/2101.01618
[エグゼクティブサマリー]
与えられた分子グラフ(立体配座)内の原子の離散的な空間配置を、連続的な固定サイズの潜在表現に変換し、確率モデルトレーニングにより、エネルギー的に好ましいコンフォメーションの多様なセットを生成する。最後に、連続表現により、最適化手法を利用して、好ましい空間特性を持つコンフォメーションを持つ分子を見い出す。


[kwh_rd100のコメント]
分子の原子数や結合数に依存せず、分子の構造を固定サイズの潜在表現に変換し、確率的学習によりエネルギー的に合理的なコンフォーマーの多様なセットを生成し、最終的には分子の空間的特性に関する最適化に成功している。空間的特性の最適化過程を明示しており、応用性が高いので今後の展開が楽しみである。
さいごに
読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。