2021年09月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年09月後半の注目論文 BEST3 を紹介させて頂きます。

1)Big Data Mining and Classification of Intelligent Material Science Data Using Machine Learning
 (機械学習を使用したインテリジェントマテリアルサイエンスデータのビッグデータマイニングと分類)
 https://doi.org/10.3390/app11188596

2)MM-DEACON: MULTIMODAL MOLECULAR DOMAIN EMBEDDING ANALYSIS VIA CONTRASTIVE LEARNING
 (MM-Deacon:対照学習によるマルチモーダル分子ドメイン埋め込み分析)
 https://arxiv.org/abs/2109.08830

3)A hybrid framework for improving uncertainty quantifcation in deep learning-based QSAR regression modeling
 (深層学習ベースのQSAR回帰モデリングにおける不確実性の定量化を改善するための
 ハイブリッドフレームワーク)
 https://doi.org/10.1186/s13321-021-00551-x

202109-後半 注目論文①

1)Big Data Mining and Classification of Intelligent Material Science Data Using Machine Learning
 (機械学習を使用したインテリジェントマテリアルサイエンスデータのビッグデータマイニングと分類)
 https://doi.org/10.3390/app11188596

[エグゼクティブサマリー]

 Mg合金データにおける、a)材料科学データ用のMONGODBビッグデータベース作成、b)データベースから必要なデータを取得するためのデータマイニング、c)機械学習による金属強度予測の実証研究。

[kwh_rd100のコメント]

 分類 及び/又は 回帰結果を改善する余地がまだ残ってはいるものの、データ管理、ビッグデータマイニング、データ分類の3つの実装について言及されており、初心者にも役立つ。著者が予告している金属の引張特性と延性を独立した入力変数として考慮し、金属組成、処理方法、およびそれらのパラメータを予測する逆モデルの開発にも期待したい。

02109-後半 注目論文②

2)MM-DEACON: MULTIMODAL MOLECULAR DOMAIN EMBEDDING ANALYSIS VIA CONTRASTIVE LEARNING
 (MM-Deacon:対照学習によるマルチモーダル分子ドメイン埋め込み分析)
 https://arxiv.org/abs/2109.08830

[エグゼクティブサマリー]

深層学習ベースのQSAR回帰モデリングにおける不確実性の定量化を改善するためのハイブリッドフレームワーSMILES-IUPAC結合学習から得られる相互情報を、自己教師付きコントラスト損失を用いてマルチモーダル分子表現学習に利用する提案。3種類の公開データにおける分子クラスタリング、クロスモーダル分子検索、薬物類似性評価、薬物相互作用で性能実証。

[kwh_rd100のコメント]

SMILESとIUPACの文字列符号化には、多頭の自己保持層を持つトランスフォーマー・エンコーダを利用しており、PubChemの1,000万個の分子を用いて学習している。斬新な手法ではないものの、丁寧な検証がなされているのが素晴らしい。実装の公開、大規模なデータセットでの性能実証にかかる続報が待ち遠しい。

02109-後半 注目論文③

3)A hybrid framework for improving uncertainty quantifcation in deep learning-based QSAR regression modeling
 (深層学習ベースのQSAR回帰モデリングにおける不確実性の定量化を改善するための
 ハイブリッドフレームワーク)
 https://doi.org/10.1186/s13321-021-00551-x

[エグゼクティブサマリー]

距離ベースのアプローチとベイズアプローチの両方を事後キャリブレーションと組み合わせて、QSAR(定量的構造活性相関)回帰モデリングの不確実性の定量化改善に向けたコンセンサス戦略の提案。実装あり。https://github.com/wangdingyan/HybridUQ

[kwh_rd100のコメント]

不確実性の定量化に、検証セットの加重平均事後キャリブレーションの両方が、有用であることを示唆したことが素晴らしい。実装も公開されており、追試は容易である。既存のベイズ不確実性定量化アプローチで効果的に使用できる事前分布への化学空間距離情報の変換についての続報にも期待が集まる。

さいごに

読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitterまたはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)