計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年08月後半の注目論文 BEST3 を紹介させて頂きます。
1)Model agnostic generation of counterfactual explanations for molecules
(分子の反事実的説明のモデルにとらわれない生成)
https://doi.org/10.33774/chemrxiv-2021-4qkg8
2)Training a discrete variational autoencoder for generative chemistry and drug design
on a quantum annealer
(量子アニーラーでの生成化学とドラッグデザインのための離散変分オートエンコーダーのトレーニング)
https://arxiv.org/abs/2108.11644
3)Pairwise Difference Regression: A Machine Learning Meta-algorithm for Improved Prediction
and Uncertainty Quantification in Chemical Search
(ペアワイズ差分回帰:化学物質検索における予測と不確実性の定量化を改善するための
機械学習メタアルゴリズム
https://doi.org/10.1021/acs.jcim.1c00670
202108-後半 注目論文①
1)Model agnostic generation of counterfactual explanations for molecules
(分子の反事実的説明のモデルにとらわれない生成)
https://doi.org/10.33774/chemrxiv-2021-4qkg8
[エグゼクティブサマリー]
深層学習の予測において、STONED(MACCS)を使用してモデルにとらわれない反事実化合物を実装する。反事実条件により、追加データ等は不要ながら、予測クラスを変更するために分子内で何を変更する必要があるかを示すことにより、解釈可能性を高める。実装あり。https://github.com/ur-whitelab/exmol
[kwh_rd100のコメント]
因果推論と深層学習との融合(反実仮想&深層学習)が斬新。親和性マトリックスのPCA(基本分子との類似性)を介した計算により、反事実の周りの空間をプロットすることもできるため、モデルのバイアスを軽減しつつ、イメージを把握できる。実装ドキュメント(例示、API解説)が丁寧でありがたい。
目次
202108-後半 注目論文②
2)Training a discrete variational autoencoder for generative chemistry and drug design
on a quantum annealer
(量子アニーラーでの生成化学とドラッグデザインのための離散変分オートエンコーダのトレーニング)
https://arxiv.org/abs/2108.11644
[エグゼクティブサマリー]
制限付きボルツマンマシン(RBM)を備えた離散変分オートエンコーダ(DVAE)というハイブリッドアーキテクチャの提案。D-Waveアニーラーに適合するサイズの生物活性を有する化合物ChEMBL(サブ)データセットを学習させて、4290個の新規化学構造を生成することに成功した。

[kwh_rd100のコメント]
変分オートエンコーダの潜在変数を離散化すると潜在特徴表現の解釈性が向上することを利活用して、創薬問題に既存の量子アニーリングデバイスを使用しており、興味深い。著者は、「ハードウェアが成熟すれば、RBMは量子ボルツマンマシン(QBM)になるかも」と主張しているが、イジングのエネルギー式から導出されるボルツマン分布が前提となるボルツマンマシン(BM)よりも、量子コンピュータの振幅そのものを操作して確率分布を作るボルンマシン(量子回路ボルンマシン:QCBM)に置換した方が現実的と思える。如何でしょう。。如何でしょう。
202108-後半 注目論文③
3)Pairwise Difference Regression: A Machine Learning Meta-algorithm for Improved Prediction
and Uncertainty Quantification in Chemical Search
(ペアワイズ差分回帰:化学物質検索における予測と不確実性の定量化を改善するための
機械学習メタアルゴリズム)
https://doi.org/10.1021/acs.jcim.1c00670
[エグゼクティブサマリー]
データポイント間のペアワイズ差分回帰(PRADE)の再定式化により、ランダムフォレスト(RF)モデルベースで、最先端のニューラルネットワークと同精度を示すメタアルゴリズムの提案。金属-配位子錯体の4つのデータセットに対する5つの回帰タスクにより性能を実証した。また、アクティブラーニングにPADREを適用して、不確実性メトリックがモデルのパフォーマンスを向上させるポイントを選択する傾向があることを提示した。


[kwh_rd100のコメント]
ペアワイズ差分回帰(PADRE)が、訓練データが少ないケース、不確実性の定量化が重視されるケースの機械学習に役立つことを示しており、興味深い。疑似コードの開示に留まっているため、ハイパーパラメータの設定が悩ましいのが残念。ランダムフォレスト(RF)以外の機械学習手法を適用した場合等、適用範囲の詳細に関する続報にも期待したい。
さいごに
読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。
著者は、「ハードウェアが成熟すれば、RBMは量子ボルツマンマシン(QBM)になるかも」と主張しているが、イジングのエネルギー式から導出されるボルツマン分布が前提となるボルツマンマシン(BM)よりも、量子コンピュータの振幅そのものを操作して確率分布を作るボルンマシン(量子回路ボルンマシン:QCBM)に置換した方が現実的と思える。如何でしょう。。如何でしょう。
>まず、ブログの更新ありがとうございます
ここでは興味深い情報が毎回得られるので、更新のたびに拝見しております
当方、それらのワードについての知識がありませんでしたので調べたところ
https://blueqat.com/yuichiro_minato2/f8eb6771-d1a8-4ee4-b9f5-e6fa783e1467
のようにマシンの問題からQBMは難しいとあり、その代替案としてQCBMがありますので、QCBMのほうが現実的なのかもしれないと感じました
「匿名」さん、こんにちは。計算化学.comスタッフのKwhRd100です。
QCBMの記事紹介、ありがとうございます。当方にとっても有益な情報になりました。
今後とも、よろしくお願い申し上げます。以上です。