2021年03月前半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年03月前半の注目論文 BEST3 を紹介させて頂きます。

1)Generative chemical transformer: attention makes neural machine learn molecular geometric 
structures via text
(生成化学変換器:アテンションにより、ニューラルマシンはテキストを介して分子の幾何学的構造を
学習します)
https://arxiv.org/abs/2103.00213
2)Chemistry-informed Macromolecule Graph Representation for Similarity Computation 
and Supervised Learning
(類似性計算と教師あり学習のための化学情報に基づく高分子グラフ表現)
https://arxiv.org/abs/2103.02565
3)Unveiling the Glass Veil: Elucidating the Optical Properties in Glasses with Interpretable 
Machine Learning
(ガラスベールの発表:解釈可能な機械学習によるガラスの光学特性の解明)
https://arxiv.org/abs/2103.03633

2021年03月-前半 注目論文①

1)Generative chemical transformer: attention makes neural machine learn molecular geometric
structures via text

(生成化学変換器:アテンションにより、ニューラルマシンはテキストを介して分子の幾何学的構造を
学習します)
https://arxiv.org/abs/2103.00213

[エグゼクティブサマリー]

NLPの分野でブレークスルーとなっているTransformer-言語モデルを条件付き変分生成器に組み込み、特定条件を満たす分子を生成するニューラルマシン(generative chemical Transformer,GCT)の提案。化学式を学習したTransformerニューラルマシンを、逆分子設計のツールとして利用している。ベンチマークにはMOSESを利用。

[kwh_rd100のコメント]

 GCTは分子サイズを制御でき、分子特性の平均絶対誤差は0.132(logP)、0.193(tPSA)、0.020(QED)、所与の潜在コード長に対するSMILESトークンの生成数の平均差は0.382と小さい。GCTはBERT40、GPT41、T542などのトランスベースのアーキテクチャにも拡張可能なことは大きな魅力。続報にも期待したい。。

2021年03月-前半 注目論文②

2)Chemistry-informed Macromolecule Graph Representation for Similarity Computation 
and Supervised Learning
(類似性計算と教師あり学習のための化学情報に基づく高分子グラフ表現)
https://arxiv.org/abs/2103.02565

[エグゼクティブサマリー]

 Tanimoto化学類似度行列を用いたグラフ編集距離(GED)とグラフカーネルによりグラフ類似度を算出し、グラフニューラルネットワークを学習させ、高分子化学空間での定量的な化学情報に基づく意思決定と反復設計を可能にした。糖鎖(グリカン)の分類タスクで性能実証。

   

[kwh_rd100のコメント]
 モノマーはノード、結合はエッジとして表現する「(比較的)シンプルなグラフ表現(NetworkXグラフ)」と、フィンガープリントやグラフ類似性などの従来表現とを上手く組合せて優秀な結果を得ている。この手法がタンパク質やDNA/RNAなどの広範な高分子への有効性が示される日が待ち遠しい。

2021年03月-前半 注目論文③

3)Unveiling the Glass Veil: Elucidating the Optical Properties in Glasses with Interpretable 
Machine Learning
(ガラスベールの発表:解釈可能な機械学習によるガラスの光学特性の解明)
https://arxiv.org/abs/2103.03633

[エグゼクティブサマリー]

 アッベ数(Vd,d線(587.6nm))と屈折率(nd)組成依存の変動予測MLモデルを10,000以上のユニークな組成を用いて学習し,SHAP(Shapely Additive exPlanations)により解釈可能化した。その結果を踏まえて、酸化物ガラスの光学特性に対する新しい組成制御に成功した。

[kwh_rd100のコメント]

SHAP値(予測した値に対して、それぞれの特徴変数がその予想にどのような影響を与えたかを算出した値)を用いて、ある特徴変数の値の増減が与える影響を可視化している。その上で、機械学習モデルを用いて開発したグラスヴェールを用いると、実験で得たパレート面を超えた新しいグラス組成の探索が可能となることを示した意義は大きい。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

2 comments

  1. いつも勉強させていただいております。そして、大変参考になる記事をありがとうございます。
    記事は非常に参考になるのですが、どうしてもPCで見た際に、左側の広告が記事文面とかぶってしまい、読むことができない部分があります。。とても惜しいので、お時間ある際に修正いただけると、とてもうれしく思います。
    これからも楽しみにしています。

管理人 へ返信する コメントをキャンセル