2020年06月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2020年 06月後半の注目論文 BEST3 を紹介させて頂きます。  

1)Transforming the Language of Life: Transformer Neural Networks for Protein Prediction Tasks
 (生命の言語を変える:タンパク質予測タスクのためのトランスフォーマーニューラルネットワーク)
 https://www.biorxiv.org/content/10.1101/2020.06.15.153643v1.full

2)Iterative Experimental Design Based on Active Machine Learning Reduces the Experimental Burden Associated with Reaction Screening
 (アクティブ機械学習に基づく反復実験計画は、反応スクリーニングに関連する実験負担を軽減します)
 https://doi.org/10.26434/chemrxiv.12465299.v1

3)Graph theory approach to determine configurations of multidentate and high coverage adsorbates for heterogeneous catalysis
 (不均一触媒作用のための多座および高被覆吸着物の構成を決定するためのグラフ理論アプローチ)
 https://www.nature.com/articles/s41524-020-0345-2

202006-後半 注目論文①

1)Transforming the Language of Life: Transformer Neural Networks for Protein Prediction Tasks
 (生命の言語を変える:タンパク質予測タスクのためのトランスフォーマーニューラルネットワーク)
 https://www.biorxiv.org/content/10.1101/2020.06.15.153643v1.full

[エグゼクティブサマリー]
 アミノ酸配列のタスクに依存しないベクトル表現を事前に訓練するための新しいフレームワーク(Protein RoBERTa)を開発。より小さな事前学習コーパスを使用でき、精度を低下させることなく、事前学習の計算効率を170倍向上させることに成功。

[kwh_rd100のコメント]
 タンパク質予測タスクのために様々なディープラーニングアプローチが登場してきたが、このアプローチならば計算上の制限や特定タスク解決に特化することなく、2つの異なる予測タスク(①タンパク質ファミリーの分類、②タンパク質相互作用の予測)を解決できるのが魅力。このアプローチ(PRoBERTa)を用いた、実用的な成功(例えば、ワクチン設計)が報告される日が待ち遠しい。

202006-後半 注目論文②

2)Iterative Experimental Design Based on Active Machine Learning Reduces the Experimental Burden Associated with Reaction Screening
 (アクティブ機械学習に基づく反復実験計画は、反応スクリーニングに関連する実験負担を軽減します)
 https://doi.org/10.26434/chemrxiv.12465299.v1

[エグゼクティブサマリー]
 不確実性サンプリングに基づく能動学習により、ハイスループット反応スクリーニング(=反応結果に対する主要な反応変数の影響を迅速に特定する)向けの大規模な実験バッチを提案するツールの提示。性能実証は、3-ブロモピリジンのレトロスペクティブ解析。

[kwh_rd100のコメント]
 高性能化の度合いはモデル化ドメイン依存であり、データセットが低収率またはゼロ収率の反応が多いような場合でも、極めて低い誤差であった。初期化に含まれる反応の数や設計について議論がないのは残念。能動学習アルゴリズムが反応スクリーニングのパラダイムを変えるべく、本手法の適用限界の見極めがなされることを願う。

202006-後半 注目論文③

3)Graph theory approach to determine configurations of multidentate and high coverage adsorbates for heterogeneous catalysis
 (不均一触媒作用のための多座および高被覆吸着物の構成を決定するためのグラフ理論アプローチ)
 https://www.nature.com/articles/s41524-020-0345-2

[エグゼクティブサマリー]
 原子スケールモデルを無向グラフ表現に変換する一般化されたPythonベースのグラフ理論アプローチ。複数の表面接触点を持つ相互作用する吸着質の豊富な組み合わせのスクリーニングを自動化することが可能。実装あり https://gitlab.com/jgreeley-group/graph-theory-surfaces

[kwh_rd100のコメント]
 不均一触媒作用の分野におけるグラフ理論の新しい利用方法。この方法ならば、中間体のタイプ(多座対単座)および考慮される触媒モデル(ステップ、テラス、および合金)に関して柔軟な対応が可能なことが最大の魅力。実装についての詳細完成が待ち遠しい。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。
 また、 このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

コメントを残す(投稿者名のみ必須)