2021年07月後半 kwh_rd100の注目論文BEST3

 計算化学.comスタッフの kwh_rd100 です。各種の計算ソフト群をツールと割り切って使う立場から、2021年07月後半の注目論文 BEST3 を紹介させて頂きます。

1)Predicting thermoelectric properties from chemical formula with explicitly identifying dopant effects
(ドーパント効果を明示的に特定して化学式から熱電特性を予測する)
https://www.nature.com/articles/s41524-021-00564-y

2)Structure-aware Interactive Graph Neural Networks for the Prediction of Protein-Ligand Binding Affinity
(タンパク質-リガンド結合親和性を予測するための構造認識インタラクティブグラフニューラルネット ワーク)
https://arxiv.org/abs/2107.10670

3)Identifying the fragment structure of the organic compounds by deeply learning the original NMR data
(オリジナルNMRデータを深く学習することにより、有機化合物のフラグメント構造を特定する)
https://arxiv.org/abs/2107.11740

202107-後半 注目論文①

1)Predicting thermoelectric properties from chemical formula
 with explicitly identifying dopant effects
 (ドーパント効果を明示的に特定して化学式から熱電特性を予測する)
  https://www.nature.com/articles/s41524-021-00564-y

[エグゼクティブサマリー]

ホスト材料とドーパントを明示的かつ独立して表現して、材料全体のドーパントの影響を特定できるDopNetの提案。化学式以外の材料に関する追加情報は不要。ドーパントしきい値が重要なハイパーパラメータ。熱電特性で性能実証。実装あり。https://github.com/ngs00/DopNet

[kwh_rd100のコメント]

 材料は少量のドーパントによって完全に異なる材料特性を持つため、ホスト材料とドーパントを明示的かつ独立に表現して、材料全体のドーパントの影響を特定するように設計されている。材料の化学式のみからドープされた材料の材料特性を正確に予測できることが驚異的である。実装も公開されており、計算時間は実用的な範囲内であるから、適用範囲に関する続報等にも期待したい。

202107-後半 注目論文②

2)Structure-aware Interactive Graph Neural Networks for the Prediction
 of Protein-Ligand Binding Affinity
 (タンパク質-リガンド結合親和性を予測するための
  構造認識インタラクティブグラフニューラルネット ワーク)
 https://arxiv.org/abs/2107.10670

「エグゼクティブサマリー]

 極性に触発されたグラフ注意層(PGAL)とペアワイズインタラクティブプーリング(PiPool)の2つのコンポーネントで構成される構造認識インタラクティブグラフニューラルネットワーク(SIGN)の提案。距離と角度の情報を統合し、相互作用行列の再構成学習タスクに加えて、適切に設計されたプーリングプロセスの導入がポイント。

[kwh_rd100のコメント]

 蛋白質とリガンドの間の長距離相互作用、特に構造に基づく結合親和性予測のために、極座標の観点からグラフニューラルネットワークを用いるアプローチは刮目に値する。2つのベンチマークにより、この提案モデル(SIGN)の有効性と汎用性が提示されているものの、実装未公開のため、追試等ができないのは残念。

202107-後半 注目論文③

3)Identifying the fragment structure of the organic compounds
 by deeply learning the original NMR data
 (オリジナルNMRデータを深く学習することにより、有機化合物のフラグメント構造を特定する)
 https://arxiv.org/abs/2107.11740

「エグゼクティブサマリー]

 距離とピークの異なる2つのサンプリング方法を用いて、RNNに基づいて、官能基を認識するモデルNMRClassの提案。一般的なモデルであるSVMやKNNよりも高性能。原理的には、官能基認識のみならず、化合物認識も可能性あり。

[kwh_rd100のコメント]

 ピークサンプリングで得たデータでRNNモデルを構築すると、ハイパーパラメータの最適化が容易であり、RNNモデルの一般化能力が向上することが報告されている。この技術は、データの不均衡問題への対応としても興味深い。

さいごに

 読者各位の計算化学ライフの更なる充実に少しでも貢献できれば嬉しいです。 記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると助かります。また、このような話題を取り上げて欲しいなどのリクエストも大歓迎です。可能な限り、前向きに対応致します。

3 comments

  1. 毎月の注目論文のリストを拝読させていただいております。
    今回は特に感激いたしました、一番初めのものがすごく有益な情報となりました。感謝いたします。
    このようなジャンルの論文は現在ホットスポットであるために論文数がとても多くかつジャーナルが散らばっている印象があり、逆に調査がしずらいと感じており、本サイトには感謝しかございません。

    また、質問なのですが。。。
    このような論文はどのように調査しているのでしょうか?
    arxive以外ではどのジャーナルで、どのようなキーワードで伺ってもよろしいでしょうか?

    1. 「質問です💦 」さん、こんにちは。計算化学.comスタッフのKwhRd100です。
      お褒めの言葉と質問ありがとうございます。

      早速ですが、ご質問「どのように調査している?」についてお答えします。
      arxive以外では、以下のサイトをほぼ毎日、参照させて頂き、Twitter(@KwhRd100)で1日1報ペースで紹介させて頂いております。
      (順不同)
       https://chemrxiv.org/engage/chemrxiv/public-dashboard
       http://feeds.feedburner.com/acs/jcisd8
       https://www.nature.com/npjcompumats/
       https://www.nature.com/commschem/
       https://onlinelibrary.wiley.com/journal/25130390
       https://jcheminf.biomedcentral.com/
       https://www.nature.com/natmachintell/
       https://onlinelibrary.wiley.com/topic/browse/000131
       https://www.mdpi.com/ (Keyword 機械学習等を適宜併用する場合もあり)

       ご承知のように、掲載雑誌が散らばっており、論文数も多く、日進月歩ならぬ秒進日歩のため、上述サイトを定期巡回し、いわゆる文献検索(2次情報検索)で「漏れ防止」をしております。
       これで、お答えになりましたでしょうか。

       万一、不具合・不都合がございましたら、遠慮されることなく、お気軽に改めてお問い合わせ頂ければと思います。
       今後とも、よろしくお願い申し上げます。以上です。

      1. kwh_rd100様、レスポンスありがとうございました。
        ジャーナル一覧には自分が知らないものもまじっており、すごく有益な情報となりました。
        感謝いたします。

        私からも、今後ともよろしくお願い申し上げます。
        以上です。

コメントを残す(投稿者名のみ必須)