Rosetta を用いた非極性分子の Docking Simulation

Rosetta はワシントン大学の David Baker らの開発したタンパク質モデリングソフトです。人工酵素のデザインや膜タンパクの設計など、ここでは書ききれないほど数々の計算にて活躍してきています(参考文献 1-6)。数ヶ月に一度 NatureScience に Rosetta を利用した成果が出るのが定期となっています。

今回の記事では、Rosetta を用いた非極性分子の Docking Simulation についてご紹介します。彼らが発表している NatureScience の論文に比べると若干インパクトに劣りますが、非常に革新的な方法です。

通常、Docking Simulation は基質タンパク質間の水素結合などの強い相互作用を足がかりに行われます。しかし、基質と活性部位が共に疎水性の場合、精度の高い Docking Simulation を行うのは困難とされて来ました。

これは、計算化学だけの問題でなく実験的にも問題でした。例えば、テルペン環化酵素では、酵素生成物との共結晶を測定すると、いろんな入り方をした共結晶が取れてしまうという例が報告されています(参考文献)。

このような問題を解決するのが、今回紹介する TEOdock 法です。

これまでの問題点

基質–タンパク質間に強い相互作用が無い場合には、Docking Simulation が難しいということは、以前から知られておりました。例えば、AutoDock ではいくつかのドッキングモードの結果がランキング形式で出力されますが、実験データがない場合や水素結合がない場合などには、どの構造を “計算結果” として使うかは計算を実行する人に任されている部分が大きいです。

【参考】:ドッキングシミュレーションのやり方【AutoDock vina】

今回紹介する論文では、各反応中間体をリガンドとして Rosetta の enzyme design 機能を利用する形で Docking Simulation をするという非常に賢い手法であり、また画期的な成果を報告しております。

この成果を発表したグループの PI である Justin Siegel は、David Baker 研が 2010 年に発表した人工 Diels Alderase の筆頭著者です(参考文献 3)。

O’Brien, T. E., Bertolani, S. J., Tantillo, D. J., and Siegel, J. B. Mechanistically informed predictions of binding modes for carbocation intermediates of a sesquiterpene synthase reaction. Chemical Science 2016, 7, 4009-4015. DOI:10.1039/C6SC00635C.

概要

Scheme 1

セスキテルペノイドは、セスキテルペン環化酵素によって構築される多環式炭素骨格を含む、構造が多様な何千もの化合物を含む天然有機化合物群です。何十年にもわたる実験的および計算的研究により、これらの酵素は活性部位でカルボカチオンを生成し、脱プロトン化または求核攻撃によって生成物が終結されるまで一連の環化・転移反応を触媒することが明らかにされています。しかしながら、この酵素の活性部位におけるカルボカチオン中間体のドッキングモードは不明のままでした。本論文では、量子化学計算と Docking Simulation を組み合わせる方法を用いて、タバコ由来の epi-aristolochene synthase (TEAS)の酵素活性部位内でのすべての推定中間体のドッキングモードを明らかにしました。この方法によって、最初の中間体から最後の中間体を結ぶ単一の経路が特定され、TEAS の活性部位における反応中間体の史上初の高分解能モデルが提唱されました。

計算手法

今回用いられた手法は少々複雑なのので、各ステップごとに説明します。

STEP 1. 酵素を考慮しない低分子のみの DFT 計算。計算レベルは mPW1PW91/6-31+G(d,p)//B3LYP/6-31+G(d,p) で、gaussian09 で計算されています。これまで予測されていた epi-aristolochene の予想反応経路に沿って計算が行われています。

Figure 1. epi-aristolochene 生成の Energy Diagram

STEP 2. 次に spartan を用いて、各中間体のコンフォメーションライブラリーが構築されています。各中間体に対して 100 以上のコンフォマーを生成し、全て DFT 計算 (B3LYP/6-31+G(d,p)) で構造最適化・振動計算し、最安定な構造から 5 kcal/mol 以内の構造を選抜して、後の計算に用いています。

STEP 3. 続いてタンパク側の計算ですが、Docking simulation に用いるためのタンパクの結晶構造を Protein Data Bank からダウンロードしてきて、Rosetta に実装されている MD 計算 (Fast Relax) で少しほぐしています。

STEP 4. 上記で用意したコンフォメーションライブラリーとPDB ファイルを用いて Doking Simulation を行なっています。しかし、実際には Rosetta に実装されている Docking Function は使用しておらず、enzime design を使用しています。この時、constraint を設定しています。

通常、enzime design ではスコアが良くなるようにタンパク側の残基の種類を順次変更していきますが、今回のシミュレーションではアミノ酸配列は固定してあります。そのため、結果として Docking Simulation をしたことと同義になっています。(EnzDesign を Docking に用いるのは非常に賢いと思いました。)

EnzDesign では、タンパク質の残基を全てランダムに動かし、一回の計算で 数万個のリガンド−タンパク複合体の構造を得ます。

STEP 5. constraint に基づいて結果を選抜します。

constraint というのは、原子Aと原子Bの距離 or 角度 or 二面角がこの範囲内にあるという制限をかけるものです。例えば、酵素内の Mg 原子と Asp 残基の酸素原子の結合距離は 3.0 ± 0.3 Å とか結合角度は 60 ± 6 °といった制限です。constraint は、Rosetta を用いた計算全般で広く用いられています。constraint には幅を持たせるのが一般的で、だいたい ± 10% 程度です。

今回の計算では、リン酸部分と DDXXD モチーフ部分の結合の水素結合の距離の constrain と リン酸とリン酸が元々結合していた C1 部分と反応途中でリン酸が嗅覚攻撃する C3 部分に constraint が設定されています。

計算結果の scoring file には、リガンド−タンパク質間の interaction energy や constraint の score などが書いてあります。解析には python の panda を使うと大変便利です。

ランダムシミュレーションで取得した数万個の構造を constraint に基づいて filtering していくこの手法はモンテカルロシミュレーションの一種として捉えることが出来ます。計算を実行する人の主観が入りにくい手法です。

内容

計算結果は、下図のように確率 (%) で表されます。今回は、大きく分けて 9 個の Docking mode が考えられるのですが、motif 1 という docking mode が全ての中間体において有利であることがわかります。

Figure 2. Rosetta の計算結果

さらに、論文著者らは、motif 1 の全ての中間体に対して RMSD 計算を行い、もっとも酵素内で動きの少ない構造を取って来ています。これまで報告された中で、もっとも確からしいテルペン環化酵素の docking simulation です。

非常に面白いことに、反応初期段階では 3 つほどの motif にしか constraint を満たす Docking 構造は存在しないのですが、反応後期になるとほぼ全ての motif において constraint を満たす構造が得られています。

これは、反応が進行するにつれて酵素と反応中間体の親和性が下がっている状態をよく再現できていると言えます。

QM/MM 計算では、しっかりとした初期構造から計算を始めないと間違った結論に行き着いてしまうことが多々あります。実際、この種の酵素では確からしい Docking モードが分からないために、QMMM 計算の報告例が非常に少ないです。

今回紹介した Rosetta を用いた Docking 法の確立は、今後の更なる反応機構解析の足がかりにもなりますし、実験科学者にとっても多くの情報を与えてくれるものとなるでしょう。

雑感

今回紹介した TEODock法は、テルペンだけではなく、その他の疎水性化合物の Docking Dimulation に置いても非常に有用だと思います。

例えば、分子の一部分にしか極性残基がなく、その他の部分がどのような向きで活性部位に入っているか分からない場合など、今回の手法を用いることによって確からしい構造を得ることが出来ると思います。

しかし一方で、この手法は複数の中間体が必要なのではないかと思います。計算後 constraint に基づいて filtering して行く際に、やはり中間体の数が多い方が確からしさは増します。

また、constraint を設定するためには、ある程度の実験情報が必要です。今回の場合ですと、反応初期段階で脱離したリン酸基が脱プロトン化などにも関与するため、 constraint を設定しやすかったと思います。

このような計算を実行する人の主観が入りにくい Docking 手法を他の酵素・反応系にどのように応用して行くか、今後の研究に期待です!

参考文献

  1. ” De Novo Computational Design of Retro-Aldol Enzymes” Jiang, L.; Althoff, E. A.; Clemente, F. R.; Doyle, L.; Rothlisberger, D.; Zanghellini, A.; Gallaher, J. L.; Betker, J. L.; Tanaka, F.; Barbas, C. F.; Hilvert, D.; Houk, K. N.; Stoddard, B. L.; Baker, D. Science 2008, 319, 1387-1391, DOI:10.1126/science.1152692
  2. “Kemp elimination catalysts by computational enzyme design” Röthlisberger, D.; Khersonsky, O.; Wollacott, A. M.; Jiang, L.; DeChancie, J.; Betker, J.; Gallaher, J. L.; Althoff, E. A.; Zanghellini, A.; Dym, O.; Albeck, S.; Houk, K. N.; Tawfik, D. S.; Baker, D. Nature 2008, 453, 190–195, DOI:10.1038/nature06879
  3. “Computational Design of an Enzyme Catalyst for a Stereoselective Bimolecular Diels-Alder Reaction ” Siegel, J. B.; Zanghellini, A.; Lovick, H. M.; Kiss, G.; Lambert, A. R.; Clair, J. L. S.; Gallaher, J. L.; Hilvert, D.; Gelb, M. H.; Stoddard, B. L.; Houk, K. N.; Michael, F. E.; Baker, D. Science 2010, 329, 309-313, DOI:10.1126/science.1190239
  4. “Accurate computational design of multipass transmembrane proteins” Lu, P.; Min, D.; DiMaio, F.; Wei, K. Y.; Vahey, M. D.; Boyken, S. E.; Chen, Z.; Fallas, J. A.; Ueda, G.; Sheffler, W.; Mulligan, V. K.; Xu, W.; Bowie, J. U.; Baker, D. Science 2018, 359, 1042-1046, doi:10.1126/science.aaq1739.
  5. “Cryo-EM structure of the protein-conducting ERAD channel Hrd1 in complex with Hrd3” Schoebel, S.; Mi, W.; Stein, A.; Ovchinnikov, S.; Pavlovicz, R.; DiMaio, F.; Baker, D.; Chambers, M. G.; Su, H.; Li, D.; Rapoport, T. A.; Liao, M. Nature Publishing Group 2017, 548, 352-355, doi:10.1038/nature23314.
  6. “Protein structure determination using metagenome sequence data” Ovchinnikov, S.; Park, H.; Varghese, N.; Huang, P.-S.; Pavlopoulos, G. A.; Kim, D. E.; Kamisetty, H.; Kyrpides, N. C.; Baker, D. Science 2017, 355, 294–298, doi:10.1126/science.aah4043.
  7. “Predicting Productive Binding Modes for Substrates and Carbocation Intermediates in Terpene Synthases–Bornyl Diphosphate Synthase As a Representative Case.” O’Brien, T. E., Bertolani, S. J., Zhang, Y., Siegel, J. B., and Tantillo, D. J. ACS Catal.2018, 8, 3322-3330. DOI:10.1021/acscatal.8b00342

関連記事

コメントを残す(投稿者名のみ必須)