不完全なPDBファイルの修正方法

Share This:

X 線結晶構造解析より得られた情報により作成された PDB ファイルは、タンパク質外側のループ部分が見えないことがあります。フレキシブルなために十分な強度の回折強度が得られないためです。
このような PDB ファイルを用いて MD シミュレーションを行う場合、欠損してしまったアミノ酸残基を足す必要があります。本記事では、MODELLER を用いる方法について説明します。

MODELLER とは?

カリフォルニア大学サンフランシスコ校の Andrej Sali らによって開発されたソフトウェアです。
ホモロジー法に基づいて構造予測を行います。

実際の操作

1. まずは、pdb ファイルとその配列情報を用意してください。

2. こちらのサイトから MODELLER をダウンロードし、インストールしてください。
__init__.py
__init__.pyc
residue.py
residue.pyc
という 4 つのファイルが生成します。

3. 次にアライメント_ファイルを用意します。拡張子は .ali です。アライメント_ファイルでは、現在のアミノ酸が欠損している PDB ファイルの配列情報と、アミノ酸の欠損していないタンパク質の配列情報を書きます。書式は以下のようになります。
上に欠損しているもの、下に欠損していないものを書きます。欠損している部分は – で表します。”sequence:TvLDH:29 :A :432 : ::::” の29、432 というのは、タンパク質のアミノ酸配列の始まりの番号と終わりの番号を表しています。また、アミノ酸は全て大文字で表記します。

(注)上記の例は説明のために適当な箇所のアミノ酸を欠損させたものなので、上記の配列を用いて計算してもエラーが起きます。

4. 次に PDB ファイルを編集します。複数ドメインがある場合は、モデリングしたいサブユニット以外は削除してください。また、水分子も全て削除してください。また、アミノ酸残基以外のリガンドが含まれている場合は削除するか、アミノ酸に置き換えてください。(後述。7を参照。)
そして座標の次の行に End と書いてください。

5. 最後に実行ファイルを作成します。

重要なのは、4 箇所です。
(A) alnfile=’TvLDH-1bdmA.ali’という部分で配列情報が書かれているアライメントファイルを指定します。
(B) knowns=’1bdmA’ でPDB ファイルを指定します。拡張子は書く必要はありません。
(C) sequence=’TvLDH’ で output ファイル名を指定します。今回はTcLDH というファイル名になります。
(D) 最後に、a.ending_model = 5 でモデリングで作成する pdb ファイルの個数を指定します。通常は、複数のファイルを作成し、Ramachandran plot を作成して良いものを選びます。

6. 3,4,5 で作成した全てのファイルを同一フォルダ内に置き、”./model-single.py” と入力してモデリングを作成します。タンパク質の大きさにもよりますが、通常は 1 分以内で終わります。

以上の説明は、公式ページのオンライン・チュートリアルにも書いてあります。

7. 4 の操作でアミノ酸以外のものをアミノ酸に置き換えた場合は、元に戻す必要があります。その場合には、Amber の Leap を使います。Modeller で作成したpdbファイル中の置換したアミノ酸残基の主鎖以外の部分を削除してください(CA,C,N,O のみ残す)。この PDB ファイルと ベット作成した prep ファイルを用いることにより、leap が側鎖を自動的に置換してくれます。

参考文献

  1. B. Webb, A. Sali. Comparative Protein Structure Modeling Using Modeller. Current Protocols in Bioinformatics, John Wiley & Sons, Inc., 5.6.1-5.6.32, 2014.
  2. M.A. Marti-Renom, A. Stuart, A. Fiser, R. Sánchez, F. Melo, A. Sali. Comparative protein structure modeling of genes and genomes. Annu. Rev. Biophys. Biomol. Struct. 29, 291-325, 2000.
  3. A. Sali & T.L. Blundell. Comparative protein modelling by satisfaction of spatial restraints. J. Mol. Biol. 234, 779-815, 1993.
  4. A. Fiser, R.K. Do, & A. Sali. Modeling of loops in protein structures, Protein Science 9. 1753-1773, 2000.

関連する記事

汎関数一覧に戻る

計算手法に戻る

計算化学者一覧に戻る

書籍紹介に戻る

コメントを残す(投稿者名のみ必須)