Rosetta インストール方法

ワシントン大学の David Baker らにより開発された高分子構造のモデリングソフト Rosetta のインストール方法について簡単に書きます。

参考Rosetta の Scoring Function

Rosetta とは?

Rosetta は、高分子構造のモデリングのための包括的なソフトウェアです。Rosetta には計算モデリングとタンパク質構造解析のためのアルゴリズムが含まれており、de novo タンパク質設計酵素設計リガンドドッキング、および生物学的高分子および高分子複合体の構造予測 などを含む計算生物学の分野において顕著な科学的進歩に貢献しています。
Rosettaの開発は、ワシントン大学の David Baker 博士の研究室で構造予測ツールとして開始されましたが、その後、一般的な計算上の高分子問題を解決するために改良されました。 Rosettaの開発はワシントン大学から、政府の研究所、研究所、研究センター、パートナー企業を含む RosettaCommons へと移行しました。 Rosettaコミュニティには、以下のような目標があります。

  • 高分子相互作用の理解
  • custom molecule の設計
  • 高次構造と配列空間を探索するための効率的な方法の開発
  • 様々な生体分子表現のための広く有用な energy function の発見

Rosetta は C++ で書かれているので、C++ を読めるとエラーなどが起きた時に対処しやすいと思います。Python で書かれた PyRosetta というものも提供されています。

Rosetta 内には様々な 機能が備わっており、すべてを把握するのは困難だと思うので、自分の関係ありそうなものだけ使うのが良いと思います。

ダウンロード方法

まずは、Rosetta Commons に行き、アカウント登録をします。トップページの一番下の License & Download クリックします。Need a License? というところの下の start Here をクリックします。ここで、それぞれの目的にあった License を選び、必要事項を記入して送信すると、数時間以内にアカウント承認メールが送られてきます。そしたら、Rosetta Commons からログインし、ダウンロードページへと行きます。

管理人は、アメリカにいた時に Rosetta をダウンロードしたので、あまり時間がかかりませんでした。しかし、日本に戻ってきてから最新版の Rosetta をダウンロードを試みたところ、残り 8 時間と表示されてしまいました。

このようにダウンロードに非常に長い時間がかかる場合は、コマンドラインでダウンロードすることをお勧めします。

nohup wget --http-user="username" --http-password="password" https://www.rosettacommons.org/downloads/academic/3.10/rosetta_bin_linux_3.10_bundle.tgz &

上記のコマンドで、”username” と “password” をそれぞれ自分のアカウントのものに置き換えてください。

wget は、途中で接続が切れてしまった場合でも、続きからまたダウンロードを開始することができます。Rosetta に限らず、非常に重いファイルを海外のサーバーからダウンロードするときは、wget を使うことをお勧めします。

インストール方法

Mac の場合、圧縮ファイルのサイズは 8 GB 程度です。

その後、自分のコンピューター上で解凍しインストールします。インストール方法は、こちらのページに書いてあります。
管理人は mac を使っているので、mac でのインストール方法を書きます。

まずは、圧縮ファイルを適当な場所へと移動します。

mv rosetta_bin_mac_3.8_bundle.tgz /Users/opt

そして解凍します。

tar zxvf rosetta_bin_mac_3.8_bundle.tgz

解凍後に main にある README にbuild の仕方が書いてあります。

cd sources
./scons.py -j mode=[debug/release] [bin]

-j オプションは、何並列で build するかを意味します。
実際には、以下のように実行します。

./scons.py -j 4 mode=release bin

build が完了するまで 2 時間くらいかかると思います。計算機クラスターなどにインストールする際には、linux 版をダウンロードして、もっと並列数を上げてインストールするのが良いと思います。また、gcc ではなくて intel compiler を使った方が良いと思います。

scon 実行時に以下のようなエラーが起きる時があります。

/usr/bin/ld: cannot find -lz

このような時には、以下の library をインストールしてください。

sudo apt-get install zlib1g-dev

念のため、以下のコマンドも実行しておくと良いかもしれません。

sudo apt-get install libXi*

Note!
管理人は、Fedora25 と Fedora26 のマシーンにそれぞれインストールしようと思いましたが、Fedora25 ではうまくいったものの、Fedora26 ではエラーが起きました。これは、gcc のバージョンに依存するものと思われます。

実際に Rosetta をどのように使うかについては、今後の記事で書いていこうと思います。

参考文献

  1. J. Meiler and D. Baker, Proteins: Struct., Funct., Bioinf., 2006, 65, 538–548.
  2. A. Leaver-Fay, M. Tyka, S. M. Lewis, O. F. Lange, J. Thompson, R. Jacak, K. W. Kaufman, P. D. Renfrew, C. A. Smith, W. Sheffler, I. W. Davis, S. Cooper, A. Treuille, D. J. Mandell, F. Richter, Y.-E. A. Ban, S. J. Fleishman, J. E. Corn, D. E. Kim, S. Lyskov, M. Berrondo, S. Mentzer, Z. Popovi ́c, J. J. Havranek, J. Karanicolas, R. Das, J. Meiler, T. Kortemme, J. J. Gray, B. Kuhlman, D. Baker and P. Bradley, in Methods in Enzymology, ed. L. J. Michael and B. Ludwig, Academic Press, 2011, 487, 545–574.
  3. F. Richter, A. Leaver-Fay, S. D. Khare, S. Bjelic and D. Baker, PLoS One, 2011, 6, e19230.

関連記事

コメントを残す(投稿者名のみ必須)