分野によって計算の捉え方は全然違う

管理人は、これまでいろいろな分野の人と一緒に働いてきました。
その度に良い意味でも悪い意味でも新たな驚きがありました。
また、自分の仕事が全く理解されなくて非常に嫌な思いをしたこともあります。。。

分野が変わると計算化学に期待されることも変わってきます。
計算化学だけを専門にやって人からすると戸惑ってしまうことをお願いされることもあり、多くの点で妥協しなくてはいけません。最初の頃は、その度にストレスを感じていました。

そこで、これから共同研究を始めようと思っている方々の参考になればと思い、管理人がこれまで経験したことのごく一部を今回紹介していきたいと思います。

<注意> 今回の記事には、管理人の偏見が大量に含まれおります。

MS のソフトウェア開発者

分野が異なればデータに対する感覚も異なります。

有機化学系の研究者は当然として、生化学者にとっても構造決定といえば、NMR は最低限必要なものでしょう。

しかし、メタボロミクスなどの分野に行くと NMR なんて使いません。基本的には全て MS/MS だけで構造決定していきます。
また、MS/MS から新規化合物の構造決定をしようとしている研究者もいます(立体化学は考慮しない)。

以前 MS 用のソフトウェアを開発をしている人と話していた時に、得意気に「私も昔、自分のソフトウェアを使って MS/MS で構造を 2 つに絞り込んだ時に、計算化学を使って最後 1 つに決めたことがあります!」と言われたことがありました。

当然、管理人は計算レベルについて尋ねたのですが、返ってきた答えはまさかの PM3 でした。。。
PM3 のエネルギーで議論するのはちょっと、、、しかも MS の中って超過酷な条件だと思うし、、、と思いましたが、もう論文アクセプトされたとのことでしたので、否定はせずに、
「PM3 で細かいエネルギー差の議論をするのはあまり好ましくないと思いますよ。」
と控えめに伝えておきました。。。自分が関与していない仕事の場合、深入りは禁物です!

しかし、この方から学ぶことは多かったです。PCA 解析Deep Learning の違いを教えてくれたり、並列化プログラムの書き方を教えてくれたりしました。

さて、この分野で計算する、MS から構造を決定するというのは、データベース検索のことを意味します。なので、計算化学での”計算”というものが誤解されることもあります。構造最適化って何?構造は構造でしょ?chem spider からダウンロードすれば?と言われたこともあります。。。

理論系出身でコードを書いている人

管理人をはじめとして、Gaussian, Amber など既存のパッケージを使って計算化学を行う人も多いかと思いますが、自分で計算プログラムの開発を行っている人もいます。

管理人も、理論系出身でプログラム開発を行っている人と同じグループに所属していたことがあります。その人は、基本的には数原子の系でしか計算していませんでした。
彼がすごい良いプログラムを発表したミーティングの時に、実際の分子や化学反応で試さないの?と尋ねたことがあったのですが、興味ない、絶対にいやだ!とのことでした。。。

管理人みたいに、実際の化学反応に興味のある人もいれば、全く興味のない人もいる。
人によって興味の対象はバラバラなのだなぁと思いました。。。

de novo ゲノムアセンブリの研究者と働いた時

化学構造式が一切出てこない、完全なる生物系の人々と一緒に仕事をすると非常に戸惑います。彼らの前で研究発表をしても、まず評価されません。「ただエネルギー計算しただけでしょ?」なんて冷たい言葉をかけられることもありますし、反応機構なんて全く興味を持たれません。

また、QM 計算に対しては、非常に強い拒否反応を示します。生物系の人々は統計処理をよく使うので、根本的な考え方が異なります。”無作為” という言葉を好んで使います。QM 計算では、計算する人の主観が絶対に入りますので、どうしてこの位置に反応物を置いたのか?水分子の数はどうやって決めたのか?など、重要なこと質問してくるのですが、こちらがいくら説明しても全く聞く耳を持ってくれません。

こういう人々に QM や QM/MM の説明をいくらしたって無駄です。諦めましょう。
モンテカルロ法を使うのです。Rosetta 使いましょう!それが、こういう分野の人を黙らせるもっとも良い方法です。低分子の反応には全く興味がないので、視覚的にインパクトのある酵素反応の動画とか見せると喜びます。進化などについて語ると狂喜乱舞してくれます。

de novo ゲノムアセンブリの分野に共通することではなく、管理人が一緒に働いた人特有の問題だと思うのですが、量子化学計算のことをことごとくバカにしてくるので、非常に苦労したことを覚えています。

de novo ゲノムアセンブリは数ヶ月単位で時間がかかることもあるらしく、低分子の場合 DFT の構造最適化は 1日で終わると言うと、”簡単だね!” とバカにされます。
また、Gaussian は 数 GB 程度しかメモリ使わないと言ってもバカにされます。de novo ゲノムアセンブリでは、数 TB のメモリが必要ですし、HDD も SATA ではなく SAS にしてデータの I/O を高速化して、大きなデータを処理しています。
でも、ただの塩基の並べ替えでこんなに時間がかかるなんて明らかにコードに問題があるような、、、

しかし、嫌なことだけではなく、学ぶべき点も多かったです。この分野の人は、一つ一つの遺伝子、反応などにはそれほど時間をかけませんが、全体を俯瞰して傾向を掴む力が非常に優れていると感じました。こういう点は見習いたいと思いましたし、彼らから学んだ統計処理やグラフの作成方法などを今でもプレゼンテーションの際に使わせてもらっています。

MS/MS からの未知化合物の予測をしている研究者と働いた時

MS フラグメンテーションを計算化学を使って予測したいという要望を受けてディスカッションに赴いたことがあります。この時、Grimme が行った半経験的手法でのフラグメンテーション研究を参考として見せられました。

細かい議論をしたいのであれば、半経験ではなくもっと高いレベルで計算した方が良いと提案しました(当時、管理人は半経験的手法に嫌悪感を抱いていました。。。)が、ダメでした。
相手は数万化合物の MS を処理したいということだったので、DFT では到底処理しきれない数字なので、当然ですが。。。

この一件以降、半経験は不正確で使えないという考えはやめて、時間的なことも考えて適切なレベルを選ぶのが応用研究では重要なんだと考えを改めることにしました。

ちなみに、この人も結構バカにしてくる人で、特に NMR 計算のことを色々行ってきました。NMR 計算は、gaussian で NMR というキーワードを入力するだけで計算できると思っている方も多いと思いますが、実際には 1. コンフォメーション探索、2. 構造最適化、3. NMR 計算、4. 補正、5. 全てのコンフォマーの計算値を統計処理する、ときちんと取り組むとかなり時間がかかります。

有機合成の研究者と働いた時

実験をする人がもっとも偉くて、計算をする人は大したことない、と心の中で考えている人が多い印象です。
「ワンクリックで終わるんでしょ!」「コンピューターがすべてやっているだけで、君は何もしていない」と実際に面と向かって言われたこともあります。
これは、肉体労働者が頭脳労働者を揶揄しているのに近いと思います。

でも、労働時間だけみたらあまり変わらないんですよね。。。
数を自慢してくる人も多いと思いますが、反応の種探しで TLC 上で数百反応試す場合は除外するとして、通常の実験化学者は 1 日に数反応かけるのがやっとだと思います。カラムなどの精製作業や NMR, MS などの測定も多いと思いますし。
数だけで言ったら、怠け者の管理人でも、1 日に数百から数千個くらいは計算を投げますし、解析するためにスクリプト書いたり、結果をまとめたり、毎日忙しいです。それなのに、世の中のイメージとしては、計算化学って暇そう、なんですよねー。

また、実験と計算の二択を迫ってくる人が多いのですが、なぜそのような考え方になるのか分かりません。計算も NMR や MS や UV など、ある化学現象を解明するための一つの手法として捉えるべきだと思います。

…と、マイナスの面ばかり言ってしまいましたが、有機合成の人と働くのは非常に生産的です。反応機構の部分に興味を持ってくれる点が非常にありがたいです。生物系の人との大きな違いです。

自分と同分野の計算化学者と働いた時

もちろん、これが一番楽しい経験でした。
自分の仕事を適切に評価されているということが非常に嬉しかったです。

この TS どうやって出したの?とか、この反応機構すごいね!とか自分がポイントだと思っているところを相手もきちんと理解してくれま寿司、苦労もわかってくれます。

光学活性物質を扱っている研究者と働いた時

スペクトルなどの計算を行いましたが、当然のことながら、補正なしでは大きく実測値とズレます。ズレているから不正確と言われても、困ってしまうのですが、、、。

円錐交差点求めてくれと簡単にお願いされたことがありますが、難しいと断りました。最近でこそ、光化学の遷移状態構造探索は活発に行われていますが、当時はまだ難しかったです(参考 DOI:10.1021/acs.jctc.7b00166 )。

高分子を扱っている企業の人と会話した時

量子化学計算をやっていて困ることの一つが、職探しだと思います。タンパク質や材料を扱う計算の方が需要が多い気がしています。

以前、ある高分子を扱う企業の方と話した時、会社では有限要素法しか使わないという話を聞きました。(非常に特定の分野の企業なので、全ての企業がこれに当てはまる訳ではない。)
ラフにでも良いから短時間で概要がつかめて、実験に活かせることの方が大事なんだそうです。

QM のように何日もかかってエネルギーがわかったところで、何の足しになるんだ、、、って話です。ちなみに、既存の計算ソフトウェアなどを使って計算する訳ではなく、自分たちで全てコード書いて作るそうです。また、プログラミング言語も顧客が使いやすいもの、シェルスクリプトで書くことが多いと言っていました。実行速度重視の fortran や C/C++ などは使わないってことですね。

アカデミアなどにいると、”正確=正義” 的な価値観がありますが、実際には計算コストパフォーマンスをもっと考えないといけないということを学びました。また、実行速度の早いものではなくて、使いやすいという観点が重要なんですね。

管理人が学んだこと

ある一つの分野で長く働いていると考え方が凝り固まってしまいますが、異分野の人と一緒に働くと視野が広がります。

上手にやっていくコツは、相手のことを尊重することです。そして、短所ではなく、長所を見つけていくことが重要です。

どんな人にも欠点はあります。ダメなところを探せばいくらでも見つかりますし、「こんな基本的なことも知らない人と一緒に働くのは嫌だ」と言ってしまうのはとても簡単です。

そういったマイナスのことに時間を使うのは非常に無駄なので、お互いがより成長できるようなプラスのことに時間を使っていくことの方が生産的です。

記事中に間違い等ある場合は、コメント欄、twitter またはメールにてお知らせいただけると幸いです。

関連する記事

コメントを残す(投稿者名のみ必須)