Posts tagged スーパーコンピュータ

γGTPやヘモグロビン濃度、尿酸値などに関連する46個の遺伝子をゲノムワイド関連解析で一度に発見 東大と理研

[東京大学[広報・情報公開]記者発表一覧].
東京大学 医科学研究所 ヒトゲノム解析センター シークエンス技術開発分野 准教授の松田浩一氏と、理化学研究所 ゲノム医科学研究センター 副センター長 統計解析・技術開発グループ グループ・ディレクターの鎌谷直之氏らは、文部科学省リーディングプロジェクト「個人の遺伝情報に応じた医療の実現プロジェクト」の一環として、一人当たり50万箇所の遺伝的多型を「バイオバンク・ジャパン」に保存された14,700人分について決定し、データ解析した結果、20項目の血液検査と関連する、46個の新しい遺伝子を一度に発見したと発表した。

例えば、赤血球数やヘモグロビン濃度に関連する遺伝子や、白血球数、血小板数、痛風に関係する尿酸値、アルコールによる肝臓への影響に関係する γGTP、肝臓障害の指標となるアルカリフォスファターゼ(ALP)・AST(GOT)・AST(GPT)、筋肉障害や心筋梗塞の指標となるCK、蛋白質の濃度を示すTP・アルブミン、腎臓障害の指標となるBUN・クレアチニンなどに関係する遺伝子などが見つかったという。電子版ネイチャー・ジェネティクス (Nature Genetics online)に掲載された。

論文:「日本人における、多数の血液学的および生化学的形質の、ゲノムワイド関連解析(GWAS)」
(Genome-wide association study of multiple hematological and biochemical traits in a Japanese population)

研究グループは2002年に理研が開発した「ゲノムワイド関連解析(GWAS)」でゲノムデータを解析した。ヒトゲノム解析が完成したため、一本釣りのような「候補遺伝子アプローチ」から、「トロール漁法」のような「全ゲノムアプローチ」に関連遺伝子の発見手法は変化している。今回、研究グループは、それが病気だけでなく、生物の細胞、蛋白質、小分子など様々な階層に応用可能であることを示した。

この研究は、ゲノムの多様性と人間の色々な階層の多様性との関連を数学的に発見する研究だと見なすことができるという。ゲノムの多様性と、蛋白質(TP、アルブミン、Hb、およびγGTPなどの酵素)、小分子(尿酸、クレアチニン、BUNなど)、細胞数(白血球数、赤血球数など)、細胞のサイズ(MCV)などの多様性との関連を探索する。このように生命の各レベルの関連を数理的に解明することができたことは画期的な事だという。

今回の研究によりCK, BUN, γGTP, ALPなどの検査値が遺伝子によりかなり違う(ALPは99、CKは13も違う)ことが分かり、今後は遺伝子情報を基に個人ごとの検査値の基準値設定が必要となる(オーダーメイド臨床検査)のではないかという。また、疾患に関係する遺伝子と、今回の血液検査に関係する遺伝子を組み合わせることで、より正確な診断や、原因究明、更には早期発見や個別化医療(いわゆるオーダーメイド医療)が可能になるとしている。

また、今回は、14,700人分、一人当たり50万箇所の遺伝子多型を用いたデータを解析したが、更に大量のデータが出つつあり、医学や生物学において、今後、数学と高速コンピュータの重要性はさらに高まるとしている。

理研、分子1つ1つを再現する細胞シミュレーション法を開発 次世代スパコンで細胞丸ごとシミュレーションを目指す

分子1つ1つの運動まで再現する細胞シミュレーション法を開発|2010年 研究成果|独立行政法人 理化学研究所.

独立行政法人理化学研究所(理研)基幹研究所 生化学シミュレーション研究チームの高橋恒一チームリーダーとオランダの原子分子物理研究所のピーターレイン・テンウォルデ教授らは、細胞内に存在する分子1つ1つの運動まで精密に再現する細胞シミュレーションの要素技術の開発に成功したと発表した。アメリカ科学アカデミー紀要『Proceedings of the National Academy of Sciences of the United States of America: PNAS』2月9日号に掲載されるに先立ち、1月25日の週にオンライン掲載された。

新たな計算手法は「enhanced Greens Function Reaction Dynamics(eGFRD)法」と呼ばれるもので、これは、これまでは年単位で必要だった計算時間を数日以内に短縮できる計算手法だという。この新技術を国産の細胞シミュレーター「E-Cell」の次世代版に搭載し、神戸に建設中の「次世代スーパーコンピュータ」で活用することで、細胞丸ごとシミュレーションを目指すという。細胞のがん化や幹細胞の分化の予測と制御などに貢献できる成果だとしている。

従来の細胞シミュレーションでは、細胞内の分子1つ1つの運動を考慮せず、分子間の相互作用を回路図のように表現し、分子の数の増減だけを扱う「ネットワークモデル」や、細胞内の場所による平均的な濃度の違いを表現する「濃度平均場モデル」といった手法が主流だった。一方、観察技術の急速な発展で、1分子単位のゆらぎや運動が生命機能に重要な役割を果たしていることが明らかになっていた。シミュレーションにおいても生体分子1つ 1つの運動まで考慮に入れた「1分子粒度」の手法が求められていた。

しかし、従来の1分子粒度の手法である「ブラウン動力学」を用いて、細胞丸ごとの規模で精度よくシミュレーションを行うには、ごく簡単な場合でも年単位の膨大な計算量が必要だった。逆に現実的な時間で計算を終えようとすると、大きな計算誤差を許容することとなり、不正確なシミュレーションを行ってしまうのが問題とされていた。

研究グループは、細胞丸ごと規模での1分子粒度モデルを実現するために、粒子反応拡散計算手法「enhanced Greens Function Reaction Dynamics(eGFRD)法」を開発した。この手法は、ブラウン動力学法よりも飛躍的に性能が向上するだけでなく、原理的には系統誤差が生じないという優れた特性を持っているという。

従来の手法では、細胞内のすべての分子を少しずつ動かし、そのたびに分子と分子の衝突が発生するかどうかを判定し、化学反応をシミュレーションしていた(図1左)。この時、どの位置、どの時点で分子の衝突が起こるのかをいかに精密に計算できるかがシミュレーションの精度と直接関係するため、小さな時間間隔で非常に多くの計算を繰り返す必要があった。

だが「eGFRD法」では、分子を少しずつ動かすのではなく、ある分子がほかの分子に邪魔されることなく自由に動ける範囲「保護領域」を設定し、分子が保護領域に入って何秒後に抜け出るかを計算する(図1右)。そして、この計算を多数の分子に別々に(非同期に)適用する。2つの分子が近くにある時は、分子が2つ入った保護領域の中で、分子の運動と反応を一度に計算する。これにより、一度に進めることができる時間間隔を拡大させることができ、計算量が大幅に減り、飛躍的に計算時間を短縮できた。

また、分子が保護領域に入って出るまでにかかる時間(第一通過時間)や反応が起きるまでにかかる時間を、基礎物理方程式の厳密解を直接用いて計算するため、原理的には系統誤差の無いシミュレーションが可能になり、シミュレーションの精度も大幅に向上した。

図1 従来の計算手法とeGFRD法との比較。eGFRD法では、分子が自由に運動できる保護領域を設定するため、一度に大きな距離を進められる。

図1 従来の計算手法とeGFRD法との比較。eGFRD法では、分子が自由に運動できる保護領域を設定するため、一度に大きな距離を進められる。

また、研究グループは「eGFRD法」を「MAPキナーゼ(MAPK)」のシミュレーションに適用した。MAPKは、細胞表面で受容した情報を処理し、細胞核内の遺伝子発現機構に引き渡す役割を持つ細胞内情報処理分子。1つのMAPK分子は2つのリン酸化部位を持ち、その両方のリン酸化部位が「MAPキナーゼキナーゼ(MAPKK)」という酵素分子によってリン酸化(二重リン酸化)されると活性化して、下流に情報を伝える。

MAPKが情報を伝達する際には、主に「段階的応答」、「超敏感応答」、「二重安定応答」の3つの応答様式のいずれかで行うと考えられている。「段階的応答」では、細胞表面の受容体分子が受け取った信号を遺伝子発現系にそのまま受け渡す。「超敏感応答」では、受け取る信号から雑音を取り除き、オンかオフかのデジタルな信号に変換して遺伝子発現系に渡す。「二重安定応答」では、デジタル化に加え、過去の信号の種類によって現在の応答を変化させるため、MAPKは記憶素子として働くことができると考えられている。

研究グループは、MAPKの二重リン酸化を、従来の「ネットワークモデル」と、今回可能になった分子1つ1つの運動を考慮する「1分子粒度モデル」の2つの手法で計算し、結果を比較した(図2)。すると、従来のネットワークモデルが「二重安定応答」を予測するケースであっても、1分子粒度モデルではそれが消失する場合があることを発見した。

図2 MAPK系のシミュレーション(EはMAPKK、SはMAPK、Pはリン酸基)。MAPKの二重リン酸化を、空間中の分子の運動を考慮しないネットワークモデルと、空間を考慮した1分子粒度モデルで計算し、結果を比較した。

図2 MAPK系のシミュレーション(EはMAPKK、SはMAPK、Pはリン酸基)。MAPKの二重リン酸化を、空間中の分子の運動を考慮しないネットワークモデルと、空間を考慮した1分子粒度モデルで計算し、結果を比較した。

MAPKをリン酸化する酵素であるMAPKKが、1つ目のリン酸化部位をリン酸化してから、次のリン酸化部位をリン酸化することができるようになるまでには一定の時間(緩和時間)がかかる。例えば、MAPKKは、リン酸化を行うためのリン酸基をATP分子から受け取り、リン酸基を渡したATPはADPになる。MAPKKが次のリン酸化を行うためには、ADPを離し新しいATPの供給を受けなければならない。今回のシミュレーションにより、緩和時間が短い場合には、「二重安定応答」が消失することが分かった(図3)。同様に、「超敏感応答」が「段階的応答」に変化する場合があることや、刺激に対するMAPKの二重リン酸化の速度がこれまでの予測よりも速く、MAPKの拡散速度に反比例する場合があることも分かった。

従来のネットワークモデルは、生体分子1つ1つの運動を考慮せず、分子が衝突し、反応を起こす確率が均一であるとする「化学マスター方程式」理論に基づいている。今回の分子1つ1つの運動を考慮した「eGFRD法」を用いたシミュレーションにより、MAPKが情報伝達を行う「超敏感応答」や「二重安定応答」などの応答様式の発生条件が、これまでの理論とは大幅に異なる場合があることが分かった。これまで、MAPKの反応機構においては実験結果と理論とが必ずしも一致しないことが謎とされていた。今回の成果によりMAPKの反応機構の解明が一層進むことが期待できるという。

図3 MAPKシミュレーションの結果。酵素の緩和速度が速くなると、MAPKの二重安定応答が消失する場合がある(赤丸)。

図3 MAPKシミュレーションの結果。酵素の緩和速度が速くなると、MAPKの二重安定応答が消失する場合がある(赤丸)。

今回の成果により、「eGFRD法」を用いれば特定の分子にターゲットを絞れば在来の計算機でも細胞丸ごと規模でのシミュレーションが可能であることが分かった。「eGFRD法」を細胞シミュレーター「E-Cell」の次世代版に搭載し、次世代スーパーコンピュータで活用することで、細胞内に存在する多くの種類の分子の同時シミュレーションや、多数の細胞からなる組織のシミュレーションへ道を開くことになるという。

具体的には、複数の情報伝達経路同士の相互作用(クロストーク)の影響や、細胞内の分子の混み合い方(分子混雑)が及ぼす影響、また細胞同士が信号分子を交換してコミュニケーションを行う様子など、さらに高度なシミュレーションが実現する可能性がある。最終的には、細胞のがん化の機序の解明を通じて創薬へ貢献できたり、幹細胞(万能細胞)の分化の予測と制御を通じて再生医療の実現へとつなげられると期待される。

さらに、研究グループでは、この技術を有用微生物の設計に適用すれば、環境問題やエネルギー問題の解決の糸口を見いだす可能性もあるとしている。

Get Adobe Flash playerPlugin by wpburn.com wordpress themes