[出典] "Protein interaction networks revealed by proteome coevolution" Cong Q, Anishchenko I, Ovchinnikov S, Baker D. Science 2019 Jul 12;365(6449):185-189. Online 2019-07-11. PERSPECTIVE "Mapping global protein contacts" Vajda S, Emili A. Science 2019 Jul 12;365(6449):120-121.
背景
- タンパク質配列の中で、折り畳まれて三次元構造上で近接している残基 (アミノ酸)は、進化の過程で互いの変異を制約しあう (co-constraint)ことで共進化 (co-evolution)するという仮説のもとで [*1]、共通祖先に由来する多数のタンパク質配列の比較解析に基づく共進化アミノ酸ペアの同定から、タンパク質の構造やタンパク質複合体の構造を同定する手法が、成果を上げてきている。
- 2018年には深層学習に基づくタンパク質折りたたみ予測プログラムAlphaFoldがタンパク質予測コンテストCASPにて他を圧倒する性能を示した [*2, *3] AlphaFoldは、膨大なゲノム配列のマルチプルアライメントから出発して、タンパク質3次元上で直接相互作用するアミノ酸ペアを同定し、その結合距離と結合角度を推定していく。また、最近も、共進化仮説に基づいた網羅的変異誘発実験解析から、原子分解能に近い精度のタンパク質立体構造を再構成可能なことが報告されている [*4]。
概要
- University of WashingtonとHarvard Universityの研究グループは今回、タンパク質間での残基間の共進化確率に基づき、Escherichia coliとMycobacterium tuberculosisにおけるペアワイズPPIをプロテオームワイドで同定した。
共進化に基づくタンパク質間相互作用の判定 (原論文 Fig. 1 PPI identificaion by using coevolution参照)
- 研究グループはE. coliの全タンパク質4,262種類と40,607種類のバクテリアのゲノム配列から解析を始めた。ゲノム配列のマルチプルアライメントからオーソログタンパク質を同定し、解析に十分な数の配列データが得られるタンパク質ペア5,433,039組を選択した。同時に、PDBに登録されたE. coliタンパク質複合体を構成するタンパク質ペアからなるゴールドスタンダードのデータセットと、互いに相互作用を示唆するデータが存在しない2種類の異なる複合体から抽出したタンパク質ペアからなるネガティブデータセットを用意した。
- 続いて、莫大な計算量になる全ての残基の総当たり組み合わせに代えて、局所的な残基間の相互情報量MIを定義し、ゴールドスタンダードを基準とするdirect coupling analysis (DCA) [*5]とGREMLIN (Generative REgularized ModeLs of proteINs)により961,929組へと絞り込み、さらに、偽陽性の排除を目的として、非選択的な (多数のタンパク質と)共進化性を示す残基とタンパク質を排除し、21,818組へと絞り込んだ。さらに、2つのタンパク質間で共進化する残基間の距離を制約条件とするin silicoドッキングシミュレーションを経て、804組まで絞り込んだ。
- ここまで共進化に基づいてin silicoで推定してきたペアワイズのPPIと、酵母ツーハイブリッド法 (Y2H)、アフィニティー精製と質量分析を組み合わせた解析 (APMS)、PDBからのゴールドスタンダード、およびEcocycからのゴールドスタンダードに対してベンチマークした結果、共進化モデルがY2HやAPMSに優る精度を示すことが明らかになった。
- 一方で、共進化モデルを実行するにあたり閾値の設定などにより偽陰性と判定した可能性があることから、ウエット実験から報告されていたPPIまたは同一オペロン内のタンパク質ペアをGREMLINとドッキングシミュレーションで評価した結果残った814組を先の804組に加えたのべ1,618組を、E. coliプロテオームワイドでのペアワイズPPI (以下、共進化ペア)と判定した。
- ゴールドスタンダードとの照合の結果、共進化確率が二元複合体では確かに高いが、大きな多元複合体や核酸を含む複合体などで低くなる傾向が見られた。また、ゴールドスタンダードに見られる界面と共進化ペアから示唆された界面が整合しない事例の分析から、共進化ペアを利用することで一時的に形成される界面の予測が可能なことが示唆された。
- 強い共進化性が見られた1,618組のうち、936組は既報であり、126組についてはPDBにホモロジーモデリングのテンプレートが存在し、156組には遺伝子間相互作用が既報であった。この結果、共進化ペアの信頼性が示されたと同時に、共進化ペアによって初めて発見されたPPIは400組 (~25%)となった。
- M. tuberculosisでは、390万組みを共進化モデルに基づいて評価し、相互作用するタンパク質ペアとして667組を推定し、464組 (~69%)を新奇PPIと判定した。
参考文献と記事
- [*1] "Protein structure prediction from sequence variation" Marks DS, Hopf TA, Sander C. Nat Biotechnol. 2012-11-08.; Figure 2 Deriving folded three-dimensional structure for a target protein sequence.
- [*2] "Google’s DeepMind aces protein folding" Service RF. Sicence 2018-12-06.
- [*3] crisp_bio記事:2018-12-03 DeepMind、AlphaGo (囲碁)に続きAlphaFold (タンパク質折り畳み予測)でもトップへ
- [*4] crisp bio記事:2019-07-20 共進化モデルに基づいて、その変異が表現型に相乗的変化を与えるアミノ酸ペアの同定から、タンパク質3次元構造を再構成
- [*5] "Direct-coupling analysis of residue coevolution captures native contacts across many protein families" Morcosa F, Pagnani A [..] Onuchic JN, Hwa T, Weigt M. PNAS 2011 Dec 6;108(49):E1293-301.
コメント