[出典] The functional landscape of the human phosphoproteome. Ochoa D [..] Beltrao P. Nat Biotechnol. 2019-12-09. < bioRxiv. 2019-02-05
# crisrp_bio注:  (*) the phosphosite functional score; 本記事に引用したFigure 1はbioRxiv投稿版からCC  BY 4.0のライセンスで引用(Nature Biotechnolgy版と同一)

 タンパク質のリン酸化は殆どの生物過程の制御に関与する翻訳後修飾であり、その異常は疾患を引き起こす。ヒトにおけるリン酸化の全貌は解き明かされておらず、質量分析を介したリン酸化部位の同定が精力的に進められている。例えば、単独の細胞 (HeLa細胞)を対象とする"ultradeep phosphoproteome" (論文データベース)から、50,000種類を超えるリン酸化ペプチドが同定され、プロテオームの75%がリン酸化されていることが示唆され、こうした研究から同定された200,000ヶ所を超えるリン酸化部位が、PhosphoSitePlus (PSP)といったデータベースに収録されている。
 リン酸化部位の同定が進行する一方で、各部位のリン酸化の生物学的意味の解明はこれからである。リン酸化の保存性は低いとされることから、細胞のフィットネスに関与するのは一部のリン酸化であることが示唆される。そこで、保存性、位置などの特徴や変異導入実験などから、重要な機能を担っていると思われるリン酸化部位からその機能を同定する試みがされているが、プロテオーム・ワイドでの機能同定までの道は通い。

 EBI, EMBL, Gladstone Institutes/Quantitative Biosciences Instituteの英独米の研究グループは今回、機械学習によるリン酸化の生物学的意味の解明を試みた。
  • PRIDEデータベース (論文データベース)に由来する104種類のヒトの細胞型そしてまたは組織から同定されたリン酸化されているタンパク質のデータセット112種類をマニュアルで評価し、設定した品質基準を満たした6,801種類のプロテオミクス実験を再解析し、ヒトにおける119,809ヶ所のリン酸化部位を網羅したレファランス・プロテオームを構築した (再解析した結果の概要について、Figure 1引用下図参照)。in-vivo human phosphosites
  • レファランス・プロテオームでは、各リン酸化部位について、質量分析のデータ (スペクトルカウントと局在)、制御関係のデータ (キナーゼのモチーフとのマッチングなど)、構造上の環境、進化上の保存性の4種類のカテゴリーからの59種類の特徴に基づいて定義したフィットネスへの貢献を示すスコア、the phosphosite functional score (以下、PFS)、が付与されている。PFSの定義は、PSPでキュレートされタンパク質の機能制御に関与することが明らかにされている2,638ヶ所のリン酸化部位のデータをもとに、Gradient Boostingに基づく機械学習モデルに依った。
  • PFSに基づいて、LCKキナーゼ、STATS3転写因子、PTPN11ホスファターゼ、H2AFXヒストンにおいてタンパク質の機能制御に関与するリン酸化部位を正確に同定した。また、その変異が疾患をもたらすリン酸化部位の同定も可能にした。SWI/SNFクロマチン再構成複合体 (chromatin remodeling complex)のメンバーであるSMARCC2において、神経細胞分化を制御するリン酸化部位をPFSに基づいて推定し、マウスでの実験で裏付けることにも成功した。
  • Reference proteomeデータ入手先:Supplementary Tables https://www.nature.com/articles/s41587-019-0344-3#Sec30
    関連プログラム入手先: GitHub funscoR - R package for functionally scoring phosphorylation sites https://github.com/evocellnet/funscoR