[出典] Large-Scale Analyses of Human Microbiomes Reveal Thousands of Small, Novel Genes. Sberro H [..] Bhatt AS. Cell. 2019 Aug 22;178(5):1245-1259.e14. Online 2019 Aug 8. (bioRxiv 2018-12-13); PREVIEW Tiny Hidden Genes within Our Microbiome. Mittelman K, Burstein D. Cell. 2019-08-22

背景
  • 従来のバクテリアゲノムのアノテーションでは無視されてきた短いORF (smORFsまたはsORFs)について、近年、それに由来する短いペプチド (smORF-encoded peptides: SEPs)が存在し、かつ、機能を帯びているとするデータが蓄積され始めた [1]
  • Stanford Universityを主とする研究グループは今回、50アミノ酸以下の大きさのタンパク質をコードするsORFsに注目し、それに由来する小型タンパク質 (以下、sPRO)とその機能をin silico解析した。
sORFsファミリーの検出と新奇性
  • NIH Human Microbiome Project (HMP)のデータセットから、健常人236人の4ヶ所の部位 (口腔; 皮膚; 腸; 膣)に由来する1,773種類のヒトメタゲノムを獲得し、MetaProdigal [2]を利用して15 bp以上のORFを同定した上で50アミノ酸に相当する長さを超えるORFsを除く2,514,099 sORFsを得た。これらを翻訳したアミノ酸配列をCD-HIT解析したところ444,054種類のクラスターに分類された。この中で、Conserved Domain Database (CDD) に基づいて既知ドメインを割り当てることができたのは、わずかに2,225 (~0.5%)クラスタであった。
  • そこで、膨大なクラスターから、8種類以上のDNA配列を含む11,715クラスタについてRNAcodeによる解析を経て、タンパク質らしい (more likely to be protein-coding)4,539ファミリーへと絞り込んだ。このクラスタに属するsPROの91%にはリボソーム結合サイト (RBS)を帯びているが、CCDドメインを割り当てることができたのは190ファミリー (~4%)に止まった。また、4,539のsPROファミリーの代表配列のうち、RefSeqのバクテリアゲノム69,681種類においてタンパク質とアノテーションが付されている50アミノ酸以下と相同な配列は1,149件 (~25%)に止まった。RefSeqを著者らのパイプラインで再アノテーションした上でホモログを検索し直したが、2,164件 (~48%)にはホモログが存在しなかった。
転写と翻訳の裏付け
  • 226件の公開されているヒト糞便メタトランスクリプトームのデータセットと照合し、689のsPROファミリーについてホモログを見出し、そのうち518ファミリーに実際に転写されるホモログが少なくとも一つ存在することを見出した。
  • 続いて、2件の公開メタプロテオームのデータセットに、25種類のsPROファミリーを見出した。そのうち、Bacteroides thetaiotaomicronイタの35 sORFsに焦点を絞り、リボソームプロファイリング (Ribo-seq)から35 sORFsのうち14 sORFs (40%)が実際に翻訳され、質量分析プロテオミクスからは10%が翻訳されるとする結果を得た。
機能推定
  • バクテリアに限らず、ウイルス、アーケアおよび真核生物とのゲノム・メタゲノムの比較解析から、各sORF/sPROファミリーについて、翻訳や遺伝子発現調節などのハウスキーピング、タンパク質輸送、ファージ抵抗性、ストレス応答、薬剤抵抗性、クオラムセンシング、他のバクテリアに対する抗菌性などの機能を推定した。
参考文献
  1. In Search of Lost Small Peptides. Plaza S, Menschaert G, Payre F. Annu Rev Cell Dev Biol. 2017 Oct 6;33:391-416.
  2. Gene and translation initiation site prediction in metagenomic sequences. Hyatt D, LoCascio PF, Hauser LJ, Uberbacher EC. Bioinformatics. 2012 Sep 1;28(17):2223-30. Online 2012-07-12.