[出典] "The RNA Atlas expands the catalog of human non-coding RNA" Lorenz L, Chiu H-S [..] Sumazin P, Mestdagh P. Nat Biotechnol. 2021-06-17. https://doi.org/10.1038/s41587-021-00936-1; NEWS "Our knowledge about the human transcriptome is now assembled in the most comprehensive RNA-atlas ever" Ghent University. 2021-06-17. https://www.ugent.be/en/news-events/most-comprehensive-rna-atlas-ever
 Ghent UniversityにBaylor College of MedicineとIlluminaが加わった研究グループがヒト・ノンコーディングRNA (ncRNA)のアトラスを拡充したRNA Atlasと,使用したプログラムを公開した.
 データ提供サイト
R2 RNA Atlas  RNA Atlas portal
 コード提供サイト
  • https://github.com/llorenzi90/RNA_Atlas

背景と成果
 RNAシーケンシング技術により,ヒトのトランスクリプトームを1ヌクレオチドの分解能で分析することが可能になり,タンパク質をコードする遺伝子 (protein-coding genes, PCGs)の他にタンパク質をコードしない (non-codign, nc) RNAバイオタイプ (biotype http://asia.ensembl.org/info/genome/genebuild/biotypes.html)の存在が明らかにされてきた.マイクロRNA (miRNA), 長鎖遺伝子間ノンコーディングRNA (lincRNA),アンチセンスRNA (asRNA),および環状RNA (circRNA)など,数多くの制御性ncRNAが同定され,ヒトの発生や癌をはじめとする疾患に関与する候補因子として研究されてきた.
 これまでに,いくつかのコンソーシウムをベースとした解析によって,多様なサンプル・コレクションから多彩なRNAバイオタイプが発見され,定量されてきた.こうして明らかになってきたトランスクリプトームのランドスケープは,RNAのバイオロジーを研究し,遺伝子の制御機構や機能を明らかにし,ヒト疾患のバイオマーカを同定しようとする研究コミュニティーに共通の研究基盤となっている.
 しかし,これまでの研究は主としてスモールRNAやポリアデニル化RNAのトランスクプトームの解析に偏っていた.そのため,非ポリアデニル化RNAや環状RNAについては,その機能や他のRNAバイオタイプとの関係についてシスマティックな分析が進んで来なかった.
 研究グループは今回,多様なヒト・トランスクリプトームを完全に把握するために,3種類の相補的なRNAシーケンシング技術を併用して,45種類の組織,162種類の細胞型,および,93種類の細胞株をカバーするヒト・サンプル300件について,RNAバイオタイプのプロファイリングを進めた.
 すなわち,スモールRNA (298サンプル),ポリアデニル化RNA (295サンプル),およびトータルRNA (296サンプル)のライブラリを作成し,中央値でそれぞれ1,300万,6,000万,および1,250億の深さのペアエンドリード,合計1,250億リードを,決定した.
  • 非ポリアデニル化シングルエクソン遺伝子といった新たなクラスを含む数千の新規ncRNA遺伝子多くのcircRNAを発見した.
  • 3種類のRNAシーケンシングデータを統合することで,測定されたすべてのRNA転写産物について,細胞型や組織に依存する存在量,ポリAテールの有無,直鎖状か環状かを,同定した.
  • 異なる細胞型におけるRNAバイオタイプの存在量を比較解析することで,ncRNAの制御機能を示す相関関係を発見し,PCGやパスウエイの制御に関与するエビデンスが複数揃ったmiRNA 316種類とlncRNA 3,310種類を同定した.