2024年11月27日
ゲノム医学研究センターの川路英哉 副センター長らの共同研究グループは、「FANTOMウェブリソースの最新アップデート-ノンコーディングRNA・シスエレメントの新データ公開-」について Nucleic Acids Research に発表しました。
当研究所 ゲノム医学研究センターの川路英哉 副センター長ら及び、理化学研究所(理研)生命医科学研究センター生命医科学大容量データ技術研究チームの信定知江研究員、粕川雄也チームリーダーの共同研究グループは、国際共同研究「FANTOM(Functional ANnoTation of Mammalian Genome)プロジェクト」の成果を基に、FANTOMウェブリソースにおけるゲノム上のノンコーディングRNA(ncRNA)[1] の機能情報の拡張と、シスエレメント[2] に関する新たなデータベース注1)を公開しました。
本研究成果は、遺伝子発現制御機構をはじめとする基礎研究に加え、疾患、薬などを対象とした生命科学分野の研究への活用が期待されます。
今回のFANTOMウェブリソースの更新では(1)iPS細胞における長鎖ncRNA[3]の機能情報、(2)クロマチン相互作用による核内長鎖ncRNAの機能情報、(3)今回新たに同定した転写活性に関わるゲノム領域であるシスエレメントの情報、について拡充されました。
本研究は、科学雑誌『Nucleic Acids Research』(2025年データベース特集号)の掲載に先立ち、オンライン版(11月27日付:日本時間11月27日)に掲載されました。
理研主導で行われている国際共同研究「FANTOM(Functional ANnoTation of Mammalian Genome)プロジェクト」は、20年以上にわたり、新しい技術を取り入れながら、ヒトやマウスを中心とした哺乳動物の大規模転写解析を行い、転写に関するさまざまなデータを提供してきました。
大規模転写解析で決定されるRNA配列には、タンパク質に翻訳されるメッセンジャーRNAや、タンパク質に翻訳されないノンコーディングRNA(ncRNA)など多様なRNAが含まれます。ncRNAのうち、特に約200塩基以上から成る長鎖ncRNA[3]は、ヒトにおいて約28,000種類が見つかっているにもかかわらず、実験的に機能が解明されているものは全体の1%もありません。近年FANTOMプロジェクトではその長鎖ncRNAの機能を明らかにすることに取り組んでおり、最近の成果として長鎖ncRNAの機能不全による遺伝子発現、形質への影響や、長鎖ncRNAのターゲット配列を報告してきました注2、3)。
また、第5期のFANTOMプロジェクト(FANTOM5)では、CAGE法[4]による転写開始点の解析から、転写制御に関わるゲノム上のプロモーター[5]やエンハンサー[5]領域を推定してきました。エンハンサー領域ではその両端において双方向に転写されるエンハンサーRNA(enhancer RNA:eRNA)の存在が知られていたため、FANTOM5ではこの双方向性のeRNAの存在を手掛かりにエンハンサー領域を決定していました。しかし近年、単方向に転写される領域を持つエンハンサーがあることが報告され、今までの解析では見過ごされているエンハンサーが存在することが考えられました。また、FANTOM5以降、第6期のFANTOMプロジェクト(FANTOM6)をはじめとして多くの新たなデータセットが報告されており、転写制御に関わるシスエレメント領域の再検討が求められていました。
FANTOMウェブリソースの更新として、最近の成果である「iPS細胞における長鎖ncRNAの機能情報」と「クロマチン相互作用による核内長鎖ncRNAの機能情報」について探索したり参照したりできるインタフェース群を開発しました注4)。これらは理研で開発された「ZENBU-Reports」というシステムを用いて開発されています(図1A)。また、解析に用いた元のデータについてはFANTOMのウェブサイト注5)から入手できます。
転写制御に関わるシスエレメント領域の再解析については、東京都医学総合研究所の川路副センター長らが開発した、CAGEデータからプロモーターとエンハンサーを同定する新たな手法を使い、FANTOM5で取得したデータに加えて、新たにFANTOM6で取得したデータや公共のデータベースから収集したデータを用いて統一的な解析を行いました。これにより、ヒトで6,298個のCAGEデータセットから447,315個のヒトのシスエレメント領域を、マウスの1,264個のCAGEデータセットから288,877個のマウスのシスエレメント領域を同定しました。
同定したシスエレメントについて、ゲノム上の位置情報に加え、発現レベルを基にした活性情報、近傍遺伝子や一塩基多型(SNP)[6]などの情報を収集し、新しい統合的なシスエレメントデータベースであるfanta.bioとして公開しました(図1B)。fanta.bioのデータは前述のサイトの他、UCSCゲノムブラウザ・データベース[7]のTrack Hub[7]を介して他の公共データと並べて閲覧することもできます。また、ChIP-Seq[8]の情報を統合したChIP-Atlasデータベース注6)と連携し、シスエレメント領域中の結合転写因子の情報が参照できます。さらに、ENCODEプロジェクト注7)で同定されたシスエレメントとの関連情報など、外部データベースの情報にもリンクしています。これらにより、fanta.bioはシスエレメントの統合的な情報を提供するデータベースになっています。
FANTOMプロジェクトは最新技術を取り込みながら、さまざまなアプローチでデータの拡充を続けており、今後もFANTOMウェブリソースを通じてその成果を公開し、転写制御に関わる研究の重要なデータリソースとして国内から世界中の研究コミュニティーへ貢献し続けられることが期待されます。
本研究成果は、ヒトやマウスの長鎖ノンコーディングRNA(ncRNA)の機能やシスエレメントの包括的な情報を広く研究コミュニティーに提供するものです。
転写制御機構の研究は疾患の解明、薬の開発などの基礎となるものであり、生命科学分野における研究への活用が大いに期待されます。
本研究は、科学技術振興機構(JST)統合化推進プログラム「統合的な転写制御データ基盤の構築(研究代表者:粕川雄也、JPMJND2202)」、日本医療研究開発機構(AMED)ゲノム創薬基盤推進研究事業「RNA標的医薬創出に資する、疾患RNA分子完全長一次構造に関するデータ基盤の構築(研究代表者:川路英哉、23kk0305024)」、同ゲノム医療実現バイオバンク利活用プログラム「先天的/後天的構造多型に着目した免疫/精神疾患病態解明に関する研究開発(研究開発代表者:寺尾知可史、21tm0424220)」「炎症性関節炎の統合ゲノミクス解析(研究開発代表者:寺尾知可史、23tm0424225)」、同免疫アレルギー疾患実用化研究事業「先天的・後天的ゲノム情報と臨床情報を用いた関節リウマチの層別化基盤の構築(研究開発代表者:寺尾知可史、23ek0410114)」による助成を受けて行われました。