【資料1】(差替) 理研データPF ライフ委員会用0...
Transcript of 【資料1】(差替) 理研データPF ライフ委員会用0...
0
平成28年度 ライフサイエンス委員会説明資料
データプラットフォーム拠点形成事業
(理化学研究所)について
平成28年11月文部科学省 ・ 理化学研究所
資料1
データプラットフォーム拠点形成事業 平成29年度要求・要望額 : 5,734百万円(新規)
○各研究分野において、我が国発の質の高い大量の研究データが日々産生され、蓄積。これら急速に増加するビッグデータが有する価値を十分に利活用するために、AI等の手法によるデータ主導型研究の重要性が指摘されている。
○このため、特定国立研究開発法人をはじめとした国立研究開発法人において、我が国が強みを活かせるナノテク・材料、ライフサイエンス、防災分野で、膨大・高品質な研究データを利活用しやすい形で集積し、産学官で共有・解析することで、新たな価値の創出につなげるデータプラットフォーム拠点を構築。
○当該拠点において、研究データを利活用するためのシステム及びデータを解析するための体制を整備することにより、我が国のデータ主導型研究を飛躍的に発展させ、基礎から実用化研究までの新たな価値の創造を図る。
(参考1) 日本再興戦略2016: 「ナノテク・材料、地球環境分野など我が国が強みをいかせる分野においてビッグデータ等の戦略的な共有・利活用を可能にするための国際研究拠点を形成」
(参考2) 特定国立研究開発法人の役割: 「我が国のイノベーションシステムを強力に牽引する中核機関」「大学と民間企業等の橋渡し役として、オープンイノベーションの実践」 (「特定国立研究開発法人による研究開発等を促進するための基本的な方針」より)
(参考3) データ利活用が求められる分野と、これによる社会への貢献の例・ナノテク・材料分野 → 新材料開発 ・ライフサイエンス分野 → 健康予測・生命システムの理解 ・防災分野 → 地震被害把握・災害対応
事業概要
国立研究開発法人<データプラットフォーム拠点>
・質の高い研究データを蓄積。・データを利活用しやすい形で整理したデータベースを構築
・関係機関とも連携しながら、AIの手法等を用いたデータ解析システムを整備
・データ等を産学官で共有・解析し、データ主導型研究を進展
文部科学省ガバニングボードを設置し全体計画の調整、進捗状況の確認等を実施
産業界大学等
データプラットフォーム拠点を中核としたオープンイノベーション
・データの利用・共同の産業化開発 等
・データの共有・共同の基礎研究 等
基礎から実用化までのデータ主導型研究を加速し、新たな価値を創造
・AI関連プロジェクト・他府省の取組 等連携
1
大学
民間企業
国立研究開発法人を中核としたビッグデータ研究拠点の構築
○将来の成長分野であるAI技術を活用し、我が国が世界の競争に打ち勝つためには、解析に用いるAI技術の高度化のみならず、解析対象の分野において大量の高品質なデータを整備するとともに、それらを共有・解析するためのプラットフォームの構築が急務。
○国立研究開発法人等では様々な分野研究を通じて膨大・高品質なデータを蓄積しており、これらを産学官で活用し、新たな価値の創造につながる解析を行うことができるプラットフォームを構築することで、データ解析による新材料設計や生命システムの理解、個人の健康予測、防災技術開発等を強力に推進。
総務省・経産省との連携による人工知能基盤技術の中核的な
研究センター
理研AIPセンター
論文
計測デ-タ
産学官協働によりビッグデータから
新たな価値を創出 !!
データ提供
共同研究
NIED防災分野
実B
収 集加
工
解解
析 ・ 釈
試
験
作
D
化
・
・
NIMSナノ・材料分野
解解析 釈・
収 集加
工
試
験
実
作
・
D
化
B
RIKENQST/AMED
ライフ健康・医療分野
収集 加工
解 解析釈
確
験実
認 D
化
B
国立研究開発法人
ポ イ ン ト
○ライフ・健康・医療、ナノ・材料、防災の各分野で中核となるデータプラットフォームを5年で構築。
○各プラットフォームはデータ取得からデータベース化、解析にいたる各段階で理研AIPセンターの革新的技術を活用することにより相互に連携。
○大学等研究機関及び民間企業等と共同研究契約を結び、双方のデータを利用して新たな価値を創出。
○共同研究相手の意向に応じてオープン・クローズ・シェアを検討。
○公開可能なデータベースについては広く利活用に供する。
○例えば、次世代の材料開発の起爆剤となるアプリケーションを産学官連携のもとで開発し、提供。
2
健康・医療及びライフサイエンス統合型プラットフォームについて(理化学研究所)
健康の予測医療情報の計測(センサー)
分子~細胞~個体の多階層の生命現象をリアルタイムで統合し精緻な生体の精緻な予測や制御を可能とするインフォマティクス基盤を構築。ライフサイエンス研究の発展への貢献と、医療への貢献等を実施。
理研等が保有するタンパク質やケミカルバイオロジー等のデータと、製薬企業等が保有する基礎研究から臨床試験にいたる創薬関連の多種多様なデータや医療機関等が保有する臨床データとを統合したプラットフォームを整備。これらを用いて創薬の最適プロセスを提案するシステムを構築する。
介入の最適化
連携する医療機関から集められ匿名化された医療データ(バイオマーカー等)の構造化・意味づけを行う。併せて機械学習等を応用しバイオマーカー等から疾患の予測を可能とする推論モデルを提供する。
医療機関の医療データ
SSBD、タンパク質DB、化合物DB、オミクスDB 等
これまでのライフサイエンス等で蓄積されたデータ
層別化された臨床情報等
制御分子のデザイン等
疾患メカニズム、疾患モデル
疾患メカニズム、創薬ターゲット分子
制御分子のデザイン、細胞内反応予測モデル
臨床情報の時系列データ、病態推移モデル
健康・医療多層統合プラットフォーム
医薬プロセス最適化プラットフォーム
細胞システム多層統合プラットフォーム
阪大、京大、慶応、東大、国立がんセンター、先端医療センター 等
যੵੴચ؞५ঃ॥থ
健康・医療及びライフサイエンス分野を中心として、理研は日本最先端の研究・分析基盤を有しており、種々の研究データを日々産生。また、日本国内の研究データベースのハブとしての機能も有し、理研内外から最新の研究データが蓄積。
急速に増加するデータは人の認知限界を超えており、ビッグデータに含まれる情報を十分に利活用出来ていない状況にある。データ利活用のためには、人工知能・機械学習・データ同化及び数理・理論科学の手法が重要であり、理研にはそのための優れた研究基盤・体制(AIPセンター、iTHES)が整備されている。
理研はこれらビッグデータ及びその利活用技術基盤を同時に有する唯一の総合研究機関として、産学官が結集したビッグデータ利活用プラットフォームを構築するとともに、トップレベルのデータサイエンティストを育成する。まずは、理研が既にデータベース構築やデータ利活用の取組を進めている、健康・医療、ライフサイエンス分野の研究開発を促進し、予防医療の実現や、ライフサイエンス研究の飛躍的進展を目指す。
匿名化等
生命現象の本質的な理解
桜田一洋 奥野恭史
大浪修一
ਯ৶؞৶
平成29年度要求・要望額 : 2,500百万円(新規)
3
理化学研究所 健康・医療多層統合プラットフォーム
バイオマーカー、疾患形態、環境情報等のデータを構造化
健康・医療多層統合プラットフォーム
医療機関・大学病院・製薬企業・診断会社等と連携(理研のハブ機能)
(現状の提携先)大阪大学慶応義塾大学慈恵会医科大学東京大学 他
機械学習や情報幾何学等の手法を用い、マルチオミックスデータから個人の疾患形態や健康状態を予測するモデルを開発・構築
○疾患モデル動物を用いた研究等により、モデルの有効性の確認や疾患メカニズム解析を実施
解析に用いる臨床データ等は匿名化され医療機関から理研(プラットフォーム)に提供
関係機関への成果の還元
【目標】医療機関・産業界と連携し、標準化された計測手法による臨床や環境データを、人工知能・機械学習の手法を用い関連付けるモデルを開発・構築する。これにより、個別医療・個別予防(精密医療※)実現に向けたオープンプラットフォームを構築する。
【取組み内容】「人工知能」と「情報幾何学」等の技術を利用して臨床等から得られるマルチオミックスのデータを構造化・解析し、患者の変化を予測するモデル(推論アルゴリズム)を開発する。疾患領域は、免疫疾患、がん、発達障害、精神疾患の4領域とし、ライフコース全体に対して精密医療を実現する技術を開発し、社会実装を念頭においたシステムを開発する。
ライフコース
※精密医療:遺伝子多型だけではなく、オミックスなど生体分子情報を含めた膨大なデータに基づいて、患者のより精密な診断(疾患の層別化)を行い、治療や予防の確立を目指す医療
4
健康・医療多層統合プラットフォーム
1. 新しい推論の概要(情報幾何学:データ主導型推論の枠組み)
予測 = 現状態割り当て(Nowcasting) + 未来予測アルゴリズム(Forecasting)
経時的なマルチオミックスデータを取得
マルチ・モーダル・データ
次元圧縮
経時変化を多次元空間の軌跡で表現
経時変化の相同性に基づき機械学習で未来予測アルゴリズムを開発
現状態割り当て
5
2. 幾何学的(関数フリー)方法による新しい介入方法や介入標的の発見
健康・医療多層統合プラットフォーム
開発するデータ主導型解析技術① 現状態割り当て技術② 未来予測アルゴリズム③ 介入標的探索技術
医療データマルチオミックスデータ
6
健康・医療多層統合プラットフォーム
3. 健康・医療多層統合プラットフォームからの社会実装
経験のある医師によって多様な患者候補をサンプリング
マルチオミックス
解析を実施
機械学習によって
① 現状態割り振りに必要な最小マーカを特定
② 未来予測アルゴリズム開発③ 治療と予防の標的発見
健康・医療多層統合プラットフォームの研究フロー(データのVolumeよりもVarietyを重視)
本プロジェクトの波及効果1. 生命科学・医科学の基礎研究者 情報幾何学/関数フリーの手法による生命科学の枠組みの提供2. 精密医療を実現するためのエコシステムの構築
精密医療エコシステムの概要
大型の検査装置と同等の感度と精度を持ち、かつ微量計測が可能な装置を開発する。
➡ クリニックでリアルタイムで計測と推論が可能とする(エッジコンピューティング)
➡ 現場のデータによってアルゴリズムを改良する(マネージメントサーバー) 7
臨床研究
診断技術
解析技術
ソリューションの開発
大学医学部
診断会社
理化学研究所
病院、製薬企業、ヘルスケア企業
A疾患 C疾患B疾患 D疾患 E疾患
プロジェクトの運営体制:大学と企業の機密保持を担保した垂直統合オープンイノベーション
マネジメント・オフィス医療、医療情報、IT、ビジネス等に精通した専門スタッフを配置
運営アドバイザー
健康・医療多層統合プラットフォーム
4. 健康・医療多層統合プラットフォームにおけるイノベーション戦略
プロジェクトの横展開:免疫を軸にがん(がん免疫)、発達障害、精神疾患(母体免疫活性化)へ展開
が ん :東大病院、名古屋市大、がん研有明病院、川崎医大、阪大病院、京大病院等、慈恵会医科大学
免疫疾患:慶応病院、阪大病院、東大病院発達障害:九大病院、香川大病院、東北大学病院、京大病院、
広島大病院、京都府立医大等精神疾患:名大病院、広大病院、東大病院、阪大病院 等
参加企業シスメックス(株)SBX参加検討企業製薬数社化学品会社数社エレクトロ二クス数社
免疫疾患
がん 発達障害
精神疾患
がん免疫 母体免疫活性化
8
疾患分野A. 免疫疾患
➀アトピー性皮膚炎②関節炎③自己免疫疾患
B. がん④卵巣がん⑤消化器系がん
C. 発達障害⑥自閉症スペクトラム障害⑦注意欠陥多動性障害
D. 精神疾患⑧統合失調症⑨情動障害⑩認知症
理化学研究所 健康・医療多層統合プラットフォーム
健康・医療多層統合プラットフォーム
従来の慢性疾患に対する「重症化した後の治療」を「予防や早期診断・早期治療」へ転換する医療を本プロジェクトでは精密医療と称する。具体的な成果は以下の2つとなる。
① 10疾患に関して多様性を踏まえて発症動態ならびに治療効果を予測する精密医療技術を確立する。
② 精密医療を実現するためのエコシステムを開発する。
5. 定量化した成果目標(精密医療技術の開発)
患者のQOLの向上と医療費の削減を実現 9
目標機械学習とシミュレーションの両面を活用した人工知能により、創薬関連データを解析・利活用することで、基礎~臨床までの創薬プロセスの高効率化、新規医薬品等の創製に資することで、我が国の経済発展に貢献する。
取組内容理研等が有する化合物・タンパク質の構造や活性といったケミカルバイオロジーのデータ、また製薬企業や医療機関が有する非臨床のみならず臨床のデータを、活用しやすい形(機械可読化・数値化)で統合したデータプラットフォームを構築。上記プラットホームに、システムズケミカルバイオロジー、合成反応予測、制御分子デザイン、臨床・基礎のトランスレーショナル予測を可能にするシステムを実装。製薬関連企業・IT企業との連携によるオープンイノベーション型のデータプラットホーム、人工知能開発
AIによる医薬、機能性分子の効率的創成
医薬プロセス最適化統合プラットフォーム
機械学習とシミュレーションの機械学習とシミュレーションのハイブリット創薬プロセス人工知能
「京」・ポスト「京」
予測
学習
最適化
機械学習
IT企業製薬企業
各社人工知能オープンイノベーション
産学官コンソーシアムによるデータ統合、モデル共有、AI共同研究開発
10
医薬プロセス最適化統合プラットフォームの具体的内容
医薬プロセス最適化統合プラットフォーム
【蓄積するデータ】
①化合物の構造②化合物の非臨床段階での活性データ等
(化合物と各種タンパク質等との結合、細胞・動物に投与した際の効果等)③化合物の臨床段階での活性データ等
(臨床段階での化合物の効果、代謝データ、毒性データ等)④創薬ターゲットとなるタンパク質の構造や機能のデータ
【データ統合のポイント】
医薬品開発プロセスに重要な、非臨床から臨床段階にわたる上記データについて、利活用出来るよう、機械可読化(分子の構造等も数式化)した形で集積
理研○化合物の構造と非臨床段階での活性データ等
(数万エントリーを各種ライフサイエンス研究で蓄積)○タンパク質の構造データ-
(数千エントリーをタンパク3000プロジェクト等で蓄積)
○スーパーコンピューターを活用したシミュレーションで創出されるデータ
オープンリソース
○化合物の構造と活性データ等(1億エントリー以上)○タンパク質の構造・機能データ等(10万エントリー以上)
製薬業界・連携する医療機関製薬会社や医療機関が保有する○化合物の構造と非臨床、臨床段階での活性データ等
1.創薬プロセスに関連する化合物やタンパク質等の関連データを集積
2.人工知能等の手法を活用し、創薬プロセスを予測するモデルを構築医薬品等の化合物の構造
創薬ターゲットとなるタンパク質の構造
非臨床・臨床段階での活性臨床試験における代謝・毒性等
人工知能等で解析
○化合物の構造からタンパク質との相互作用、非臨床・臨床段階での活性や毒性を予測するモデルを構築
○これにより、例えば、創薬ターゲットとなるタンパク質の構造から、最も強い効果を発揮し、かつ毒性が無い化合物を自動的にデザインするシステムの開発等に発展
【本プラットフォームの意義 】
○製薬業界を含めた基礎から臨床までの創薬関連のデータを蓄積し、共有。○関係機関と連携し、本データを人工知能等の手法で解析し、治療に最適な化合物を自動的にデザインするシステム等を開発。○これにより、我が国の創薬成功確率の向上と開発費の抑制、製薬業界の国際競争力向上等に貢献。 11
ハイブリッド型人工知能と産学連携オープンイノベーション
データ生成
機械学習 シミュレーション
仮想実験
ハイブリッド型人工知能
ハイブリッド型人工知能• シミュレーションでの学習データ生成による予測精度
向上や未知空間の探索が可能• シミュレーションとの融合による特徴量の具現化や因
果推論を実現
従来型人工知能• 予測精度や探索空間が学習データの質と量に依存し
ていた。• 非線形予測モデルは特徴量の抽出が困難であり、因
果関係の推論もほぼ不可能。
ビッグデータバイオバンバイオバンク
COICOIコホート臨床DB オミクスオミクス
DBケミカルバケミカルバイオロジー
タンパクタンパク3000DB化合物DB
人工知能オープンイノベーション製薬関連企業32社、IT企業18社からなるAIコンソーシアム設立
産学コンソーシアムによるデータ共有、モデル共有、AI共同研究開発
臨床(個体)と基礎(分子)のトランスレーション予測分子から臨床に至る多種多様なDBや文献情報のAI化による臨床と基礎の橋渡しを実現 12
医薬・機能性分子の戦略的創製を実現する3つの人工知能
ターゲットタンパク探索バイオマーカー探索
疾患サンプル選択オミクス実験デザインネットワーク解析法ゲノム医療・薬理ゲノミクス予測
薬物治療最適化患者状態の推定薬効予測副作用予測体内動態予測
治験デザイン被験者スクリーニング法実臨床データからの治験推定前臨床データからの治験推定
システムズケミカルバイオロジー
ドラッグリポジショニング
開発プロセス意思決定支援、医療薬剤経済推定
臨床(個体)と基礎(分子)の橋渡し予測
低分子-タンパク質間相互作用予測中分子-タンパク質間相互作用予測タンパク質-タンパク質間相互作用予測生体反応予測作用メカニズム予測
人工制御分子デザイン低分子・中分子・高分子デザインバイオロジクス、バイオシミラー、バイオベター天然物・中分子・高分子-低分子変換
ADMET・物性予測合成反応予測
メドケムAIメドケムAI
医薬・機能性分子開発プロセスAI医薬・機能性分子開発プロセスAI 薬物治療AI薬物治療AI
新規骨格分子の自動反応設計新規合成反応経路の探索
ADMET・物性予測の総合的予測体内動態予測による薬物治療の最適化分子-細胞-動物-ヒトの橋渡し
13
製薬業界と薬剤経済が抱える課題とAIによる解決
課題1. テーマの複雑化による創薬ターゲットの枯渇
課題2. 開発成功確率の低下と開発費の高騰
• 創薬プロセス人工知能において、システムズケミカルバイオロジー、人工制御分子デザインの技術開発を行うことにより、創薬手法の新規コンセプトを創出する。
• さらに、臨床(個体)と基礎(分子)の橋渡し予測を可能にし、臨床データからのアンメットニーズの創出を目指す。
課題3. バイオ医薬等の貿易赤字と医療費の上昇• 創薬プロセス人工知能で開発するシステムズケミカ
ルバイオロジー、合成反応予測、ADMET・物性予測によって実験回数を減らし、開発費の高騰を防ぐ。
• さらに、臨床(個体)と基礎(分子)の橋渡し予測を可能にし、早期臨床開発の精度向上を図ることにより、開発成功確率の向上と開発費の抑制を目指す。
• 創薬プロセス人工知能において、バイオロジクス、バイオシミラー、バイオベターなどの人工制御分子デザインの技術開発を行うことにより、バイオ医薬の貿易赤字を解消する。さらに、バイオ医薬の低分子化を図り、医療費の抑制を目指す。
• さらに、患者状態の推定、薬効・副作用予測、体内動態予測により薬物治療の最適化を行うことで医療費の抑制を目指す。
従前の創薬関連プロジェクト(タンパク3000、スパコン「京」、IT創薬等)の限界従来プロジェクトは、タンパク質と低分子などの分子レベルの構造や活性に着目した研究しかなされておらず、ヒトの個体レベルの作用を反映した予測研究は皆無であった。本研究では、臨床情報から分子情報にいたるまでの多種多様なビッグデータを人工知能化することで、臨床(個体)と基礎(分子)の橋渡し予測を実現し、ヒトの個体レベルの作用を反映した分子デザインが可能となる。 14
目標分子から個体レベルまでの多階層のイメージングデータ、表現型データ、オミックスデータを統合し、生体内の細胞や生きている個体の状態の精緻な予測や操作を可能にする。ビッグデータの活用による最適化された研究ナビゲーションを実現し、生命科学の研究スタイルを革新するとともに、がん等の疾患の診断・治療に貢献する。
取組内容同じ臓器の細胞でも時間とともに個々に多様に変化する。しかしこれまで細胞の解析は細胞集団を用いたものが中心。一方で、近年の研究の進展等により、一細胞レベルでの計測技術・各種データ(イメージング、表現型、オミックス)が蓄積してきている。
そこで、細胞の特徴量を指標に人工知能・機械学習の手法によって層別化する技術を開発することで、身体内の細胞や試験管内の細胞の状態を定量的に表現し予測するシステムを構築。これにより、細胞レベルでの秩序形成の原理を明らかにする。
さらに、分子~細胞~個体を統合する研究を進めることで、生命科学研究の革新を起こすとともに、例えばがんの診断・予防や、移植細胞・組織の高品質化など、革新的な医療応用に貢献する。
生命科学の革新
バイオインフォマティクスPF
大阪大東京大 京都大 神戸大
企業人材育成プラットフォーム
分子〜細胞〜個体
細胞〜個体
オミックスデータ
表現型データ
分子〜細胞〜個体
統合AI、機械学習
細胞・個体の状態の予測・操作を可能に
イメージングデータ
医薬プロセス最適化統合
PF
健康医療多層型統合
PF
JSTライフサイエンスデータベース統合推進事業
PDBj, KEGG etc…
先駆的ITインフラ ITにより最適化された研究ナビゲーション
QBiC大浪修一
JSTライフサイエンスデータベース統合推進事業「生命動態情報と細胞・発生画像情報の統合データベース」研究代表者(平成24年〜)
JST CRESTビッグデータ応用「データ駆動型解析による多細胞生物の発生メカニズムの解明」研究代表者 (医薬品、農業、バイオ等)
細胞イメージングと一細胞オミックスの相関を利用した細胞分化の解明ライブイメージングを利用したオミックスの時空間計測を実現。例えば、ヒトの認知能力では難しい初期がんの早期発見に貢献。
細胞の品質評価法の開発と操作技術の開発ライブイメージング画像の僅かな違いを機械学習により判別し、細胞の品質評価法の開発に貢献。例えば、体外受精卵、移植用人工組織・臓器等に応用。
イメージング、表現型、オミックス情報を統合した個体・器官発生のモデル化ビッグデータの機械学習によりオミックス動態と細胞動態の相互作用を解明。次世代型の発生の統合的理解を実現。
我が国の生命科学におけるオープンサイエンス、データ主導型サイエンスを先導
細胞システム多層統合プラットフォーム
15
細胞システム多層統合プラットフォームの具体的内容
理研
○細胞等の動態イメージングデータ(約6700万エントリー)○画像イメージングデータ(200万エントリー)○マウス表現型データ(50万エントリー)○オミックスデータ(10万エントリー)
オープンリソース等○細胞等の動態イメージングデータ(600万エントリー以上)○画像イメージングデータ(200万エントリー以上)○マウス表現型データ(4300万エントリー以上)
1.分子~細胞~個体に至るイメージング、オミックス、表現型の生命情報データを集積
2.人工知能・機械学習の手法を用い、身体内や試験管内の細胞の状態を定量的に表現し予測するシステムを構築
人工知能等で解析
○細胞等の画像データから細胞の状態や遺伝子発現状態を推測するシステムを構築
○これにより、生命科学研究の次世代の基盤技術となるだけでなく、例えば、体外受精卵や移植用人工組織・臓器の品質評価、初期がんの早期発見などの革新的な医療法が実現できる。
【本プラットフォームの意義 】
○内外の分子~細胞~個体に至る各種データを機械可読化の状態で集積し、使いやすい形で公開。○本データを人工知能等の手法で解析し、データ統合により細胞等の画像データから細胞の状態を精緻に認識するシステムを開発。○これにより、生命科学研究の進展や、移植組織・細胞の品質向上、初期がんの早期発見等につながる。
○ヒト疾患オミックスデータ(東大) 等連携
細胞システム多層統合プラットフォーム
【蓄積するデータ】
① 分子~細胞~個体に至るイメージングデータ
② 1細胞〜個体に至るオミックスデータ(細胞の状態)
③ 分子〜個体に至る表現型データ
【データ統合のポイント】
超解像ライブイメージングと1細胞オミクスの同時計測システム
などの最先端計測技術を用いてデータ統合に適した条件で取得
したデータを活用し、多階層データを統合し、機械可読化の状態
で公開する。
1細胞〜個体に至るオミックスデータ
分子〜個体に至る表現型データ
分子~細胞~個体に至るイメージングデータ
統合に適した条件で取得したデータ
理研は、イメージング・オミックスに関する国内外のデータベースネットワークの拠点を担っている。
16
細胞や個体の状態の精緻な予測と操作を実現する3つのシステム
1. 細胞の画像から細胞のオミックス状態を推定するシステム
2. 細胞の画像から細胞の品質を評価するシステム
3. イメージング、オミックス、表現型情報から生命システムの機構を推定するシステム
• 超解像ライブイメージングデータから、細胞のオミックス状態(トランスクリプトーム、エピゲノム)を推定するシステム。
• 細胞のオミクス状態の時空間計測を実現。
• 無染色・非侵襲イメージングデータから、細胞の状態、品質を推定するシステム。
• 人体に移植する細胞や組織の客観的かつ高感度、高スループットな品質評価を実現。
• ライブイメージングデータとオミクスデータ、表現型データを統合し、生命動態の数理モデルを構築するシステム。
• 組織発生や細胞活動への操作の効果の定量的な予測を実現。
細胞核の超解像イメージング
一細胞トランスクリプトーム
相関
機械学習
成人T細胞白血病診断システム
ATLの血液画像からATLの病状、病型をエピゲノム異常に基づいて診断するシステム
クローナル増殖
感染細胞
エピゲノム異
常
キャリア感染 発症
無染色・非侵襲イメージング
相関
培養結果移植結果
機械学習
体外受精卵の品質評価システム体外受精の成功率の改善
4D全細胞ライブイメージング
多階層のオミックスデータ
統合
機械学習因果推論
オルガノイドの発生の統合モデル
→細胞システムの理解に基づいた医療、創薬17
ライフサイエンスデータの統合の実現に向けて
細胞システム多層統合プラットフォーム
JSTライフサイエンスデータベース統合化推進プログラム
国内外に散在しているデータやデータベースを統合し、誰もが自由に活用できるようにすることを目的とする。これまでに、生物種やプロジェクト毎に整備されたデータの横断検索を実現。
分子から細胞、個体に至るイメージングデータ、表現型データ、オミックスデータを、データ統合による生体の精緻な予測や制御に適した条件で大規模に蓄積し、機械可読化して使いやすい形で公開。
脳科学
蛋白質 植物 コホート
微生物
糖鎖
医薬品
バイオイメージ
フェノーム
多階層オミックスゲノム
メタボローム
統合に適したデータを用いた統合
細胞システム多層統合PFのデータを核に、ライフサイエンスデータの統合が進展
国内外に散在するデータの統合 18
データ主導科学とAIがもたらす未来のライフサイエンス研究
• AIのナビゲーションによる最適化された研究– 既存の全ての知識、研究データをAIに格納
• 文献情報、大規模実験データ、小規模個別研究のデータ– 最適化された研究戦略をAIが提示
• 研究目的に応じて最適な「次の一手」を提示– 新たに取得したデータに基づいた、次の最適化された研究戦略をAIが提示
• 新たに取得したデータ、新たに公開された知識、データ– AIが制御する自律的な自動研究
• 実験ロボット
これまでのライフサイエンス 未来のライフサイエンス
利用する知識とデータ 研究者が選択した限られた知識とデータ 研究者がアクセス可能な全ての知識とデータ
研究戦略の決定 人間の認知能力の範囲内で最良であると判断した戦略
全ての情報とデータに基づいて導出した理論的に最適な戦略戦略
実験 研究室毎、実験毎にバラバラな条件 標準化された実験、ロボット実験
AI
文献情報
公開データ
データベース 実験
実験計画の提案
データ
知識自動化
最適な実験
オープンデータ
データフォーマット ロボット実験
DB統合
19