上海交通大学は、AIを導入することで効率的かつ精密に関連機能を設計できるタンパク質設計モデルを発表しました。

robot
概要作成中

3月22日、上海交通大学の洪亮教授のチームが、タンパク質設計モデルVenusを発表しました。このチームはAIとタンパク質の設計・改造を組み合わせ、世界最大のタンパク質データセットを構築しました。このデータセットに基づいて訓練されたモデルは、タンパク質の機能を正確かつ効率的に予測・設計することができ、タンパク質の生産を「遅い試行錯誤」から「高効率の精密設計」へと変えます。

この成果は業界をリードする自動化機器と組み合わされており、産業化が実現され、タンパク質設計は従来の「複雑な科学」から現在の「簡単なエンジニアリング」へと変わりました。

洪亮チームが構築したタンパク質配列データセットVenus-Pod(Venus-Protein Outsize Dataset)には、約90億のタンパク質配列が含まれており、数億の機能ラベルを含む、世界で最もデータ規模が大きく、機能注釈ラベルが最も多いデータセットです。また、別の業界で有名なモデルであるアメリカESM-Cモデルのトレーニング用の21億のタンパク質配列の4倍のボリュームです。

このデータセットには、36.2億の陸上微生物のタンパク質配列、26.4億の海洋微生物のタンパク質配列、24.3億の抗体タンパク質配列、0.6億のウイルスタンパク質配列が含まれており、通常の地表生物から極限環境の微生物に至るまでのタンパク質配列情報をカバーしています。特に、数億の機能タグ(タンパク質が働く温度、酸性度、圧力など)が装備されています。

洪亮は、このデータセットが巨大な「タンパク質鉱山」を構成しており、人類が新しいタンパク質や生物触媒を発掘する可能性をもたらし、生物医薬品と合成生物学の急速な発展を助けると述べました。さらに、AIの大規模モデルは、膨大なデータの学習を通じて自然界のタンパク質の進化パターンを把握し、AIが優れたタンパク質製品を設計するための貴重な学習資料を提供することが期待されています。

2024年、ノーベル化学賞はGoogle DeepMindチームに授与されました。このチームはAI技術を利用して、タンパク質の配列と三次元構造の関係を正確に解析し、生物学者を50年間悩ませてきた基本的な問題を解決しました。

しかし、実際問題として、タンパク質のアミノ酸配列がわずかに変化した場合、たとえ1%の小さな変化であっても、タンパク質の全体的な構造は大きく変化していないように見えますが、その機能が低下したり、完全に失われたりする可能性があります。

言い換えれば、成功したタンパク質製品を設計するには、その三次元構造だけに注目するのではなく、その機能を成功裏に予測し設計する必要があります。

したがって、洪亮教授のチームは「新たなアプローチ」を採用し、もはやタンパク質の構造に固執せず、直接「機能予測」という最終目標に焦点を当て、複雑なタンパク質設計を需要に基づいた、少量の実験で結果を出すシンプルなプロセスに変えました。

「私たちはVenus(啓明星)シリーズのモデルを訓練しました。DeepMindチームのAlphaFoldによるタンパク質構造の予測とは異なり、このモデルは自然界のタンパク質配列の組織ルールとそれが機能との関係を学習します。そのタンパク質変異機能の予測精度は業界ランキングのトップに位置しています。」洪亮は述べた。

Venusシリーズモデルには、二つの主要な機能があります:「AI方向進化」と「AI酵素掘削」。

いわゆる「AI指向進化」とは、Venusシリーズモデルがあまり満足できないタンパク質製品のさまざまな性能を最適化し、それを「六角形の戦士」としてアプリケーションの要求を満たすことを指します。

「AI酵素掘削」とは、Venusシリーズモデルがその膨大な未知機能タンパク質データセットに基づいて、「海選超能力戦士」を行い、厳しい応用ニーズを満たす超常規機能を持つタンパク質を正確に発掘することを指します。例えば、極度の耐熱性、極度の耐酸性、極度の耐アルカリ性、極度の胃腸消化耐性などです。

これらの超常規機能を持つタンパク質は、バイオテクノロジー、医薬品開発、産業生産において巨大な応用可能性を持ち、関連分野に革新と突破をもたらすことができます。

その一方で、Venusシリーズモデルと連携した世界初の低流量大容量タンパク質発現、精製および機能検査の自動化システムは、24時間以内に100以上のタンパク質の発現、精製および検査タスクを途切れることなく完了することができ、人間の効率をほぼ10倍向上させ、研究開発プロセスにおける人力、物的資源、時間コストの投入を大幅に削減し、タンパク質工学および合成生物学の研究効率を著しく向上させます。その目的は「AIによる設計、自動化された実験」であり、研究者が煩雑な設計や実験から解放されることを目指しています。彼らはただ問題を提起するだけで、AIと自動化が問題を解決し、最終的に複雑なタンパク質科学の発見を「バカカメラ式」の簡単なプロセスに変えることができます。

現在、Venusシリーズモデルの設計によって多くのタンパク質が産業化に成功しています。

国内の成長ホルモンのリーダーである金赛薬業の単域抗体の耐アルカリ性改造の例を挙げます。タンパク質の耐アルカリ性を向上させることは常に非常に挑戦的な作業であり、洪亮チームはこのモデルを利用して少量の湿式実験のクローズドループ検証と組み合わせ、1年未満で普通の単域抗体の耐アルカリ性を4倍に向上させ、毎年金赛薬業に数千万元のコスト削減をもたらしました。この成果はすでに複数のバッチで5000リットルのスケールアップ生産を実現し、世界初の大モデルによって設計され、規模で生産されたタンパク質製品となりました。

Venusシリーズモデルのもう一つの革新的な応用は、ある体外診断企業のアルカリホスファターゼ(ALP)の改造プロジェクトです。ALPは高い安定性と感度から広く標識酵素として使用されており、その活性が高いほど、検出感度も高くなり、非常に低いバイオマーカーを検出できるようになりますが、ALPの活性を向上させることは常に課題でした。VenusシリーズモデルはALPを成功裏に最適化し、その分子活性を国際的なトップ企業の製品の3倍にまで引き上げ、超敏感な診断(心筋梗塞やアルツハイマー病など)に大きな価値をもたらしました。現在、改造されたALPは200Lスケールの大規模生産段階に入り、Venusシリーズモデルの産業転換の成功を示しています。

(出典:界面ニュース)

出典:Oriental Fortune Network

著者:界面ニュース

原文表示
内容は参考用であり、勧誘やオファーではありません。 投資、税務、または法律に関するアドバイスは提供されません。 リスク開示の詳細については、免責事項 を参照してください。
  • 報酬
  • 1
  • 共有
コメント
0/400
GateUser-488cbe78vip
· 03-24 02:31
Odailyニュース Ethena チームのメンバーは公式 Discord チャンネル内で、Season3 エアドロップの確認ページが4月の第一週に公開されることを発表しました。それ以前に、公式はSeason3 エアドロップの配分に関する詳細情報を提供する予定です。さらに、Ethena は、Season4 活動が3月24日から開始され、6ヶ月間続き9月24日まで行われることを発表しました。
返信0
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)