Đại học Giao thông Thượng Hải công bố mô hình thiết kế protein, áp dụng AI để thiết kế các chức năng liên quan một cách hiệu quả và chính xác.

robot
Đang tạo bản tóm tắt

Vào ngày 22 tháng 3, đội ngũ của Giáo sư Hồng Lượng từ Đại học Giao thông Thượng Hải đã công bố mô hình thiết kế protein Venus. Nhóm nghiên cứu đã kết hợp AI với thiết kế và cải tiến protein, xây dựng bộ dữ liệu protein lớn nhất thế giới. Mô hình được đào tạo dựa trên bộ dữ liệu này có khả năng dự đoán và thiết kế chức năng của protein một cách chính xác và hiệu quả, biến quá trình sản xuất protein từ "thử nghiệm chậm" thành "thiết kế chính xác hiệu quả cao."

Kết quả này kết hợp với thiết bị tự động hóa hàng đầu trong ngành, đã được triển khai vào sản xuất, biến thiết kế protein từ "khoa học phức tạp" thành "kỹ thuật đơn giản".

Dữ liệu chuỗi protein Venus-Pod (Venus-Protein Outsize Dataset) do đội ngũ Hongliang xây dựng chứa gần 9 tỷ chuỗi protein, bao gồm hàng trăm triệu nhãn chức năng, là tập dữ liệu có quy mô lớn nhất toàn cầu và có nhiều nhãn chú thích chức năng nhất, đồng thời cũng là gấp 4 lần khối lượng của 2,1 tỷ chuỗi protein được sử dụng để huấn luyện mô hình nổi tiếng khác trong ngành - mô hình ESM-C của Mỹ.

Tập dữ liệu này chứa 3.62 tỷ chuỗi protein vi sinh vật trên cạn, 2.64 tỷ chuỗi protein vi sinh vật dưới biển, 2.43 tỷ chuỗi protein kháng thể, 0.06 tỷ chuỗi protein virus, bao gồm thông tin chuỗi protein từ sinh vật bề mặt thông thường đến vi sinh vật trong môi trường cực đoan, đặc biệt là hàng triệu nhãn chức năng được trang bị (nhiệt độ, độ pH, áp suất, v.v. mà protein hoạt động).

Ông Hong Liàng cho biết, tập dữ liệu này tạo thành một "mỏ protein" khổng lồ, giúp con người có khả năng khai thác protein mới hoặc chất xúc tác sinh học, thúc đẩy sự phát triển nhanh chóng của y sinh và sinh học tổng hợp; thứ hai, mô hình AI lớn có khả năng học hỏi từ lượng dữ liệu khổng lồ và nắm bắt các mô hình tiến hóa của protein trong tự nhiên, cung cấp tài liệu học tập quý giá cho việc thiết kế sản phẩm protein xuất sắc.

Vào năm 2024, Giải Nobel Hóa học được trao cho đội ngũ Google DeepMind, đội đã sử dụng công nghệ AI để phân tích chính xác mối quan hệ giữa chuỗi protein và cấu trúc ba chiều, giải quyết vấn đề cơ bản đã làm khó các nhà sinh物 học trong suốt 50 năm qua.

Tuy nhiên, một vấn đề thực tế là: nếu thay đổi một chút chuỗi axit amin của protein, ngay cả khi chỉ là sự thay đổi nhỏ 1%, cấu trúc tổng thể của protein có vẻ không xảy ra biến đổi rõ rệt, nhưng chức năng của nó rất có thể sẽ kém đi, thậm chí hoàn toàn mất đi.

Nói cách khác, để thiết kế một sản phẩm protein thành công, không chỉ cần tập trung vào cấu trúc ba chiều của nó, mà còn phải có khả năng dự đoán và thiết kế chức năng của nó một cách thành công.

Do đó, nhóm của giáo sư Hồng Lượng "khám phá một hướng đi mới", không còn bám sát vào cấu trúc của protein, mà trực tiếp nhắm tới "dự đoán chức năng" như một mục tiêu cuối cùng, biến thiết kế protein phức tạp thành một quy trình đơn giản, hướng tới nhu cầu, kết hợp với một lượng nhỏ thí nghiệm để đưa ra kết quả.

"Chúng tôi đã đào tạo các mô hình Venus (Khởi Nguyên), khác với việc dự đoán cấu trúc protein của AlphaFold từ đội ngũ DeepMind, mô hình này học các quy tắc tổ chức của chuỗi protein trong tự nhiên và mối quan hệ giữa chúng với chức năng, độ chính xác trong dự đoán chức năng của biến thể protein đứng đầu bảng xếp hạng trong ngành." Hồng Lương cho biết.

Mô hình dòng Venus có hai chức năng cốt lõi: "Tiến hóa định hướng AI" và "Khai thác enzyme AI".

"AI định hướng tiến hóa" đề cập đến việc mô hình trong系列 Venus có thể tối ưu hóa nhiều đặc tính của một sản phẩm protein không đạt yêu cầu, biến nó thành một "chiến binh lục giác" để đáp ứng nhu cầu ứng dụng.

"AI khai thác enzyme" đề cập đến các mô hình trong dòng sản phẩm Venus, dựa trên tập dữ liệu protein chức năng chưa biết khổng lồ, có thể "tìm kiếm những chiến binh siêu năng lực" để phát hiện chính xác những protein có chức năng phi thường đáp ứng các yêu cầu ứng dụng khắt khe, chẳng hạn như cực kỳ chịu nhiệt, cực kỳ chịu axit, cực kỳ chịu kiềm, cực kỳ chịu tiêu hóa đường ruột, v.v.

Các loại protein với chức năng vượt trội này có tiềm năng ứng dụng to lớn trong công nghệ sinh học, nghiên cứu và phát triển dược phẩm, cũng như trong sản xuất công nghiệp, có thể mang lại những đổi mới và đột phá cho các lĩnh vực liên quan.

Trong khi đó, kết hợp với máy tự động hóa đầu tiên trên thế giới cho việc biểu hiện, tinh chế và kiểm tra chức năng protein khối lượng lớn với lưu lượng thấp trong dòng sản phẩm Venus, có thể hoàn thành hơn 100 nhiệm vụ biểu hiện, tinh chế và kiểm tra protein liên tục trong 24 giờ, nâng cao hiệu quả gần 10 lần so với lao động thủ công, sẽ giảm đáng kể chi phí lao động, vật chất và thời gian trong quá trình nghiên cứu và phát triển, đồng thời nâng cao hiệu quả trong nghiên cứu kỹ thuật protein và sinh học tổng hợp. Mục tiêu của nó là "Thiết kế hóa AI, tự động hóa thí nghiệm", giải phóng các nhà nghiên cứu khỏi các thiết kế và thí nghiệm phức tạp, họ chỉ cần đặt ra câu hỏi, AI và tự động hóa sẽ giải quyết vấn đề, cuối cùng biến những khám phá phức tạp về protein thành một quy trình đơn giản như "máy ảnh chụp nhanh".

Hiện tại, nhiều loại protein được thiết kế theo mô hình Venus đã được đưa vào sản xuất công nghiệp.

Lấy ví dụ từ việc cải tiến độ kiềm của kháng thể đơn miền đầu ngành trong nước - Công ty TNHH Dược phẩm Jin Sai. Việc nâng cao độ kiềm của protein từ trước đến nay luôn là một công việc đầy thách thức. Nhóm của Hong Liang đã sử dụng mô hình này kết hợp với một lượng nhỏ thí nghiệm ướt để xác thực theo chu trình lặp lại, chỉ trong chưa đến một năm đã nâng cao độ kiềm của kháng thể đơn miền thông thường lên 4 lần, tiết kiệm cho Công ty TNHH Dược phẩm Jin Sai hàng triệu nhân dân tệ mỗi năm. Thành quả này đã được sản xuất quy mô lớn 5000 lít qua nhiều lô, trở thành sản phẩm protein đầu tiên trên thế giới được thiết kế bởi mô hình lớn và sản xuất quy mô.

Một ứng dụng sáng tạo khác của dòng sản phẩm Venus là dự án cải tạo enzyme phosphatase kiềm (ALP) của một công ty chẩn đoán in vitro hàng đầu. ALP được sử dụng rộng rãi làm enzyme đánh dấu nhờ vào độ ổn định và độ nhạy cao, với hoạt tính càng cao thì độ nhạy phát hiện càng lớn, cho phép phát hiện các dấu ấn sinh học ở mức độ rất thấp, nhưng việc nâng cao hoạt tính của ALP luôn là một thách thức. Dòng sản phẩm Venus đã tối ưu hóa thành công ALP, khiến hoạt tính phân tử của nó vượt xa sản phẩm của các công ty hàng đầu quốc tế gấp 3 lần, mang lại giá trị to lớn cho chẩn đoán siêu nhạy (như nhồi máu cơ tim, bệnh Alzheimer). Hiện tại, ALP đã được cải tạo đang bước vào giai đoạn sản xuất quy mô lớn 200L, đánh dấu sự chuyển giao công nghệ thành công của dòng sản phẩm Venus.

(Nguồn: Tin tức giao diện)

Nguồn: Đông Phố Tài Phú

Tác giả: Tin tức Giao diện

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • 1
  • Chia sẻ
Bình luận
0/400
GateUser-488cbe78vip
· 03-24 02:31
Tin tức Odaily Ethena đội ngũ đã thông báo trong kênh Discord chính thức rằng trang tra cứu airdrop Season3 sẽ được ra mắt vào tuần đầu tiên của tháng 4, trước đó sẽ có thêm thông tin chi tiết về phân bổ airdrop Season3. Ngoài ra, Ethena cũng thông báo rằng hoạt động Season4 sẽ bắt đầu từ ngày 24 tháng 3 và kéo dài 6 tháng đến ngày 24 tháng 9.
Trả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)