La Universidad de Jiaotong de Shanghai ha publicado un modelo de diseño de proteínas, introduciendo IA para un diseño eficiente y preciso de funciones relacionadas.

robot
Generación de resúmenes en curso

El 22 de marzo, el equipo del profesor Hong Liang de la Universidad de Jiaotong de Shanghái lanzó el modelo de diseño de proteínas Venus. Este equipo combina la IA con el diseño y la modificación de proteínas, estableciendo el mayor conjunto de datos de proteínas del mundo. El modelo entrenado con este conjunto de datos puede predecir y diseñar de manera precisa y eficiente las funciones de las proteínas, transformando la producción de proteínas de "ensayo y error lento" a "diseño preciso y de alta eficiencia".

Este logro, junto con equipos de automatización líderes en la industria, ha sido industrializado, transformando el diseño de proteínas de "ciencia compleja" a "ingeniería simple".

El conjunto de datos de secuencias de proteínas Venus-Pod (Venus-Protein Outsize Dataset) establecido por el equipo Hongliang contiene cerca de 9 mil millones de secuencias de proteínas, con cientos de millones de etiquetas funcionales. Es el conjunto de datos más grande del mundo en términos de tamaño y con más etiquetas de anotación funcional, y también es cuatro veces el volumen de las 2.1 mil millones de secuencias de proteínas utilizadas para entrenar otro modelo conocido en la industria: el modelo ESM-C de EE. UU.

Este conjunto de datos contiene 3.62 mil millones de secuencias de proteínas de microorganismos terrestres, 2.64 mil millones de secuencias de proteínas de microorganismos marinos, 2.43 mil millones de secuencias de proteínas de anticuerpos y 60 millones de secuencias de proteínas virales, abarcando información de secuencias de proteínas desde organismos de superficie convencionales hasta microorganismos de ambientes extremos, especialmente con cientos de millones de etiquetas funcionales (temperatura de trabajo de las proteínas, acidez, presión, etc.).

Hongliang señaló que este conjunto de datos constituye un enorme "depósito de proteínas", lo que permite a la humanidad descubrir nuevas proteínas o biocatalizadores, impulsando el rápido desarrollo de la biomedicina y la biología sintética; además, se espera que los grandes modelos de IA, a través del aprendizaje de grandes volúmenes de datos y la comprensión de los patrones de evolución de las proteínas en la naturaleza, proporcionen valiosos materiales de aprendizaje para diseñar productos proteicos excepcionales.

En 2024, el Premio Nobel de Química fue otorgado al equipo de Google DeepMind, que utilizó tecnología de IA para desentrañar con precisión la relación entre la secuencia de proteínas y su estructura tridimensional, resolviendo un problema fundamental que había atormentado a los biólogos durante 50 años.

Sin embargo, un problema real es el siguiente: si se modifica ligeramente la secuencia de aminoácidos de una proteína, incluso un pequeño cambio del 1%, la estructura general de la proteína puede no parecer haber cambiado significativamente, pero su función probablemente se verá afectada, e incluso puede perderse por completo.

En otras palabras, para diseñar un producto de proteína exitoso, no solo se debe prestar atención a su estructura tridimensional, sino que también se debe poder predecir y diseñar con éxito su función.

Por lo tanto, el equipo del profesor Hongliang "explora nuevos caminos", dejando de lado la obsesión por la estructura de las proteínas y enfocándose directamente en el "pronóstico funcional" como objetivo final, transformando el diseño de proteínas complejo en un proceso simple orientado a la demanda, con resultados producidos a partir de una pequeña cantidad de experimentos.

"Entrenamos la serie de modelos Venus (Estrella de la Mañana). A diferencia de AlphaFold del equipo de DeepMind, este modelo aprende las reglas de organización de las secuencias de proteínas en la naturaleza y su relación con la función. Su precisión en la predicción de la funcionalidad de las mutaciones de proteínas se sitúa en la cima del ranking de la industria", declaró Hong Liang.

La serie de modelos Venus cuenta con dos funciones clave: "Evolución Direccionada por IA" y "Extracción de Enzimas por IA".

El llamado "evolución direccional de IA" se refiere a que los modelos de la serie Venus pueden optimizar múltiples características de un producto proteico que no cumple con las expectativas, convirtiéndolo en un "guerrero hexagonal" que satisface las necesidades de aplicación.

"AI mining enzymes" se refiere a que la serie de modelos Venus, basada en su enorme conjunto de datos de proteínas con funciones desconocidas, puede "seleccionar guerreros con superpoderes" para descubrir con precisión proteínas que satisfacen exigentes demandas de aplicación y que poseen funciones extraordinarias, como resistencia extrema al calor, resistencia extrema a ácidos, resistencia extrema a bases y resistencia extrema a la digestión gastrointestinal.

Estas proteínas con funciones extraordinarias tienen un enorme potencial de aplicación en biotecnología, desarrollo farmacéutico y producción industrial, pudiendo aportar innovación y avances en los campos relacionados.

​​Mientras tanto, el primer sistema automatizado de expresión, purificación y detección funcional de proteínas de gran volumen y bajo flujo del mundo, en combinación con la serie de modelos Venus, puede completar de manera ininterrumpida más de 100 tareas de expresión, purificación y detección de proteínas en 24 horas, mejorando la eficiencia casi 10 veces en comparación con el trabajo manual. Esto reducirá significativamente la inversión en costos de mano de obra, recursos y tiempo durante el proceso de investigación y desarrollo, mejorando notablemente la eficiencia de la investigación en ingeniería de proteínas y biología sintética. Su objetivo es "diseño AI, automatización experimental", liberando a los investigadores de los tediosos procesos de diseño y experimentación. Solo necesitan plantear preguntas, y la IA y la automatización se encargarán de resolverlas, transformando así el descubrimiento científico complejo en un proceso simple tipo "cámara de fotos para tontos".

Actualmente, varios tipos de proteínas diseñadas con la serie de modelos Venus ya han sido industrializadas.

Tomando como ejemplo la modificación de resistencia alcalina de anticuerpos de dominio único de Jin Sai Pharmaceutical, líder en hormonas de crecimiento en el país. Mejorar la resistencia alcalina de las proteínas ha sido históricamente un trabajo muy desafiante. El equipo de Hongliang, aprovechando este modelo, combinó una pequeña cantidad de experimentos húmedos con iteraciones de verificación en un ciclo cerrado, logrando en menos de un año aumentar la resistencia alcalina de los anticuerpos de dominio único en 4 veces, ahorrando más de diez millones de yuanes al año a Jin Sai Pharmaceutical. Este resultado ha logrado múltiples lotes de producción a gran escala de 5000 litros, convirtiéndose en el primer producto proteico diseñado por un gran modelo y producido a gran escala en el mundo.

Otra aplicación innovadora de la serie de modelos Venus es el proyecto de modificación de la fosfatasa alcalina (ALP) de una empresa líder en diagnóstico in vitro. La ALP se utiliza ampliamente como enzima marcadora debido a su alta estabilidad y sensibilidad; cuanto mayor es su actividad, mayor es la sensibilidad de detección, lo que permite detectar biomarcadores extremadamente bajos. Sin embargo, aumentar la actividad de la ALP siempre ha sido un desafío. La serie de modelos Venus ha optimizado con éxito la ALP, aumentando su actividad molecular a más de 3 veces la de los productos de empresas líderes internacionales, lo que aporta un gran valor a la detección ultra-sensible (como en el infarto de miocardio y la enfermedad de Alzheimer). Actualmente, la ALP modificada ha entrado en la fase de producción a gran escala de 200L, lo que marca la exitosa transformación industrial de la serie de modelos Venus.

(Fuente: Jiemian News)

Fuente: Eastmoney

Autor: Interface News

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • 1
  • Compartir
Comentar
0/400
GateUser-488cbe78vip
· 03-24 02:31
Noticias Odaily Ethena equipo anunció en el canal oficial de Discord que la página de consulta del Airdrop de la Temporada 3 se lanzará en la primera semana de abril, antes de lo cual se proporcionarán más detalles sobre la distribución del Airdrop de la Temporada 3. Además, Ethena anunció que el evento de la Temporada 4 comenzará el 24 de marzo y durará 6 meses hasta el 24 de septiembre.
Responder0
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)