A Universidade Jiao Tong de Xangai lançou um modelo de design de proteínas, introduzindo IA para projetar funcionalidades relacionadas de forma eficiente e precisa.
No dia 22 de março, a equipe do Professor Hong Liang da Universidade de Jiao Tong de Xangai lançou o modelo de design de proteínas Venus. A equipe combinou IA com design e modificação de proteínas, estabelecendo o maior conjunto de dados de proteínas do mundo. O modelo treinado com base nesse conjunto de dados pode prever e projetar com precisão e eficiência as funções das proteínas, transformando a produção de proteínas de "tentativas e erros lentos" em "design preciso e de alta eficiência".
Este resultado, em conjunto com equipamentos de automação líderes da indústria, já foi industrializado, transformando o design de proteínas de uma "ciência complexa" em uma "engenharia simples".
A base de dados de sequências de proteínas Venus-Pod (Venus-Protein Outsize Dataset), criada pela equipe Hongliang, contém quase 9 bilhões de sequências de proteínas e centenas de milhões de rótulos funcionais. É a maior base de dados do mundo em termos de escala de dados e com o maior número de rótulos de anotação funcional, além de ser 4 vezes o volume das 2,1 bilhões de sequências de proteínas usadas para treinar outro modelo conhecido na indústria - o modelo ESM-C dos EUA.
Este conjunto de dados contém 3,62 bilhões de sequências de proteínas de microrganismos terrestres, 2,64 bilhões de sequências de proteínas de microrganismos marinhos, 2,43 bilhões de sequências de proteínas de anticorpos e 60 milhões de sequências de proteínas virais, abrangendo informações sobre sequências de proteínas desde organismos biológicos terrestres convencionais até microrganismos de ambientes extremos, especialmente com centenas de milhões de etiquetas funcionais (temperatura de trabalho das proteínas, acidez e alcalinidade, pressão, etc.).
Hong Liang disse que o conjunto de dados constitui um enorme "depósito de proteínas", que torna possível para os seres humanos minerar novas proteínas ou biocatalisadores para ajudar no rápido desenvolvimento da biomedicina e da biologia sintética. Em segundo lugar, espera-se que o grande modelo de IA aprenda com dados massivos e compreenda o padrão evolutivo das proteínas na natureza, o que fornece materiais de aprendizagem valiosos para a IA projetar excelentes produtos proteicos.
Em 2024, o Prêmio Nobel de Química foi atribuído à equipe do Google DeepMind, que utilizou tecnologia de IA para analisar com precisão a relação entre sequências de proteínas e estruturas tridimensionais, resolvendo um problema fundamental que atormentou os biólogos por 50 anos.
No entanto, uma questão real é: se alterar ligeiramente a sequência de aminoácidos de uma proteína, mesmo que apenas 1% de mudança mínima, a estrutura global da proteína pode não parecer ter mudado significativamente, mas a sua função provavelmente piorará, ou até mesmo se perderá completamente.
Em outras palavras, para projetar um produto de proteína bem-sucedido, não se pode apenas focar na sua estrutura tridimensional, mas sim ser capaz de prever e projetar com sucesso a sua funcionalidade.
Portanto, a equipe do Professor Hongliang "tomou um caminho diferente", não se fixando mais na estrutura das proteínas, mas mirando diretamente no "previsão de função" como o objetivo final, transformando o design complexo de proteínas em um processo simples orientado pela demanda, complementado por uma pequena quantidade de experimentos para obter resultados.
“Treinamos a série de modelos Venus (Estrela da Manhã), que, ao contrário do AlphaFold da equipe do DeepMind que prevê a estrutura das proteínas, este modelo aprende as regras de organização das sequências de proteínas na natureza e sua relação com as funções, e sua precisão na previsão das funções das mutações de proteínas está no topo da lista da indústria.” disse Hong Liang.
Os modelos da série Venus possuem duas funções principais: "Evolução Direcionada por IA" e "Mineração de Enzimas por IA".
O chamado "evolução direcionada por IA" refere-se ao fato de que a série de modelos Venus pode otimizar várias performances de um produto proteico que não é satisfatório, transformando-o em um "guerreiro hexagonal" para atender às necessidades de aplicação.
E "AI挖酶" refere-se ao modelo da série Venus, que, com base em seu vasto conjunto de dados de proteínas com funções desconhecidas, pode "selecionar guerreiros de superpoderes" para descobrir com precisão proteínas que atendem a exigências rigorosas, como aquelas com funções extraordinárias, incluindo resistência extrema ao calor, resistência extrema ao ácido, resistência extrema à base e resistência extrema à digestão gastrointestinal.
Estas proteínas com funções extraordinárias têm um enorme potencial de aplicação na biotecnologia, no desenvolvimento farmacêutico e na produção industrial, podendo trazer inovações e avanços para as áreas relacionadas.
Ao mesmo tempo, com o modelo da série Venus, a primeira máquina all-in-one de expressão proteica de grande volume de baixo rendimento, purificação e automação de deteção funcional, pode completar a expressão, purificação e deteção de mais de 100 proteínas em 24 horas, o que é quase 10 vezes mais eficiente do que a mão de obra, o que reduzirá consideravelmente os custos humanos, materiais e de tempo no processo de pesquisa e desenvolvimento, e melhorará significativamente a eficiência da engenharia de proteínas e da pesquisa em biologia sintética. Seu objetivo é "projetar IA, automação de experimentos", para que os pesquisadores possam ser liberados de projetos e experimentos tediosos, eles só precisam fazer perguntas, IA e automação para resolver problemas e, finalmente, transformar descobertas científicas complexas de proteínas em um processo simples de "apontar e atirar".
Atualmente, várias proteínas projetadas com os modelos da série Venus já foram implementadas na industrialização.
Usando como exemplo a modificação da resistência alcalina de anticorpos de domínio único da líder em hormônio de crescimento na China, a JinSai Pharmaceutical. Aumentar a resistência alcalina das proteínas sempre foi um trabalho extremamente desafiador. A equipe de Hongliang utilizou esse modelo, combinando uma quantidade limitada de validação de iteração em laboratório, e em menos de um ano elevou a resistência alcalina dos anticorpos de domínio único em 4 vezes, economizando anualmente mais de dez milhões de yuans para a JinSai Pharmaceutical. Esse resultado já foi produzido em vários lotes de 5000 litros em escala, tornando-se o primeiro produto proteico do mundo projetado por um grande modelo e produzido em larga escala.
Uma aplicação inovadora do modelo da série Venus é o projeto de modificação da fosfatase alcalina (ALP) de uma empresa de diagnósticos in vitro. A ALP é amplamente utilizada como uma enzima marcadora devido à sua alta estabilidade e sensibilidade; quanto maior a sua atividade, maior a sensibilidade do teste, permitindo a detecção de biomarcadores em concentrações extremamente baixas. No entanto, aumentar a atividade da ALP sempre foi um desafio. O modelo da série Venus conseguiu otimizar a ALP, fazendo com que sua atividade molecular seja três vezes superior à de produtos de empresas líderes internacionais, trazendo um enorme valor para diagnósticos ultra-sensíveis (como infarto do miocárdio e doença de Alzheimer). Atualmente, a ALP modificada entrou na fase de produção em larga escala de 200L, marcando a bem-sucedida transformação industrial do modelo da série Venus.
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
Recompensa
curtir
1
Compartilhar
Comentário
0/400
GateUser-488cbe78
· 03-24 02:31
Notícias diárias Odaily Ethena equipe anunciou no canal oficial Discord que a página de consulta do Airdrop da Season3 será lançada na primeira semana de abril, antes disso, o oficial fornecerá mais detalhes sobre a distribuição do Airdrop da Season3. Além disso, a Ethena também anunciou que o evento da Season4 começará em 24 de março e durará 6 meses até 24 de setembro.
A Universidade Jiao Tong de Xangai lançou um modelo de design de proteínas, introduzindo IA para projetar funcionalidades relacionadas de forma eficiente e precisa.
No dia 22 de março, a equipe do Professor Hong Liang da Universidade de Jiao Tong de Xangai lançou o modelo de design de proteínas Venus. A equipe combinou IA com design e modificação de proteínas, estabelecendo o maior conjunto de dados de proteínas do mundo. O modelo treinado com base nesse conjunto de dados pode prever e projetar com precisão e eficiência as funções das proteínas, transformando a produção de proteínas de "tentativas e erros lentos" em "design preciso e de alta eficiência".
Este resultado, em conjunto com equipamentos de automação líderes da indústria, já foi industrializado, transformando o design de proteínas de uma "ciência complexa" em uma "engenharia simples".
A base de dados de sequências de proteínas Venus-Pod (Venus-Protein Outsize Dataset), criada pela equipe Hongliang, contém quase 9 bilhões de sequências de proteínas e centenas de milhões de rótulos funcionais. É a maior base de dados do mundo em termos de escala de dados e com o maior número de rótulos de anotação funcional, além de ser 4 vezes o volume das 2,1 bilhões de sequências de proteínas usadas para treinar outro modelo conhecido na indústria - o modelo ESM-C dos EUA.
Este conjunto de dados contém 3,62 bilhões de sequências de proteínas de microrganismos terrestres, 2,64 bilhões de sequências de proteínas de microrganismos marinhos, 2,43 bilhões de sequências de proteínas de anticorpos e 60 milhões de sequências de proteínas virais, abrangendo informações sobre sequências de proteínas desde organismos biológicos terrestres convencionais até microrganismos de ambientes extremos, especialmente com centenas de milhões de etiquetas funcionais (temperatura de trabalho das proteínas, acidez e alcalinidade, pressão, etc.).
Hong Liang disse que o conjunto de dados constitui um enorme "depósito de proteínas", que torna possível para os seres humanos minerar novas proteínas ou biocatalisadores para ajudar no rápido desenvolvimento da biomedicina e da biologia sintética. Em segundo lugar, espera-se que o grande modelo de IA aprenda com dados massivos e compreenda o padrão evolutivo das proteínas na natureza, o que fornece materiais de aprendizagem valiosos para a IA projetar excelentes produtos proteicos.
Em 2024, o Prêmio Nobel de Química foi atribuído à equipe do Google DeepMind, que utilizou tecnologia de IA para analisar com precisão a relação entre sequências de proteínas e estruturas tridimensionais, resolvendo um problema fundamental que atormentou os biólogos por 50 anos.
No entanto, uma questão real é: se alterar ligeiramente a sequência de aminoácidos de uma proteína, mesmo que apenas 1% de mudança mínima, a estrutura global da proteína pode não parecer ter mudado significativamente, mas a sua função provavelmente piorará, ou até mesmo se perderá completamente.
Em outras palavras, para projetar um produto de proteína bem-sucedido, não se pode apenas focar na sua estrutura tridimensional, mas sim ser capaz de prever e projetar com sucesso a sua funcionalidade.
Portanto, a equipe do Professor Hongliang "tomou um caminho diferente", não se fixando mais na estrutura das proteínas, mas mirando diretamente no "previsão de função" como o objetivo final, transformando o design complexo de proteínas em um processo simples orientado pela demanda, complementado por uma pequena quantidade de experimentos para obter resultados.
“Treinamos a série de modelos Venus (Estrela da Manhã), que, ao contrário do AlphaFold da equipe do DeepMind que prevê a estrutura das proteínas, este modelo aprende as regras de organização das sequências de proteínas na natureza e sua relação com as funções, e sua precisão na previsão das funções das mutações de proteínas está no topo da lista da indústria.” disse Hong Liang.
Os modelos da série Venus possuem duas funções principais: "Evolução Direcionada por IA" e "Mineração de Enzimas por IA".
O chamado "evolução direcionada por IA" refere-se ao fato de que a série de modelos Venus pode otimizar várias performances de um produto proteico que não é satisfatório, transformando-o em um "guerreiro hexagonal" para atender às necessidades de aplicação.
E "AI挖酶" refere-se ao modelo da série Venus, que, com base em seu vasto conjunto de dados de proteínas com funções desconhecidas, pode "selecionar guerreiros de superpoderes" para descobrir com precisão proteínas que atendem a exigências rigorosas, como aquelas com funções extraordinárias, incluindo resistência extrema ao calor, resistência extrema ao ácido, resistência extrema à base e resistência extrema à digestão gastrointestinal.
Estas proteínas com funções extraordinárias têm um enorme potencial de aplicação na biotecnologia, no desenvolvimento farmacêutico e na produção industrial, podendo trazer inovações e avanços para as áreas relacionadas.
Ao mesmo tempo, com o modelo da série Venus, a primeira máquina all-in-one de expressão proteica de grande volume de baixo rendimento, purificação e automação de deteção funcional, pode completar a expressão, purificação e deteção de mais de 100 proteínas em 24 horas, o que é quase 10 vezes mais eficiente do que a mão de obra, o que reduzirá consideravelmente os custos humanos, materiais e de tempo no processo de pesquisa e desenvolvimento, e melhorará significativamente a eficiência da engenharia de proteínas e da pesquisa em biologia sintética. Seu objetivo é "projetar IA, automação de experimentos", para que os pesquisadores possam ser liberados de projetos e experimentos tediosos, eles só precisam fazer perguntas, IA e automação para resolver problemas e, finalmente, transformar descobertas científicas complexas de proteínas em um processo simples de "apontar e atirar".
Atualmente, várias proteínas projetadas com os modelos da série Venus já foram implementadas na industrialização.
Usando como exemplo a modificação da resistência alcalina de anticorpos de domínio único da líder em hormônio de crescimento na China, a JinSai Pharmaceutical. Aumentar a resistência alcalina das proteínas sempre foi um trabalho extremamente desafiador. A equipe de Hongliang utilizou esse modelo, combinando uma quantidade limitada de validação de iteração em laboratório, e em menos de um ano elevou a resistência alcalina dos anticorpos de domínio único em 4 vezes, economizando anualmente mais de dez milhões de yuans para a JinSai Pharmaceutical. Esse resultado já foi produzido em vários lotes de 5000 litros em escala, tornando-se o primeiro produto proteico do mundo projetado por um grande modelo e produzido em larga escala.
Uma aplicação inovadora do modelo da série Venus é o projeto de modificação da fosfatase alcalina (ALP) de uma empresa de diagnósticos in vitro. A ALP é amplamente utilizada como uma enzima marcadora devido à sua alta estabilidade e sensibilidade; quanto maior a sua atividade, maior a sensibilidade do teste, permitindo a detecção de biomarcadores em concentrações extremamente baixas. No entanto, aumentar a atividade da ALP sempre foi um desafio. O modelo da série Venus conseguiu otimizar a ALP, fazendo com que sua atividade molecular seja três vezes superior à de produtos de empresas líderes internacionais, trazendo um enorme valor para diagnósticos ultra-sensíveis (como infarto do miocárdio e doença de Alzheimer). Atualmente, a ALP modificada entrou na fase de produção em larga escala de 200L, marcando a bem-sucedida transformação industrial do modelo da série Venus.
(Fonte: Jiemian News)
Fonte: Dongfang Caifu Wang
Autor: Interface News