«Fruto de dois anos de pesquisa»: Cofundador da OpenAI fala pela primeira vez sobre o modelo Spud, respondendo à crítica de Dario de que «está a apostar a vida»

robot
Geração de resumo em curso

Segundo o monitorização da 1M AI News, o cofundador da OpenAI Greg Brockman, numa entrevista, falou pela primeira vez, a partir de uma perspetiva técnica, sobre o novo modelo de base de pré-treino de geração seguinte da OpenAI, com o codinome interno Spud. Ele descreveu o Spud como «o resultado de cerca de dois anos de investigação», e como a base para todas as melhorias subsequentes das capacidades da OpenAI. Ele explicou o processo de produção do modelo: primeiro é feito um pré-treino para produzir um modelo base; depois, através de aprendizagem por reforço, o modelo treina para resolver problemas em múltiplos cenários; por fim, é feito um ajustamento fino pós-treino ao nível do comportamento e da usabilidade. Ele concentrou os seus principais esforços nos últimos 18 meses na expansão da infraestrutura de GPU e das estruturas de treino.

Quanto às capacidades do Spud, Brockman apresentou expectativas qualitativas em vez de quantitativas: o modelo será capaz de resolver problemas mais difíceis, compreender melhor as instruções, e captar o contexto de forma mais profunda, reduzindo aquele «cheiro a modelo grande» (big model smell). Ele deu o exemplo de um engenheiro com quem colabora de perto: entre o GPT-5.2 e o GPT-5.3, esse engenheiro passou de «não conseguir usar a IA para engenharia de sistemas de base» para «dar-lhe um documento de design e ele consegue implementar a funcionalidade, adicionar métricas de monitorização e observabilidade, correr um analisador de desempenho para depois otimizar, e o resultado é exatamente aquilo que ele queria».

O entrevistador citou declarações anteriores do CEO da Anthropic, Dario Amodei: «Alguns jogadores estão a apostar tudo (yoloing), elevando demasiado o nível de risco; estou verdadeiramente preocupado», e mencionou que Amodei disse que, caso a previsão se desvie ligeiramente, a empresa poderá falir. Brockman respondeu diretamente: «Não concordo. Temos estado sempre muito cuidadosos, e vimos com muita clareza a tendência que se aproxima.» Ele acredita que a OpenAI foi a primeira empresa a reconhecer o gargalo de capacidade de computação, e que outras empresas «provavelmente só deram por isso no fim do ano passado, começaram a comprar capacidade de computação em grande escala, mas já não havia». Quanto ao risco de falência, ele considera que «na prática existem mais saídas em rampa de escape», e atribui esta aposta a uma avaliação do setor inteiro, e não de uma única empresa: «Acreditas que esta tecnologia consegue produzir e entregar o tipo de enorme valor que vemos?»

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar