Hugging Face open source ml-intern, agente de pesquisa em ML que lê automaticamente artigos, seleciona dados e executa treinamentos

robot
Geração do resumo em andamento
Notícias ME, 22 de abril (UTC+8), de acordo com o monitoramento do Beating, Hugging Face lançou o ml-intern, um agente de pesquisa em ML de código aberto que pode realizar autonomamente todo o processo de "ler artigos, organizar conjuntos de dados, iniciar treinamento na GPU, avaliar resultados, iterar e melhorar". O projeto é baseado na estrutura smolagents própria, oferecendo duas interfaces de entrada: CLI e web, com o código aberto no GitHub. A cadeia de ferramentas do ml-intern é construída em torno do ecossistema Hugging Face: buscar artigos no arXiv e HF Papers e aprofundar a leitura seguindo a cadeia de citações; navegar pelos conjuntos de dados no HF Hub, verificar a qualidade, reformatar e reinvestir no treinamento; quando não há GPU local, pode chamar o HF Jobs para iniciar tarefas de treinamento na nuvem, e após a conclusão, ler automaticamente a saída de avaliação, diagnosticar falhas e reiniciar. Por padrão, utiliza o Claude Sonnet 4.5 para conduzir o ciclo de decisão, com até 300 iterações por sessão, e comprime automaticamente textos com mais de 170 mil tokens. O Hugging Face apresentou três casos em seu post de lançamento. Em tarefas de raciocínio científico, o agente encontra os conjuntos de dados OpenScience e NemoTron-CrossThink na cadeia de citações do artigo de referência, filtra 7 variantes por dificuldade entre ARC, SciQ e MMLU, executa 12 rodadas de SFT no Qwen3-1.7B, aumentando a pontuação do GPQA de 10% para 32%, em menos de 10 horas. No cenário médico, o agente avalia que a qualidade dos conjuntos de dados existentes é insuficiente, escreve scripts para gerar 1100 dados sintéticos e aumenta 50 vezes para treinamento, superando 60% do Codex no HealthBench. Em matemática competitiva, o agente escreve scripts de treinamento GRPO por conta própria e inicia o treinamento no A100 via HF Spaces, realizando experimentos de ablação após observar colapsos de recompensa para investigar as causas. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado