Hugging Face de código aberto ml-intern, agente de pesquisa em ML que lê automaticamente artigos, seleciona dados e executa treinamentos

robot
Geração de resumo em curso
Notícias ME, 22 de abril (UTC+8), de acordo com a monitorização do Beating, Hugging Face lançou o ml-intern open source, um agente de pesquisa em ML que pode completar autonomamente todo o processo de «ler artigos, organizar conjuntos de dados, iniciar treino com GPU, avaliar resultados, iterar melhorias». O projeto é baseado na sua própria estrutura smolagents, oferecendo duas interfaces, CLI e web, com código aberto no GitHub. A cadeia de ferramentas do ml-intern é construída em torno do ecossistema Hugging Face: pesquisar artigos no arXiv e HF Papers e aprofundar na cadeia de citações; navegar pelos conjuntos de dados no HF Hub, verificar a qualidade, reformatar e reinvestir no treino; quando não há GPU local, pode chamar HF Jobs para iniciar tarefas de treino na nuvem, e após o treino, ler automaticamente a saída de avaliação, diagnosticar falhas e reiniciar. Por padrão, utiliza o Claude Sonnet 4.5 para conduzir o ciclo de decisão, com até 300 iterações por sessão, e comprime automaticamente quando o contexto ultrapassa 170 mil tokens. A Hugging Face apresentou três casos no seu post de lançamento. Em tarefas de raciocínio científico, o agente encontra os conjuntos de dados OpenScience e NemoTron-CrossThink na cadeia de citações do artigo de referência, filtra 7 variantes por dificuldade entre ARC, SciQ e MMLU, executa 12 rodadas de SFT no Qwen3-1.7B, aumentando a pontuação do GPQA de 10% para 32%, em menos de 10 horas. No cenário médico, o agente avalia que a qualidade dos conjuntos de dados existentes é insuficiente, escreve scripts para gerar 1100 dados sintéticos e aumenta 50 vezes para treino, superando 60% do Codex no HealthBench. No cenário de matemática de competição, o agente escreve scripts de treino GRPO e inicia o treino no A100 via HF Spaces, realizando experimentos de ablação após observar colapsos de recompensa para identificar causas. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado