Startup de Recuperação de IA SID Acusa a Base de Dados Vetorial Chroma de Plágio de Pesquisa

robot
Geração do resumo em andamento

De acordo com a monitorização pela 1M AI News, Max Rumpf, CEO da empresa de pesquisa em recuperação de IA SID.ai, acusou publicamente a base de dados vetorial de código aberto Chroma de ter emprestado substancialmente da pesquisa SID-1 da SID publicada em dezembro do ano passado, numa longa publicação no X. Rumpf afirmou que o novo modelo Context-1 da Chroma não forneceu quaisquer citações ou reconhecimentos. Ele partilhou correspondência por email com o CEO da Chroma, Jeff Huber, como evidência. Em outubro de 2025, Huber perguntou proativamente sobre qual modelo Rumpf estava a treinar, ao que Rumpf respondeu que estava a trabalhar num “modelo de recuperação de agentes, semelhante ao SWE-grep da Cognition, mas para recuperação geral, que já é mais forte do que o Sonnet 4.5 e o Gemini 2.5 Pro.” Após a divulgação do relatório técnico Context-1 em dezembro de 2025, Rumpf partilhou novamente o link com Huber, que respondeu com “Parabéns.” Ambas as empresas são ex-alunas da YC e têm escritórios lado a lado. Tanto o SID-1 como o Context-1 são modelos de recuperação de agentes treinados usando aprendizado por reforço, posicionados como sub-agentes de recuperação para modelos de raciocínio de ponta, e ambos utilizam dados sintéticos para treinamento, afirmando alcançar a optimalidade de Pareto em custo e latência. Rumpf listou semelhanças específicas, incluindo: a Figura 1 usando a mesma troca de dupla visualização de velocidade/custo, inferência paralela de quatro vias combinada com Reciprocal Ranking Fusion (RRF) para agregar resultados, bem como a estrutura geral de gráficos, conjuntos de dados e metodologias. O relatório técnico para o Context-1 citou trabalhos relacionados como WebExplorer, SWE-grep e Search-R1, mas não mencionou o SID-1 no texto, nem as avaliações de benchmark incluíram o SID-1 para comparação. Rumpf afirmou que a Chroma “afirmou conscientemente a optimalidade de Pareto enquanto outro modelo existe” e salientou que, embora o Context-1 tenha disponibilizado os seus pesos em código aberto, a estrutura de inferência necessária para a operação ainda não foi divulgada, impedindo a SID de realizar testes de benchmark. Rumpf expressou que esta prática “destrói completamente a motivação para nós (e outros) partilharmos em profundidade em relatórios técnicos” e referiu-se a isso como “uma prática de pesquisa lamentável na academia que está a espalhar-se para startups.” Até ao momento da publicação, a Chroma não tinha respondido publicamente.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar