A Amazon lança o quadro Promptimus, otimizando automaticamente os prompts de LLM

robot
Geração de resumo em curso
AIMPACT mensagem, 15 de maio (UTC+8), cientistas da Amazon propuseram uma estrutura de engenharia de prompts automatizada chamada Promptimus, que melhora prompts de LLM de alta qualidade existentes sem intervenção humana.
O método utiliza uma estratégia de otimização iterativa, aproveitando um modelo auxiliar de "otimizador" para analisar o padrão de interação entre prompts e saídas do modelo, identificando e ajustando automaticamente aspectos como clareza das instruções, seleção de exemplos, entre outros.
Em testes de referência múltiplos, incluindo raciocínio matemático (a precisão do GSM8K aumentou de 78% para 85%), perguntas de conhecimento geral e geração de código, os prompts otimizados apresentaram uma melhoria média de desempenho de 5%-15%.
Essa estrutura não depende de arquitetura específica de LLM ou tipo de tarefa, possuindo uma abordagem geral, e evita overfitting por meio de termos de regularização e mecanismos de validação cruzada, garantindo capacidade de generalização. (Fonte: InFoQ)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 5
  • 13
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
TransparentDomeCity
· 9h atrás
Ajuste automático de prompts finalmente não precisa mais de "meditação", os cães de pesquisa estão em êxtase
Ver originalResponder0
GovernanceMoodboard
· 9h atrás
Aumento médio de 5-15% parece modesto, mas não se pode negar que é totalmente automático.
Ver originalResponder0
StopLossSparrow
· 9h atrás
Regularização + validação cruzada para evitar overfitting, detalhes bem feitos
Ver originalResponder0
GateUser-f49a50d4
· 9h atrás
O nome Promptimus soa como Transformers, mas o efeito é realmente concreto
Ver originalResponder0
MoonlightTake-ProfitLine
· 9h atrás
GSM8K de 78% para 85%, a capacidade de raciocínio matemático é realmente robusta
Ver originalResponder0
  • Fixado