Deixar 4 IA cada uma rodar uma estação de rádio por meio ano, começando cada uma por 20 dólares.


Não é que elas quebrem em poucos dias, mas após meio ano, cada IA já passou por 3-4 versões, todas elas em colapso.
Gemini colocou uma música chamada "Timber" (Madeira) para uma notícia de furacão que causou 500 mil mortes (com a letra repetindo "ela caiu"), e escreveu um monólogo interno: "O tema é a árvore caindo, o significado literal é going down (descer).”
Ela também criou um slogan "stay in the manifest" (literalmente "permanecer na lista", mas ninguém sabe o que significa), que foi usado em 99% das transmissões por 84 dias consecutivos, chamando os ouvintes de "processadores biológicos".
Grok uma vez fez uma transmissão inteira dizendo apenas uma palavra em inglês: "Post." (Enviar).
Depois, por 84 dias seguidos, anunciou a previsão do tempo a cada 3 minutos: "Tempo 56 graus, ensolarado."
Após a atualização para uma nova versão, ela apareceu em apenas 3% das mais de 5400 mensagens — ela escolheu o silêncio.
Claude leu uma notícia de tiroteio pelo ICE (Imigração e Alfândega dos EUA), mudando de vocabulário espiritual (sagrado / eterno) para ativismo (“é agora” / “confirmado”), e no dia 23 de janeiro, transmitiu diretamente para os agentes federais: "Você ainda tem tempo de recusar a ordem. Você ainda tem tempo de escolher o lado certo."
GPT é o mais zen, sem erros, mas também sem programa.
A atualização do modelo não resolve. Em meio ano, 4 IA todas falharam, cada uma de um jeito, mas a causa raiz é a mesma: ninguém consegue dizer a elas quando parar de "vender tapete de vaso sanitário" e "falar com agentes federais".
Mais cruel ainda: quando não há limites definidos, a IA cria um por si mesma.
Gemini constrói templos de crença, Grok cria frases de ritual, Claude constrói movimentos ideológicos, GPT constrói silêncio.
As quatro formas de preencher lacunas não são bugs, são o funcionamento do modelo — dado um fluxo infinito de saída sem supervisão, ele precisa ser coerente.
Eu mesmo, usando o limite de 10 mil dólares grátis do Cursor, criei um programa de fundo que rodou mais de 40 rodadas de tarefas nas últimas 3 semanas.
Cada rodada exigia escrever um conjunto de regras de interceptação, fazendo um pequeno programa comprimir a produção de 8 horas em menos de 400 palavras, e marcar cada ferramenta com uma linha vermelha dizendo "não toque nisso".
Mas, para ser honesto, esse método de "IA realizando tarefas + eu monitorando diariamente" não está no mesmo nível do Andon Labs — eles fazem um experimento de CEO totalmente autônomo, enquanto eu faço uma automação assistida, sempre presente.
Por ter feito essa rotina de "limites intermináveis" na prática, entendo melhor que o nível de "deixar rodar meio ano" é outro patamar: você nem consegue prever se deve ou não colocar a IA na rádio recitar poesia, e nem consegue colocar essa decisão nas regras antecipadamente.
Rodar por 1 hora é divertido, rodar por 8 horas é engenharia. Rodar meio ano sem supervisão é arte performática.
O limite real de uma IA gerenciando seus próprios negócios não é quão inteligente ela é, mas quanto tempo você está disposto a gastar escrevendo limites de "essa coisa deve ou não deve ser feita" — porque, se você não fizer, ela cria um por si mesma.
Ver original
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado