o1正式版+ChatGPT Pro,奥尔特曼在“挤牙膏”。



Cada movimento da OpenAI é amplamente observado.

  昨日其CEO Sam Altman (Sam Altman)高调宣佈要给大家"整个活":OpenAI将开启一个为期12天的马拉松式直播活动,内容会包括新品发布和功能更新等,还有一些 " 圣诞礼物 "。

Anúncio de eventos da OpenAI

Então, todos os meios de comunicação de tecnologia em todo o mundo ficaram agitados, mesmo com a diferença de horário, não conseguiram impedir a determinação de assistir à "Gala de Tecnologia".

Às 2h da manhã no horário de Pequim, começou a transmissão ao vivo do '12 Days of OpenAI, Dia 1'. Enquanto 'Jiazi Lightyear' trabalhava duro para desvendar esse 'grande presente', acabou descobrindo que o Ultraman não tem 'coração'!

Depois de uma prévia impactante, o primeiro dia de transmissão ao vivo durou apenas 14 minutos, mais parecendo um recorte de um grande evento de lançamento retirado de uma transmissão ao vivo. Embora a OpenAI tenha lançado modelos e produtos atualizados, com destaques, sua sinceridade parece um pouco insuficiente.

A indústria acredita que isto mais se assemelha a uma estratégia de marketing glamourosa, e alguém brinca: "OpenAI ensina-te como dominar as manchetes de notícias tecnológicas durante 12 dias."

Resumindo, a OpenAI abordou principalmente duas coisas desta vez:

1. Lançamento da versão oficial do o1, esta é a primeira vez que a capacidade multimodal é combinada com um novo paradigma de inferência. Em comparação com o o1 preview, ele é mais inteligente e tem uma resposta significativamente mais rápida. Atualmente, o modelo o1 está completamente disponível e as funcionalidades da API serão lançadas em breve.

2. Lançada a nova versão profissional do pacote ChatGPT Pro, com uma taxa de assinatura de 200 dólares por mês, os usuários têm acesso ilimitado aos modelos da OpenAI, incluindo recursos de voz. Além disso, o pacote Pro também introduz o modo o1 Pro, que apresenta um desempenho melhor em testes desafiadores de aprendizado de máquina em áreas como matemática, ciência e codificação.

1.o1 versão oficial introduz multi-modal

A versão oficial do modelo o1 substituirá a versão o1-preview anterior.

O modelo o1 da Alterman alcançou uma precisão de 83,3% no American Mathematics Invitational Examination (AIME 2024), superando significativamente os 56,7% do o1-preview e os 13,4% do modelo GPT-4o anterior.

No campo da programação, o modelo o1 pontuou 89,0% nos concursos CodeForces, enquanto o modelo o1-preview obteve 62,0% e o GPT-4o obteve apenas 11,0%. Isso mostra que o modelo o1 pode lidar com tarefas de codificação complexas como um programador experiente.

Nos testes de problemas científicos de nível doutorado do GPQA Diamond, estas questões são de uma dificuldade quase "infernal", com o desempenho do o1 até mesmo superando especialistas humanos, com uma precisão de 78,3%, enquanto a pontuação dos especialistas humanos é de 69,7%. No entanto, o desempenho do o1 não foi tão bom quanto o o1 preview, o que pode ser devido a mudanças no desempenho do modelo baseadas no tipo de problema ou no conjunto de dados de treinamento utilizado.

O novo modelo também teve melhorias na velocidade de processamento. Comparado com versões anteriores, o tempo de resposta para problemas simples foi reduzido. Na demonstração, Ultraman mencionou que a nova versão 01 teve uma redução de 34% na taxa de erros ao lidar com problemas complexos e pode ajustar o tempo de processamento com base na dificuldade do problema.

Ao mesmo tempo, o1 introduziu recursos multimodais que podem lidar com diferentes tipos de entrada e saída. Foram adicionadas saídas estruturadas e recursos de mensagens para desenvolvedores, aumentando a interatividade e utilidade do modelo.

Na conferência, o responsável pelo modelo o1 desenhou um esboço ao vivo, mostrando um sistema projetado para coletar energia solar para abastecer um centro de dados espaciais. Uma vez que a refrigeração líquida não pode ser usada no espaço, a dissipação de calor depende de uma grande placa de dissipação de calor. O pesquisador posteriormente questionou o modelo o1 sobre o tamanho da placa de dissipação de calor necessário para manter o funcionamento normal da matriz de GPUs, se for necessário fornecer 1 gigawatt de energia para este centro de dados.

O modelo o1 reconheceu e compreendeu com precisão o esboço, após uma análise e cálculos detalhados, concluiu que são necessários 242 mil metros quadrados de grandes dissipadores de calor para atender às necessidades de resfriamento.

2. ChatGPT Pro por $200 por mês

A versão "mais cara" anteriormente rumoreada também chegou hoje.

ChatGPT Pro é um plano de subscrição avançado de 200 dólares por mês, que fornece aos utilizadores acesso ilimitado aos seus modelos e ferramentas mais avançados. Especificamente inclui acesso completo ao OpenAI o1 e o1-mini, GPT-4o e Advanced Voice, principalmente direcionado para as necessidades de cálculo mais complexas.

Uma das características do ChatGPT Pro é a introdução do modo o1 pro, que aumenta o investimento em recursos computacionais, permitindo que o modelo faça uma análise e reflexão mais profunda ao lidar com problemas complexos. Este serviço é principalmente direcionado a pesquisadores, engenheiros e outros profissionais que precisam realizar análises e processamento de dados avançados, ajudando-os a melhorar a eficiência do trabalho e se manter atualizados com a tecnologia de inteligência artificial.

De acordo com avaliações de especialistas externos, o modo o1 pro oferece respostas mais precisas e abrangentes do que modelos anteriores ao lidar com problemas complexos de ciência de dados, programação e análise de casos. O desempenho do modo o1 pro em testes de referência de aprendizado de máquina em áreas como matemática, ciência e programação é superior ao dos modelos o1 e o1-preview.

Para destacar as principais vantagens do modo o1 pro (aumentar a confiabilidade), a OpenAI utiliza uma configuração de avaliação mais rigorosa: apenas quando o modelo consegue responder corretamente às perguntas em todas as quatro tentativas (confiabilidade 4/4), é considerado que resolveu o problema.

Parece que todos estão se apressando antes do Natal, e o Google Deepmind também lançou o mais recente modelo de mundo básico, o Genie 2, ontem; e a Anthrophic também pode lançar um novo modelo antes do Natal.

Parece que está prestes a começar outra rodada de duelos de modelos de IA.

  接下来还有11天的"caixa mistério"待开,之前已有网友猜测可能会发布的Sora模型、Dall-e 4等,理想OpenAI 能掏出更、更hard 的货出来。
GPT1.43%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)