Versión oficial de o1 + ChatGPT Pro, Ultraman está "exprimiendo el tubo de pasta de dientes".
Cada movimiento de OpenAI es muy seguido.
Ayer, su CEO Sam Altman anunció públicamente que va a hacer algo grande para todos: OpenAI llevará a cabo un evento de transmisión en vivo tipo maratón de 12 días, que incluirá lanzamientos de nuevos productos, actualizaciones de funciones y algunos 'regalos de Navidad'.
Anuncio de eventos de OpenAI
Entonces, los medios de tecnología de todo el mundo estaban hirviendo, incluso la diferencia horaria no podía detener la determinación de perseguir el "Festival de Primavera de la Tecnología".
A las 2 de la madrugada hora de Pekín del 6 de diciembre, comenzó la transmisión en vivo de '12 Days of OpenAI, Day 1'. Mientras '甲子光年' desmontaba este 'gran regalo' durante toda la noche, al final descubrió que Ultraman, ¡no tienes corazón!
Después de un emocionante avance, el primer día de transmisión en vivo solo duró 14 minutos, más parecido a un fragmento extraído de un gran evento de lanzamiento en vivo, a pesar de que OpenAI lanzó modelos y productos actualizados, y hubo aspectos destacados, pero su sinceridad parecía un poco insuficiente.
La industria cree que esto es más como una brillante estrategia de marketing, algunos se burlan: "OpenAI te enseña cómo dominar los titulares de noticias tecnológicas durante 12 días."
En resumen, OpenAI ha hablado de dos cosas principales esta vez:
1. Lanzamiento de la versión oficial de o1, que combina por primera vez capacidades multimodales con un nuevo paradigma de razonamiento. En comparación con la vista previa de o1, es más inteligente y la velocidad de respuesta ha mejorado significativamente. Actualmente, el modelo o1 está completamente en línea y las funciones de la API también se lanzarán pronto.
2. Se lanzó el nuevo paquete profesional ChatGPT Pro, con una tarifa de suscripción de $200 al mes, que permite a los usuarios acceder ilimitadamente a los modelos de OpenAI, incluyendo la función de voz. Además, el paquete Pro introduce el modo o1 Pro, que tiene un mejor rendimiento en desafiantes pruebas de aprendizaje automático en áreas como matemáticas, ciencias y codificación.
La versión oficial 1.01 introduce la multimodalidad
La versión oficial del modelo o1 reemplazará a la versión anterior o1-preview.
Ultraman introduced that the accuracy of the o1 model in the American Mathematics Invitational (AIME 2024) reached 83.3%, far surpassing the 56.7% of the o1-preview and the 13.4% of the early GPT-4o model.
En términos de programación, el modelo o1 obtuvo una puntuación del 89.0% en la competencia CodeForces, mientras que o1-preview obtuvo un 62.0% y GPT-4o solo un 11.0%. Esto demuestra que el modelo o1 puede manejar tareas de codificación complejas como si fuera un programador experimentado.
En la prueba de GPQA Diamond para problemas científicos de nivel de doctorado, estas preguntas son básicamente de dificultad 'nivel infernal', o1 incluso supera a los expertos humanos, con una precisión del 78.3%, mientras que los expertos humanos obtienen un puntaje del 69.7%. Sin embargo, el rendimiento de o1 no es tan bueno como el de o1 preview, lo cual puede deberse a que el rendimiento del modelo varía según el tipo de problema o los datos de entrenamiento utilizados.
El nuevo modelo también ha mejorado en velocidad de procesamiento. En comparación con las versiones anteriores, se ha reducido el tiempo de respuesta a problemas simples. En la demostración, Ultrasaurus mencionó que la nueva versión o1 ha reducido su tasa de error al Soltar un 34% al tratar problemas complejos, pudiendo ajustar el tiempo de procesamiento según la dificultad del problema.
Al mismo tiempo, o1 ha introducido funciones multimodales que pueden manejar diferentes tipos de entradas y salidas. Se han añadido funciones de salida estructurada y mensajes para desarrolladores, lo que mejora la interactividad y utilidad del modelo.
En la conferencia, el responsable del modelo o1 dibujó un boceto en el lugar para mostrar un sistema utilizado para recopilar energía solar y suministrar un centro de datos espaciales. Dado que el espacio no puede utilizar un sistema de refrigeración líquida, la disipación de calor debe depender de un gran disipador de calor. Luego, el investigador preguntó al modelo o1 cuánta área de disipador de calor se necesitaría para proporcionar 1 gigavatio de energía a este centro de datos y mantener el arreglo de GPU funcionando correctamente.
El modelo o1 reconoció y comprendió con precisión el boceto, después de un análisis y cálculo detallados, y llegó a la conclusión de que se necesitan 2,42 millones de metros cuadrados de enormes disipadores de calor para satisfacer las necesidades de refrigeración.
2. ChatGPT Pro de $200 al mes
Hoy también llegó la versión que se rumorea que es "más cara" en términos de tarifas.
ChatGPT Pro es un plan de suscripción avanzado de 200 dólares al mes que brinda a los usuarios acceso ilimitado a sus modelos y herramientas más avanzados. Esto incluye acceso completo a OpenAI o1 y o1-mini, GPT-4o y Advanced Voice, especialmente diseñados para las demandas de cálculo más complejas.
Una de las características destacadas de ChatGPT Pro es la introducción del modo o1 pro, que aumenta la asignación de recursos de cálculo y permite que el modelo realice una reflexión y análisis más profundos al abordar problemas difíciles. Este servicio está dirigido principalmente a investigadores científicos, ingenieros y otros profesionales que requieren análisis y procesamiento de datos avanzados, ayudándoles a mejorar su eficiencia laboral y mantenerse a la vanguardia de la tecnología de inteligencia artificial.
Según la evaluación de expertos externos, el modo o1 pro proporciona respuestas más precisas y completas que los modelos anteriores al procesar problemas complejos de ciencia de datos, programación y análisis de casos. En las pruebas de referencia de aprendizaje automático en áreas como matemáticas, ciencias y programación, el modo o1 pro supera el rendimiento de los modelos o1 y o1-preview.
Para resaltar las principales ventajas del modo o1 pro (mejora de la fiabilidad), OpenAI utiliza una configuración de evaluación más estricta: solo se considera que se ha resuelto el problema cuando el modelo puede responder correctamente a la pregunta las cuatro veces en cuatro intentos (fiabilidad 4/4).
Al parecer, todos están trabajando duro antes de la Navidad, Google Deepmind también hizo un gran anuncio ayer, lanzando su último modelo de mundo base, Genie 2; Anthrophic también podría lanzar un nuevo modelo antes de Navidad.
Parece que va a comenzar otra ronda de combate de modelos de inteligencia artificial.
En los próximos 11 días, aún queda por abrir la "caja misteriosa", algunos usuarios en línea especularon sobre posibles lanzamientos como el modelo Sora, Dall-e 4, esperamos que OpenAI pueda presentar más productos innovadores y sorprendentes.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Versión oficial de o1 + ChatGPT Pro, Ultraman está "exprimiendo el tubo de pasta de dientes".
Cada movimiento de OpenAI es muy seguido.
Ayer, su CEO Sam Altman anunció públicamente que va a hacer algo grande para todos: OpenAI llevará a cabo un evento de transmisión en vivo tipo maratón de 12 días, que incluirá lanzamientos de nuevos productos, actualizaciones de funciones y algunos 'regalos de Navidad'.
Anuncio de eventos de OpenAI
Entonces, los medios de tecnología de todo el mundo estaban hirviendo, incluso la diferencia horaria no podía detener la determinación de perseguir el "Festival de Primavera de la Tecnología".
A las 2 de la madrugada hora de Pekín del 6 de diciembre, comenzó la transmisión en vivo de '12 Days of OpenAI, Day 1'. Mientras '甲子光年' desmontaba este 'gran regalo' durante toda la noche, al final descubrió que Ultraman, ¡no tienes corazón!
Después de un emocionante avance, el primer día de transmisión en vivo solo duró 14 minutos, más parecido a un fragmento extraído de un gran evento de lanzamiento en vivo, a pesar de que OpenAI lanzó modelos y productos actualizados, y hubo aspectos destacados, pero su sinceridad parecía un poco insuficiente.
La industria cree que esto es más como una brillante estrategia de marketing, algunos se burlan: "OpenAI te enseña cómo dominar los titulares de noticias tecnológicas durante 12 días."
En resumen, OpenAI ha hablado de dos cosas principales esta vez:
1. Lanzamiento de la versión oficial de o1, que combina por primera vez capacidades multimodales con un nuevo paradigma de razonamiento. En comparación con la vista previa de o1, es más inteligente y la velocidad de respuesta ha mejorado significativamente. Actualmente, el modelo o1 está completamente en línea y las funciones de la API también se lanzarán pronto.
2. Se lanzó el nuevo paquete profesional ChatGPT Pro, con una tarifa de suscripción de $200 al mes, que permite a los usuarios acceder ilimitadamente a los modelos de OpenAI, incluyendo la función de voz. Además, el paquete Pro introduce el modo o1 Pro, que tiene un mejor rendimiento en desafiantes pruebas de aprendizaje automático en áreas como matemáticas, ciencias y codificación.
La versión oficial 1.01 introduce la multimodalidad
La versión oficial del modelo o1 reemplazará a la versión anterior o1-preview.
Ultraman introduced that the accuracy of the o1 model in the American Mathematics Invitational (AIME 2024) reached 83.3%, far surpassing the 56.7% of the o1-preview and the 13.4% of the early GPT-4o model.
En términos de programación, el modelo o1 obtuvo una puntuación del 89.0% en la competencia CodeForces, mientras que o1-preview obtuvo un 62.0% y GPT-4o solo un 11.0%. Esto demuestra que el modelo o1 puede manejar tareas de codificación complejas como si fuera un programador experimentado.
En la prueba de GPQA Diamond para problemas científicos de nivel de doctorado, estas preguntas son básicamente de dificultad 'nivel infernal', o1 incluso supera a los expertos humanos, con una precisión del 78.3%, mientras que los expertos humanos obtienen un puntaje del 69.7%. Sin embargo, el rendimiento de o1 no es tan bueno como el de o1 preview, lo cual puede deberse a que el rendimiento del modelo varía según el tipo de problema o los datos de entrenamiento utilizados.
El nuevo modelo también ha mejorado en velocidad de procesamiento. En comparación con las versiones anteriores, se ha reducido el tiempo de respuesta a problemas simples. En la demostración, Ultrasaurus mencionó que la nueva versión o1 ha reducido su tasa de error al Soltar un 34% al tratar problemas complejos, pudiendo ajustar el tiempo de procesamiento según la dificultad del problema.
Al mismo tiempo, o1 ha introducido funciones multimodales que pueden manejar diferentes tipos de entradas y salidas. Se han añadido funciones de salida estructurada y mensajes para desarrolladores, lo que mejora la interactividad y utilidad del modelo.
En la conferencia, el responsable del modelo o1 dibujó un boceto en el lugar para mostrar un sistema utilizado para recopilar energía solar y suministrar un centro de datos espaciales. Dado que el espacio no puede utilizar un sistema de refrigeración líquida, la disipación de calor debe depender de un gran disipador de calor. Luego, el investigador preguntó al modelo o1 cuánta área de disipador de calor se necesitaría para proporcionar 1 gigavatio de energía a este centro de datos y mantener el arreglo de GPU funcionando correctamente.
El modelo o1 reconoció y comprendió con precisión el boceto, después de un análisis y cálculo detallados, y llegó a la conclusión de que se necesitan 2,42 millones de metros cuadrados de enormes disipadores de calor para satisfacer las necesidades de refrigeración.
2. ChatGPT Pro de $200 al mes
Hoy también llegó la versión que se rumorea que es "más cara" en términos de tarifas.
ChatGPT Pro es un plan de suscripción avanzado de 200 dólares al mes que brinda a los usuarios acceso ilimitado a sus modelos y herramientas más avanzados. Esto incluye acceso completo a OpenAI o1 y o1-mini, GPT-4o y Advanced Voice, especialmente diseñados para las demandas de cálculo más complejas.
Una de las características destacadas de ChatGPT Pro es la introducción del modo o1 pro, que aumenta la asignación de recursos de cálculo y permite que el modelo realice una reflexión y análisis más profundos al abordar problemas difíciles. Este servicio está dirigido principalmente a investigadores científicos, ingenieros y otros profesionales que requieren análisis y procesamiento de datos avanzados, ayudándoles a mejorar su eficiencia laboral y mantenerse a la vanguardia de la tecnología de inteligencia artificial.
Según la evaluación de expertos externos, el modo o1 pro proporciona respuestas más precisas y completas que los modelos anteriores al procesar problemas complejos de ciencia de datos, programación y análisis de casos. En las pruebas de referencia de aprendizaje automático en áreas como matemáticas, ciencias y programación, el modo o1 pro supera el rendimiento de los modelos o1 y o1-preview.
Para resaltar las principales ventajas del modo o1 pro (mejora de la fiabilidad), OpenAI utiliza una configuración de evaluación más estricta: solo se considera que se ha resuelto el problema cuando el modelo puede responder correctamente a la pregunta las cuatro veces en cuatro intentos (fiabilidad 4/4).
Al parecer, todos están trabajando duro antes de la Navidad, Google Deepmind también hizo un gran anuncio ayer, lanzando su último modelo de mundo base, Genie 2; Anthrophic también podría lanzar un nuevo modelo antes de Navidad.
Parece que va a comenzar otra ronda de combate de modelos de inteligencia artificial.
En los próximos 11 días, aún queda por abrir la "caja misteriosa", algunos usuarios en línea especularon sobre posibles lanzamientos como el modelo Sora, Dall-e 4, esperamos que OpenAI pueda presentar más productos innovadores y sorprendentes.