CEO-nya, Sam Altman, mengumumkan dengan keras bahwa OpenAI akan memulai acara siaran maraton selama 12 hari, yang akan mencakup peluncuran produk baru, pembaruan fitur, dan beberapa "hadiah Natal".
Pengumuman Kegiatan OpenAI
Maka, media teknologi di seluruh dunia ramai, bahkan perbedaan waktu tidak bisa menghentikan semangat untuk mengejar 'Gala Teknologi'.
Pada pukul 02:00 waktu Beijing, siaran langsung "12 Days of OpenAI, Hari 1" dimulai, ketika "Jia Zi Light Year" begadang untuk membongkar "hadiah" ini, akhirnya seperti mengupas bawang, ternyata Ultraman, kamu "tidak punya hati"!
Setelah pengumuman yang heboh, siaran langsung hari pertama hanya berlangsung selama 14 menit, lebih seperti irisan dari acara peluncuran besar yang telah berlalu. Meskipun OpenAI telah merilis model dan produk terbaru, dan ada beberapa poin menarik, namun kesungguhannya sedikit kurang.
Industri percaya ini lebih seperti strategi pemasaran yang megah, ada yang bercanda: "OpenAI mengajarmu bagaimana mendominasi 12 berita teknologi dalam 12 hari."
Secara umum, OpenAI membahas dua hal utama kali ini:
1. Peluncuran versi resmi o1, ini adalah pertama kalinya kombinasi kemampuan multimodal dan paradigma inferensi baru. Dibandingkan dengan o1 preview, ini lebih cerdas, dengan peningkatan signifikan dalam kecepatan respons. Saat ini model o1 sudah sepenuhnya online, fungsi API juga akan segera diluncurkan.
2. Meluncurkan paket Pro yang baru - ChatGPT Pro, dengan biaya langganan $200 per bulan, pengguna dapat mengakses model OpenAI tanpa batas, termasuk fitur suara. Selain itu, paket Pro juga memperkenalkan mode o1 Pro, yang tampil lebih baik dalam uji benchmark machine learning yang menantang seperti matematika, sains, dan pemrograman.
Versi resmi 1.01 memperkenalkan multi-modal
Versi resmi model o1 akan menggantikan versi o1-preview sebelumnya.
Oltman menyatakan bahwa model o1 mencapai tingkat akurasi 83,3% dalam American Invitational Mathematics Examination (AIME 2024), jauh melebihi tingkat akurasi o1-preview sebesar 56,7% dan model GPT-4o awal sebesar 13,4%.
Dalam pemrograman, model o1 mencetak 89.0% dalam kompetisi CodeForces, sementara o1-preview mencetak 62.0%, dan GPT-4o hanya 11.0%, menunjukkan bahwa model o1 dapat menangani tugas pemrograman kompleks seperti seorang programmer yang terampil.
Dalam ujian ilmiah tingkat doktor GPQA Diamond, pertanyaan-pertanyaan ini pada dasarnya memiliki tingkat kesulitan 'neraka', o1 bahkan melampaui para ahli manusia, dengan tingkat akurasi 78.3%, sedangkan skor ahli manusia adalah 69.7%. Namun, kinerja o1 tidak sebaik o1 preview, ini mungkin disebabkan oleh perbedaan kinerja model berdasarkan jenis masalah atau perubahan yang mungkin terjadi pada data pelatihan yang digunakan.
Model baru juga telah mengalami peningkatan dalam kecepatan pemrosesan. Dibandingkan dengan versi sebelumnya, waktu respons untuk masalah sederhana telah berkurang. Ultraman menyebutkan dalam demonstrasinya bahwa tingkat kesalahan dalam pemrosesan masalah yang kompleks pada versi baru o1 menurun sebesar 34%, dan dapat menyesuaikan waktu pemrosesan berdasarkan tingkat kesulitan masalah.
Pada saat yang sama, o1 memperkenalkan fungsi multimodal yang dapat mengolah berbagai jenis input dan output. Menambahkan output terstruktur dan fitur pesan pengembang, meningkatkan interaktivitas dan kegunaan model.
Pada konferensi pers, orang yang bertanggung jawab atas model o1 menggambar sketsa di tempat, memperlihatkan sistem yang digunakan untuk mengumpulkan tenaga matahari dan menyuplai pusat data luar angkasa. Karena luar angkasa tidak dapat menggunakan sistem pendingin air, maka pendinginannya bergantung pada satu lembar bahan pendingin besar. Para peneliti kemudian bertanya kepada model o1, jika pusat data ini memerlukan daya sebesar 1 gigawatt, berapa luas bahan pendingin yang diperlukan untuk menjaga agar larik GPU tetap berfungsi dengan normal.
Model o1 melakukan pengenalan dan pemahaman yang akurat terhadap sketsa, melalui analisis dan perhitungan mendalam, dan menyimpulkan bahwa diperlukan 242 juta meter persegi panel pendingin yang besar untuk memenuhi kebutuhan pendinginan.
2.ChatGPT Pro seharga $200 setiap bulan
Versi 'mahal biaya' yang sebelumnya hanya merupakan desas-desus, juga telah tiba hari ini.
ChatGPT Pro adalah langganan premium dengan biaya bulanan $200, yang memberikan akses tanpa batas kepada pengguna ke model dan alat tercanggih. Ini mencakup akses penuh ke OpenAI o1 dan o1-mini, GPT-4o, dan Advanced Voice, yang dirancang khusus untuk kebutuhan komputasi yang paling kompleks.
Salah satu fitur unik dari ChatGPT Pro adalah pengenalan mode pro o1, yang meningkatkan sumber daya komputasi untuk memungkinkan model mempertimbangkan dan menganalisis pertanyaan yang lebih sulit dengan lebih mendalam. Layanan ini ditujukan terutama untuk para peneliti, insinyur, dan profesional lain yang memerlukan analisis dan pemrosesan data tingkat lanjut, untuk membantu mereka meningkatkan efisiensi kerja dan tetap berada di garis depan teknologi kecerdasan buatan.
Menurut penilaian pakar eksternal, mode o1 pro dapat memberikan respon yang lebih akurat dan komprehensif daripada model sebelumnya dalam menangani masalah ilmu data, pemrograman, dan analisis kasus yang kompleks. Saat diuji dalam benchmark machine learning di bidang matematika, ilmu pengetahuan, dan pemrograman, mode o1 pro menunjukkan performa yang lebih baik daripada model o1 dan o1-preview.
Untuk menyoroti keunggulan utama mode o1 pro (meningkatkan keandalan), OpenAI menggunakan pengaturan evaluasi yang lebih ketat: hanya ketika model berhasil menjawab pertanyaan empat kali dari empat percobaan ("4/4 Keandalan"), baru dianggap berhasil dalam menyelesaikan masalah.
Sepertinya semua orang juga ingin bekerja keras sebelum Natal, Google Deepmind juga kemarin membuka kartu besar dengan merilis model dunia dasar terbaru Genie 2; Anthrophic juga mungkin akan merilis model baru sebelum Natal.
Sepertinya pertempuran model AI baru akan dimulai lagi.
Selanjutnya, ada 11 hari lagi hingga "kotak misteri" yang akan dibuka, sebelumnya ada pengguna internet yang menduga bahwa model Sora, Dall-e 4, dan lainnya mungkin akan dirilis, harapannya OpenAI dapat menghadirkan lebih banyak produk yang lebih canggih.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
o1正式版+ChatGPT Pro,奥尔特曼在“挤牙膏”。
Setiap langkah OpenAI selalu menarik perhatian.
CEO-nya, Sam Altman, mengumumkan dengan keras bahwa OpenAI akan memulai acara siaran maraton selama 12 hari, yang akan mencakup peluncuran produk baru, pembaruan fitur, dan beberapa "hadiah Natal".
Pengumuman Kegiatan OpenAI
Maka, media teknologi di seluruh dunia ramai, bahkan perbedaan waktu tidak bisa menghentikan semangat untuk mengejar 'Gala Teknologi'.
Pada pukul 02:00 waktu Beijing, siaran langsung "12 Days of OpenAI, Hari 1" dimulai, ketika "Jia Zi Light Year" begadang untuk membongkar "hadiah" ini, akhirnya seperti mengupas bawang, ternyata Ultraman, kamu "tidak punya hati"!
Setelah pengumuman yang heboh, siaran langsung hari pertama hanya berlangsung selama 14 menit, lebih seperti irisan dari acara peluncuran besar yang telah berlalu. Meskipun OpenAI telah merilis model dan produk terbaru, dan ada beberapa poin menarik, namun kesungguhannya sedikit kurang.
Industri percaya ini lebih seperti strategi pemasaran yang megah, ada yang bercanda: "OpenAI mengajarmu bagaimana mendominasi 12 berita teknologi dalam 12 hari."
Secara umum, OpenAI membahas dua hal utama kali ini:
1. Peluncuran versi resmi o1, ini adalah pertama kalinya kombinasi kemampuan multimodal dan paradigma inferensi baru. Dibandingkan dengan o1 preview, ini lebih cerdas, dengan peningkatan signifikan dalam kecepatan respons. Saat ini model o1 sudah sepenuhnya online, fungsi API juga akan segera diluncurkan.
2. Meluncurkan paket Pro yang baru - ChatGPT Pro, dengan biaya langganan $200 per bulan, pengguna dapat mengakses model OpenAI tanpa batas, termasuk fitur suara. Selain itu, paket Pro juga memperkenalkan mode o1 Pro, yang tampil lebih baik dalam uji benchmark machine learning yang menantang seperti matematika, sains, dan pemrograman.
Versi resmi 1.01 memperkenalkan multi-modal
Versi resmi model o1 akan menggantikan versi o1-preview sebelumnya.
Oltman menyatakan bahwa model o1 mencapai tingkat akurasi 83,3% dalam American Invitational Mathematics Examination (AIME 2024), jauh melebihi tingkat akurasi o1-preview sebesar 56,7% dan model GPT-4o awal sebesar 13,4%.
Dalam pemrograman, model o1 mencetak 89.0% dalam kompetisi CodeForces, sementara o1-preview mencetak 62.0%, dan GPT-4o hanya 11.0%, menunjukkan bahwa model o1 dapat menangani tugas pemrograman kompleks seperti seorang programmer yang terampil.
Dalam ujian ilmiah tingkat doktor GPQA Diamond, pertanyaan-pertanyaan ini pada dasarnya memiliki tingkat kesulitan 'neraka', o1 bahkan melampaui para ahli manusia, dengan tingkat akurasi 78.3%, sedangkan skor ahli manusia adalah 69.7%. Namun, kinerja o1 tidak sebaik o1 preview, ini mungkin disebabkan oleh perbedaan kinerja model berdasarkan jenis masalah atau perubahan yang mungkin terjadi pada data pelatihan yang digunakan.
Model baru juga telah mengalami peningkatan dalam kecepatan pemrosesan. Dibandingkan dengan versi sebelumnya, waktu respons untuk masalah sederhana telah berkurang. Ultraman menyebutkan dalam demonstrasinya bahwa tingkat kesalahan dalam pemrosesan masalah yang kompleks pada versi baru o1 menurun sebesar 34%, dan dapat menyesuaikan waktu pemrosesan berdasarkan tingkat kesulitan masalah.
Pada saat yang sama, o1 memperkenalkan fungsi multimodal yang dapat mengolah berbagai jenis input dan output. Menambahkan output terstruktur dan fitur pesan pengembang, meningkatkan interaktivitas dan kegunaan model.
Pada konferensi pers, orang yang bertanggung jawab atas model o1 menggambar sketsa di tempat, memperlihatkan sistem yang digunakan untuk mengumpulkan tenaga matahari dan menyuplai pusat data luar angkasa. Karena luar angkasa tidak dapat menggunakan sistem pendingin air, maka pendinginannya bergantung pada satu lembar bahan pendingin besar. Para peneliti kemudian bertanya kepada model o1, jika pusat data ini memerlukan daya sebesar 1 gigawatt, berapa luas bahan pendingin yang diperlukan untuk menjaga agar larik GPU tetap berfungsi dengan normal.
Model o1 melakukan pengenalan dan pemahaman yang akurat terhadap sketsa, melalui analisis dan perhitungan mendalam, dan menyimpulkan bahwa diperlukan 242 juta meter persegi panel pendingin yang besar untuk memenuhi kebutuhan pendinginan.
2.ChatGPT Pro seharga $200 setiap bulan
Versi 'mahal biaya' yang sebelumnya hanya merupakan desas-desus, juga telah tiba hari ini.
ChatGPT Pro adalah langganan premium dengan biaya bulanan $200, yang memberikan akses tanpa batas kepada pengguna ke model dan alat tercanggih. Ini mencakup akses penuh ke OpenAI o1 dan o1-mini, GPT-4o, dan Advanced Voice, yang dirancang khusus untuk kebutuhan komputasi yang paling kompleks.
Salah satu fitur unik dari ChatGPT Pro adalah pengenalan mode pro o1, yang meningkatkan sumber daya komputasi untuk memungkinkan model mempertimbangkan dan menganalisis pertanyaan yang lebih sulit dengan lebih mendalam. Layanan ini ditujukan terutama untuk para peneliti, insinyur, dan profesional lain yang memerlukan analisis dan pemrosesan data tingkat lanjut, untuk membantu mereka meningkatkan efisiensi kerja dan tetap berada di garis depan teknologi kecerdasan buatan.
Menurut penilaian pakar eksternal, mode o1 pro dapat memberikan respon yang lebih akurat dan komprehensif daripada model sebelumnya dalam menangani masalah ilmu data, pemrograman, dan analisis kasus yang kompleks. Saat diuji dalam benchmark machine learning di bidang matematika, ilmu pengetahuan, dan pemrograman, mode o1 pro menunjukkan performa yang lebih baik daripada model o1 dan o1-preview.
Untuk menyoroti keunggulan utama mode o1 pro (meningkatkan keandalan), OpenAI menggunakan pengaturan evaluasi yang lebih ketat: hanya ketika model berhasil menjawab pertanyaan empat kali dari empat percobaan ("4/4 Keandalan"), baru dianggap berhasil dalam menyelesaikan masalah.
Sepertinya semua orang juga ingin bekerja keras sebelum Natal, Google Deepmind juga kemarin membuka kartu besar dengan merilis model dunia dasar terbaru Genie 2; Anthrophic juga mungkin akan merilis model baru sebelum Natal.
Sepertinya pertempuran model AI baru akan dimulai lagi.
Selanjutnya, ada 11 hari lagi hingga "kotak misteri" yang akan dibuka, sebelumnya ada pengguna internet yang menduga bahwa model Sora, Dall-e 4, dan lainnya mungkin akan dirilis, harapannya OpenAI dapat menghadirkan lebih banyak produk yang lebih canggih.