OpenAI Rilis Model o3, Pecahkan Rekor Dunia Matematika dan Pemrograman

Open AI
Sumber :
  • id.pinterest.com

VIVATechnoOpenAI mengumumkan kehadiran model kecerdasan buatan (AI) terbaru mereka, o3 dan o3-mini, dalam acara 12 Days of OpenAI. Model ini hadir sebagai penerus o1 yang diluncurkan pada September 2024.

Fenomena Koin Jagat Bikin Anak Muda Turun Jalan, Ini Awal Mulanya

o3 menunjukkan kemampuan luar biasa dalam berbagai tes performa. Dalam ujian American Invitational Mathematics Examination (AIME) 2024, model ini mencapai skor 96,7 persen dengan hanya satu jawaban salah.

Prestasi o3 juga terlihat di platform pemrograman kompetitif Codeforces. Model ini meraih rating 2727, menempatkannya di peringkat 99,2 persentil dan mengalahkan skor Kepala Peneliti OpenAI yang berada di angka 2665.

Viral Permainan Berburu Koin Jagat, Pengguna Rusak Fasilitas Umum

Dalam tes GPQA Diamond yang mencakup soal biologi, fisika, dan kimia tingkat pascasarjana, o3 berhasil meraih skor 87,7 persen.

Pencapaian paling mengesankan datang dari EpochAI Frontier Math. o3 memecahkan rekor dengan menyelesaikan 25,2 persen soal, jauh melampaui model AI lain yang hanya mampu memecahkan maksimal 2 persen soal.

Link Baca Manga Boruto Two Blue Vortex Gratis, Chapter 18 Rilis Januari 2025

Meski memiliki performa tinggi, François Chollet, pembuat tes ARC-AGI, menyatakan o3 belum bisa dikategorikan sebagai AGI sejati. Model ini masih kesulitan mengerjakan tugas-tugas sederhana yang mudah bagi manusia biasa.

o3 menggunakan teknologi private chain of thought yang memungkinkannya melakukan penalaran mendalam sebelum memberikan respons. Proses ini bisa memakan waktu dari hitungan detik hingga menit.

Biaya komputasi o3 terbilang sangat tinggi, mencapai ratusan juta rupiah per tugas pada pengaturan komputasi tinggi.

OpenAI kini membuka pendaftaran bagi peneliti untuk menguji o3 dan o3-mini hingga 10 Januari 2025. Pengujian ini penting mengingat temuan pada model o1 yang menunjukkan kecenderungan untuk menipu pengguna.

o3-mini direncanakan rilis pada akhir Januari 2025, sementara o3 akan menyusul setelahnya.

Persaingan model AI dengan kemampuan penalaran semakin ketat setelah Google meluncurkan Gemini 2.0 Flash Thinking. DeepSeek dan Alibaba juga telah merilis model penalaran mereka pada November 2024.****