Model AI Baru OpenAI, Punya Kemampuan Penalaran Super Canggih Mampu Selesaikan Soal Matematika Tingkat Tinggi

Chat GPT Selesaikan Soal Matematika
Sumber :
  • id.pinterest.com

VIVATechno – OpenAI memperkenalkan terobosan baru dalam dunia kecerdasan buatan dengan meluncurkan dua model AI terbaru, o3 dan o3-mini.

Cara Menghapus Kontak WhatsApp dengan Mudah dan Cepat

Kedua model ini menonjolkan kemampuan penalaran yang canggih, memungkinkan pendekatan pemecahan masalah yang lebih sistematis dan logis, menyerupai proses berpikir manusia.

Sebagai penerus dari o1 yang diluncurkan September lalu, o3 menunjukkan peningkatan signifikan dalam kemampuan matematika.

Cara Menyelamatkan Smartphone yang Terkena Air: Panduan Lengkapnya di Sini

Hal ini terbukti melalui uji coba pada American Invitational Mathematics Exam (AIME) 2024, di mana o3 mencapai skor mengesankan 96,7 persen, hanya gagal pada satu soal.

Pencapaian ini jauh melampaui pendahulunya, o1, yang mencatat skor 83,3 persen.

Acer Swift 14 AI, Laptop Tipis Dilengkapi Kecerdasan Buatan

Chat GPT Selesaikan Soal Matematika

Photo :
  • id.pinterest.com

Sementara itu, o3-mini, versi yang lebih ringkas dan ekonomis, juga menunjukkan performa membanggakan.

Dalam mode penalaran "High", model ini mencapai skor 83,6 persen pada AIME 2024, mengalahkan o1-mini yang hanya mencapai 63,6 persen.

Keunggulan o3 tidak terbatas pada matematika saja. Dalam pengujian soal sains tingkat universitas GPQA Diamond, model ini mencapai skor 87,7 persen.

O3 juga menunjukkan keunggulan di berbagai benchmark populer, termasuk SWE-Bench Verified dengan 22,8 poin dan Codeforces dengan 2.727 poin.

Yang lebih mengesankan, o3 menunjukkan kemampuan luar biasa dalam pengujian Artificial General Intelligence melalui ARC-AGI.

Model ini mencapai skor 76 persen dalam mode "Low" dan 88 persen dalam mode "High", jauh melampaui o1 yang hanya mencapai 20-30 persen.

Meski unggul dalam akurasi, o3 membutuhkan waktu pemrosesan lebih lama dibandingkan GPT-4o.

Dalam mode High, o3 memerlukan 23 detik untuk merespons, sementara GPT-4o hanya membutuhkan 0,5 detik. Dalam mode Low, o3 dapat merespons dalam 1 detik, namun dengan mengorbankan tingkat akurasi.

Karakteristik ini menjadikan o3 lebih cocok untuk menyelesaikan persoalan matematika dan sains kompleks, sementara GPT-4o lebih sesuai untuk pertanyaan umum yang membutuhkan respons cepat.

Saat ini, o3 dan o3-mini masih dalam tahap uji coba, dengan pendaftaran terbuka hingga 10 Januari 2025.

OpenAI belum mengumumkan jadwal pasti kapan kedua model AI ini akan tersedia untuk penggunaan umum di ChatGPT.

Pengembangan ini menandai langkah maju yang signifikan dalam evolusi AI, khususnya dalam kemampuan penalaran dan pemecahan masalah kompleks.****