Model AI Terbaru OpenAI Makin Pintar, Tapi Sering Ngaco? Ini Faktanya!

chatGPT
Sumber :

VIVATechnoChatGPT OpenAI baru saja merilis dua model AI teranyar yang dirancang khusus untuk meningkatkan kemampuan penalaran, yaitu o3 dan o4-mini. Secara teori, dua model ini seharusnya lebih pintar dalam menjawab pertanyaan kompleks.

Bikin Video AI Gratis Pakai Google Veo 3 dari HP Android, Cuma Modal Internet!

Tapi, ada satu hal yang bikin para peneliti garuk kepala, kedua model ini justru lebih sering “berhalusinasi” alias memberikan jawaban yang tidak akurat. Jadi, apakah ini sebuah kemajuan atau justru langkah mundur?Berikut penjelasan yang telah dirangkum dari kanal YouTube The AI Daily Brief yang berjudul OpenAI Drops Most Important New Feature of 2025 dan juga laman Tech Crunch.

Lebih Cerdas, Tapi Lebih Sering Salah?

5 Fakta Motor Matic Ini Harus Dipahami Calon Pembeli, Jangan Sampai Menyesal!

Model o3 dan o4-mini memang dirancang untuk tugas-tugas penalaran tingkat tinggi, misalnya soal logika, matematika, atau pemrograman. Namun, dalam uji coba internal OpenAI menggunakan benchmark PersonQA, hasilnya agak mengejutkan.  

- o3 berhalusinasi dalam 33% pertanyaan

Infinix Rilis Duo Jagoan Baru: Note 40 vs. Note 50 4G, Mana yang Lebih Unggul?

- o4-mini bahkan mencapai 48%

Sebagai perbandingan, model sebelumnya seperti o1 dan o3-mini hanya mencatat halusinasi 16% dan 14,8%.

Halaman Selanjutnya
img_title