Model AI Terbaru OpenAI Makin Pintar, Tapi Sering Ngaco? Ini Faktanya!

chatGPT
Sumber :

VIVATechnoChatGPT OpenAI baru saja merilis dua model AI teranyar yang dirancang khusus untuk meningkatkan kemampuan penalaran, yaitu o3 dan o4-mini. Secara teori, dua model ini seharusnya lebih pintar dalam menjawab pertanyaan kompleks.

Ponsel Elegan dengan Fitur Menarik, Ternyata Ini Fakta dan Harga Lengkap OPPO Find X8

Tapi, ada satu hal yang bikin para peneliti garuk kepala, kedua model ini justru lebih sering “berhalusinasi” alias memberikan jawaban yang tidak akurat. Jadi, apakah ini sebuah kemajuan atau justru langkah mundur?Berikut penjelasan yang telah dirangkum dari kanal YouTube The AI Daily Brief yang berjudul OpenAI Drops Most Important New Feature of 2025 dan juga laman Tech Crunch.

Lebih Cerdas, Tapi Lebih Sering Salah?

6 Rahasia untuk Maksimalkan ChatGPT, Diklaim Lebih Efisien dari Asisten Manusia

Model o3 dan o4-mini memang dirancang untuk tugas-tugas penalaran tingkat tinggi, misalnya soal logika, matematika, atau pemrograman. Namun, dalam uji coba internal OpenAI menggunakan benchmark PersonQA, hasilnya agak mengejutkan.  

- o3 berhalusinasi dalam 33% pertanyaan

Jangan Salah Kaprah, Ini 5 Fakta Seller Center yang Wajib Kamu Tahu!

- o4-mini bahkan mencapai 48%

Sebagai perbandingan, model sebelumnya seperti o1 dan o3-mini hanya mencatat halusinasi 16% dan 14,8%.

Halaman Selanjutnya
img_title