Model AI Terbaru OpenAI Makin Pintar, Tapi Sering Ngaco? Ini Faktanya!

chatGPT
Sumber :

VIVATechnoChatGPT OpenAI baru saja merilis dua model AI teranyar yang dirancang khusus untuk meningkatkan kemampuan penalaran, yaitu o3 dan o4-mini. Secara teori, dua model ini seharusnya lebih pintar dalam menjawab pertanyaan kompleks.

5 Panduan Profesional, Optimalisasi Produktivitas dengan Samsung Galaxy Tab S10 FE

Tapi, ada satu hal yang bikin para peneliti garuk kepala, kedua model ini justru lebih sering “berhalusinasi” alias memberikan jawaban yang tidak akurat. Jadi, apakah ini sebuah kemajuan atau justru langkah mundur?Berikut penjelasan yang telah dirangkum dari kanal YouTube The AI Daily Brief yang berjudul OpenAI Drops Most Important New Feature of 2025 dan juga laman Tech Crunch.

Lebih Cerdas, Tapi Lebih Sering Salah?

Stop Asal Posting! Ini Cara AI Membantu Menentukan Jam Emas Konten Anda

Model o3 dan o4-mini memang dirancang untuk tugas-tugas penalaran tingkat tinggi, misalnya soal logika, matematika, atau pemrograman. Namun, dalam uji coba internal OpenAI menggunakan benchmark PersonQA, hasilnya agak mengejutkan.  

- o3 berhalusinasi dalam 33% pertanyaan

Alat AI Terbaik untuk E-commerce: Cara Meningkatkan Toko Online Kamu di 2025

- o4-mini bahkan mencapai 48%

Sebagai perbandingan, model sebelumnya seperti o1 dan o3-mini hanya mencatat halusinasi 16% dan 14,8%.

Halaman Selanjutnya
img_title