Elon Musk Prediksi Data AI Akan Musnah, Sintetis Jadi Solusi di Masa Depan
- id.pinterest.com
VIVATechno – CEO Tesla dan pemilik X, Elon Musk mengungkapkan dunia telah mencapai batas penggunaan data untuk melatih kecerdasan buatan (artificial intelligence/AI) dalam percakapan langsung dengan ketua Stagwell Mark di platform X, Rabu malam.
"Kita sedang menghadapi situasi di mana data yang relevan untuk melatih AI tingkat lanjut hampir habis. Dalam beberapa kasus, kita sudah berada di sana," ungkap Musk.
Pandangan serupa juga disampaikan oleh kepala ilmuwan OpenAI, Ilya Sutskever, yang menyebut fenomena ini sebagai "peak data".
Pernyataan ini muncul di tengah pesatnya perkembangan AI yang ditandai dengan inovasi teknologi besar-besaran dari berbagai perusahaan teknologi terkemuka.
OpenAI terus mengembangkan model GPT, sementara Google meluncurkan Gemini, Microsoft dengan Phi, Meta memperkenalkan Llama, dan X menghadirkan AI Grok.
Setiap teknologi AI ini membutuhkan data latihan yang masif dan beragam untuk menghasilkan respons akurat.
Namun, Musk menyatakan sebagian besar data yang mudah diakses dari internet sudah dimanfaatkan.
Solusi yang ditawarkan adalah menciptakan data sintetis, yaitu data yang dihasilkan oleh sistem komputer untuk menyerupai data dunia nyata.
Lembaga riset Gartner memproyeksikan sekitar 60 persen data untuk proyek AI dan analitik pada tahun 2024 akan dihasilkan secara sintetis.
Beberapa perusahaan besar telah menerapkan data sintetis dalam pengembangan AI mereka, seperti Microsoft dengan Phi-4, Google dengan Gemma, Anthropic dengan Claude 3.5 Sonnet, dan Meta dengan model Llama terbaru.
Penggunaan data sintetis terbukti lebih hemat biaya. Startup AI Writer mengklaim model Palmyra X 004 mereka hanya membutuhkan biaya pengembangan sekitar 700.000 dollar AS.
Angka ini jauh lebih rendah dibandingkan model OpenAI serupa yang menghabiskan sekitar 4,6 juta dollar AS.
Meski demikian, data sintetis memiliki kelemahan signifikan. Penelitian menunjukkan penggunaannya dapat menyebabkan "keruntuhan model" atau model collapse.
Fenomena ini terjadi ketika performa AI menurun drastis, terutama dalam aspek kreativitas dan akurasi output.
Data sintetis juga berpotensi mengulang pola dari data pelatihan asli, yang dapat menyebabkan model belajar informasi yang terlalu sempit atau bias.
Masalah lain muncul ketika model menggunakan output dari dirinya sendiri sebagai data pelatihan, menghasilkan efek "salin-tempel" yang dapat merusak kemampuan model untuk memahami atau menciptakan hal baru.
Musk dan Sutskever menekankan pentingnya pengembangan teknologi baru seperti algoritma efisien untuk mengatasi tantangan "peak data" ini.