DeepSeek v3 Guncang Dominasi GPT 4 dengan Kemampuan AI Spektakuler dari China

Kecerdasan Buatan
Sumber :
  • id.pinterest.com

VIVATechnoDeepSeek, perusahaan teknologi asal China, baru saja meluncurkan model kecerdasan buatan (AI) terbarunya, DeepSeek v3, pada Desember 2024.

Cara Menghapus Kontak WhatsApp dengan Mudah dan Cepat

Model AI open source ini hadir sebagai penantang serius untuk model-model besar seperti GPT-4o dari OpenAI dan Claude dari Anthropic.

DeepSeek v3 mencatatkan sejarah baru dengan total 671 miliar parameter, menjadikannya model AI open source terbesar yang pernah ada.

Cara Menyelamatkan Smartphone yang Terkena Air: Panduan Lengkapnya di Sini

Jumlah parameter tersebut bahkan melampaui Llama 3.1 yang memiliki 405 miliar parameter dengan selisih 1,6 kali lebih besar.

Berdasarkan laporan TechCrunch, DeepSeek v3 menunjukkan kemampuan yang luar biasa dalam menangani berbagai tugas berbasis teks, mulai dari pemrograman hingga pembuatan email.

Acer Swift 14 AI, Laptop Tipis Dilengkapi Kecerdasan Buatan

Model ini bahkan mencatatkan prestasi gemilang dalam pengujian matematika dengan meraih skor 90,2 pada tes Math-500, jauh meninggalkan model Qwen yang hanya mencapai skor 80.

Keunggulan lain yang dimiliki DeepSeek v3 adalah kemampuannya dalam memahami konteks hingga 128 ribu token, setara dengan pemrosesan 100 ribu kata dalam sekali eksekusi.

Kemampuan ini memungkinkan model untuk menganalisis teks panjang seperti dokumen atau kode program dengan lebih menyeluruh.

VentureBeat melaporkan bahwa saat ini hanya Claude 3.5 Sonnet dari Anthropic yang mampu menandingi performa DeepSeek v3.

Claude 3.5 Sonnet masih unggul dalam beberapa pengujian standar, termasuk tes pengetahuan umum dan akademik (MMLU-Pro), serta tes pemrograman (SWE Verified).

Namun, DeepSeek v3 memiliki keunggulan dari sisi aksesibilitas karena tersedia secara open source, berbeda dengan Claude 3.5 Sonnet yang bersifat tertutup.

Model ini juga menunjukkan keunggulan khusus dalam penanganan bahasa Mandarin dan pemrograman kompetitif di platform Codeforces.

DeepSeek v3 telah berhasil mengungguli model-model open source lainnya seperti Llama 3.1 405B dan Qwen 2.5 72B dalam berbagai benchmark.

Prestasi ini semakin menegaskan posisi DeepSeek v3 sebagai pemain baru yang patut diperhitungkan dalam persaingan teknologi AI global.