Claude 3.7 Sonnet Dirilis Anthropic, Model AI Penalaran Hybrid Pertama di Industri
- id.pinterest.com
"Kami mengumumkan Claude 3.7 Sonnet, model AI kami yang paling cerdas hingga saat ini dan mode penalaran hibrida pertama di pasaran," demikian keterangan resmi Anthropic.
Perusahaan ini menyatakan bahwa model tunggal Claude 3.7 Sonnet dapat menyederhanakan pengalaman pengguna karena tidak perlu memilih dari beberapa opsi model yang tersedia.
"Sama seperti manusia yang memakai satu otak untuk merespons dengan cepat dan refleksi mendalam, kami percaya penalaran harus menjadi kemampuan terintegrasi dari model yang belum berkembang, bukan model yang terpisah sepenuhnya," ungkap Anthropic.
Performa Ungguli OpenAI
Dalam pengujian di platform SWE-Bench yang mengukur kemampuan model AI dalam mengerjakan tugas coding, Claude 3.7 Sonnet mencapai akurasi 62,3 persen.
Persentase ini lebih tinggi dibandingkan model o3-mini dari OpenAI yang hanya mencapai akurasi sekitar 49,3 persen.
Pada platform TAU-Bench yang mengukur kemampuan interaksi dengan pengguna, Claude 3.7 Sonnet memperoleh skor 81,2 persen, mengungguli model o1 dari OpenAI yang mendapat skor 73,5 persen.