AI China Kalahkan GPT-4? Startup Ini Buktinya

Tim Ragam Utama - Penulis

Rabu, 16 Juli 2025 - 04:35 WIB

URL berhasil dicopy

Ragamutama.com – Dunia kecerdasan buatan (AI) kembali dikejutkan dengan kehadiran model bahasa baru yang ambisius. Startup AI asal China, Moonshot AI, secara resmi merilis model bahasa sumber terbuka mereka, Kimi K2. Model ini diklaim membawa performa unggulan, terutama dalam hal pengkodean atau coding hingga kemampuan menjalankan agen AI yang kompleks.

Kekuatan Kimi K2 bahkan disebut-sebut mampu melampaui model AI sejenis yang dikembangkan oleh raksasa teknologi seperti OpenAI maupun Anthropic. Moonshot AI dengan bangga menyatakan dalam blog perusahaannya, “Kimi K2 tidak hanya menjawab, dia bertindak. Dengan model AI ini, kecerdasan agen AI tingkat lanjut menjadi lebih terbuka dan mudah diakses dari sebelumnya.” Pernyataan ini menegaskan visi mereka untuk democratisasi teknologi AI canggih.

Secara teknis, Kimi K2 dirancang dengan total satu triliun parameter, namun hanya 32 miliar parameter yang aktif berkat implementasi arsitektur Mixture-of-Experts (MoE). Teknik inovatif ini memungkinkan model AI untuk memiliki kapasitas komputasi yang sangat besar tanpa harus mengorbankan efisiensi daya. Dengan kata lain, model ini dapat mengelola tugas-tugas berat secara cerdas tanpa memerlukan sumber daya komputasi yang masif untuk setiap operasinya.

Salah satu fitur menonjol dari model kecerdasan buatan ini adalah kemampuannya untuk menggunakan alat secara otonom, menulis serta mengeksekusi kode, dan bahkan menyelesaikan berbagai tugas kompleks tanpa memerlukan campur tangan manusia. Otonomi ini menjadi nilai jual utama yang membedakannya dari banyak model lain di pasar.

Klaim superioritas Kimi K2 telah dibuktikan melalui serangkaian pengujian benchmark ketat. Pada benchmark AI SWE-benc Verified, yang dirancang untuk mengukur kemampuan model AI dalam menyelesaikan masalah perangkat lunak di dunia nyata seperti perbaikan bug, Kimi K2 berhasil mencapai akurasi 65,8 persen. Angka ini secara signifikan mengungguli GPT-4.1 dari OpenAI yang meraih 54,6 persen, dan DeepSeek V3-0324 dengan 38,8 persen.

Tak hanya itu, dalam pengujian coding di platform LiveCodeBench, model AI buatan Moonshot AI ini sekali lagi menunjukkan dominasinya dengan akurasi 53,7 persen. Skor ini melampaui performa DeepSeek-V3 (46,9 persen), GPT 4.1 (44,7 persen), serta Claude 4 Opus (47,4 persen) dari Anthropic, mempertegas kapabilitas Kimi K2 dalam pengembangan perangkat lunak.

Kemampuan Kimi K2 juga diuji pada platform benchmark MATH-500 yang mengukur kapasitas model AI dalam memecahkan soal matematika tingkat lanjut. Di sini, Kimi K2 mencetak skor impresif 97,4 persen, jauh lebih tinggi dari GPT-4.1 yang hanya mencapai 92,4 persen. Skor luar biasa ini mengindikasikan bahwa Kimi K2 mampu mengatasi soal-soal matematika yang bahkan belum dapat dipecahkan oleh model AI lain yang ada saat ini, demikian dilansir RAGAMUTAMA.COM dari Venture Beat pada Selasa (15/7/2025).

Moonshot AI merilis Kimi K2 dalam dua versi berbeda: model dasar yang ditujukan bagi para peneliti dan pengembang yang ingin mengeksplorasi potensi inti AI, serta varian yang dapat dikustomisasi untuk mengakomodasi aplikasi chatbot dan agen AI yang lebih spesifik. Model dasar dibanderol dengan harga 0,15 dollar AS (sekitar Rp 2.442) per satu juta token input, sementara versi output-nya dihargai 2,25 dollar AS (sekitar Rp 36.644) per sejuta token.