Jakarta, tvOnenews.com - DeepSeek, perusahaan kecerdasan buatan yang berbasis di Hangzhou, Tiongkok, menarik perhatian global dengan peluncuran inovasi terbarunya, DeepSeek R1 dan V-3, pada akhir 2024. Model ini dirancang untuk memberikan respons yang efisien terhadap berbagai pertanyaan pengguna.
Salah satu keunggulan utama DeepSeek adalah efisiensi biaya pengembangannya. Model DeepSeek-V3 dapat dilatih dengan biaya sekitar $6 juta, yang jauh lebih rendah dibandingkan model AI lainnya.
Namun, peningkatan popularitasnya juga menghadirkan tantangan, termasuk serangan siber besar-besaran yang baru-baru ini menghambat pendaftaran pengguna baru. Untuk menjaga stabilitas layanan, perusahaan sementara waktu membatasi registrasi.
Peluncuran ini bertepatan dengan perayaan Imlek, menandai strategi Alibaba dalam mempercepat inovasi AI.
Qwen 2.5-Max mengadopsi arsitektur "Mixture of Experts" (MoE), yang memungkinkan model ini mengelola tugas kompleks dengan lebih efisien melalui kolaborasi beberapa sub-model spesialis.
Dengan pendekatan ini, Qwen 2.5-Max mencapai efisiensi pemrosesan yang lebih tinggi dibandingkan pendahulunya.
Dalam pengujian internal, Qwen 2.5-Max meraih skor tertinggi 89,4 dalam benchmark Arena-Hard, yang mengevaluasi kualitas respons AI terhadap permintaan manusia.
Selain itu, dalam benchmark MMLU-Pro, yang mengukur kemampuan pemecahan masalah setingkat universitas, model ini menunjukkan performa lebih baik dibandingkan DeepSeek dan setara dengan ChatGPT.
Arsitektur Mixture of Experts (MoE)
Hanya sebagian kecil model yang diaktifkan untuk setiap tugas, meningkatkan efisiensi pemrosesan dan mengurangi konsumsi daya.
Performa Benchmark Unggulan
Skor 89,4 dalam Arena-Hard Benchmark, mengungguli DeepSeek-V3 dan Llama 3.1-405B.
Performa setara ChatGPT-4o dalam MMLU-Pro Benchmark untuk pemecahan masalah tingkat universitas.
Efisiensi Pemrosesan Bahasa
Lebih cepat dan hemat daya dibandingkan pesaingnya.
Unggul dalam tugas kompleks seperti penalaran logis, pemahaman konteks mendalam, dan pemecahan masalah matematika.
Kemampuan Multibahasa yang Ditingkatkan
Mendukung lebih banyak bahasa selain Mandarin dan Inggris, meningkatkan fleksibilitas penggunaan global.
Integrasi dengan Ekosistem Alibaba
Dioptimalkan untuk layanan Alibaba Cloud, serta platform e-commerce seperti Taobao dan Tmall, memungkinkan implementasi lebih cepat di berbagai industri.
Dengan berbagai keunggulan ini, Qwen 2.5-Max menjadi pesaing kuat di industri AI, terutama dalam persaingan dengan model dari DeepSeek dan OpenAI. (nsp)
Load more