DeepSeek Luncurkan Model AI Baru, Guncang Silicon Valley Meski Terhambat Larangan Chip oleh Biden

EtIndonesia. Sebuah perusahaan kecerdasan buatan (AI) Tiongkok yang sebelumnya kurang dikenal, DeepSeek (nama lengkap: Hangzhou DeepSeek Artificial Intelligence Foundation Technology Research Co., Ltd.), telah meluncurkan model AI baru. Mereka mengklaim bahwa meski menggunakan chip dengan kinerja lebih rendah dan biaya lebih hemat, performa model ini melampaui model AI terbaik dari Amerika Serikat. Hal ini mengejutkan para pelaku teknologi di Silicon Valley.

DeepSeek Mengguncang Dunia Teknologi dengan AI Barunya

Menurut laporan CNBC, pada Desember tahun lalu, DeepSeek merilis sebuah model AI open-source besar bernama DeepSeek-V3. Model ini dibangun hanya dalam waktu dua bulan dengan menggunakan chip Nvidia H800, yang kinerjanya lebih rendah dibandingkan chip Nvidia lainnya yang lebih canggih. Biaya pengembangannya hanya 6 juta dolar AS—angka yang jauh lebih rendah dibandingkan dengan anggaran pengembangan model serupa oleh perusahaan besar seperti OpenAI dan Google.

Keberhasilan ini telah memicu kekhawatiran bahwa keunggulan global Amerika Serikat di bidang AI mulai terancam. Selain itu, keberhasilan ini menimbulkan pertanyaan tentang nilai investasi besar-besaran yang dilakukan oleh perusahaan teknologi dalam membangun model AI dan pusat data. Dalam berbagai pengujian pihak ketiga, model DeepSeek-V3 menunjukkan performa unggul, termasuk dalam menyelesaikan masalah kompleks, akurasi matematika, dan pemrograman. Bahkan, model ini mengalahkan beberapa model AI terkenal seperti Meta Llama 3.1, OpenAI GPT-4o, dan Anthropic Claude Sonnet 3.5.

Pada 20 Januari, DeepSeek kembali memperkenalkan model AI baru bernama DeepSeek-R1, yang diklaim menunjukkan performa lebih baik dibandingkan model terbaru OpenAI, o1, di sejumlah pengujian pihak ketiga.

Komentar dan Reaksi Pemimpin Teknologi

CEO Microsoft, Satya Nadella, dalam pidatonya di World Artificial Intelligence Conference, mengatakan: “Model baru DeepSeek sangat mengesankan. Mereka tidak hanya berhasil mengembangkan model open-source yang canggih, tetapi juga meningkatkan efisiensi perhitungan secara signifikan. Kita harus sangat serius mencermati perkembangan AI dari Tiongkok.”

Keberhasilan DeepSeek telah memunculkan spekulasi bahwa perusahaan ini mungkin telah menemukan cara untuk mengatasi larangan chip yang diberlakukan oleh Pemerintah Amerika Serikat, atau bahwa kontrol ekspor Washington tidak seketat yang diperkirakan. 

Pemerintahan Biden sebelumnya melarang ekspor chip Nvidia H100, salah satu chip AI paling canggih, ke Tiongkok. Namun, DeepSeek menunjukkan bahwa mereka dapat memanfaatkan chip dengan kinerja lebih rendah menggunakan metode inovatif seperti distillation—teknik mengoptimalkan model besar untuk menghasilkan model yang lebih kecil namun tetap efisien.

Menurut Chetan Puttagunta, mitra umum Benchmark:  “Mereka mengambil model besar yang sangat baik dan menggunakan proses distillation untuk melatih model kecil dalam tugas-tugas spesifik. Ini adalah pendekatan yang sangat hemat biaya.”

Latar Belakang Perusahaan dan Pendiri DeepSeek

DeepSeek didirikan oleh hedge fund Tiongkok bernama High-Flyer Quantitative, yang mengelola aset senilai 80 miliar dolar AS. Pendiri DeepSeek, Liang Wenfeng, dikenal sebagai sosok yang tidak banyak diekspos publik. Meski demikian, DeepSeek bukan satu-satunya perusahaan Tiongkok yang mencatatkan terobosan di bidang AI.

Startup lain seperti ZeroOne AI yang dipimpin oleh ahli AI terkenal, Kai-Fu Lee, berhasil membangun model AI dengan biaya hanya 3 juta dolar AS. Selain itu, pada 22 Januari, ByteDance, induk perusahaan TikTok, mengumumkan pembaruan model AI mereka yang diklaim mengungguli model o1 milik OpenAI dalam pengujian tertentu.

CEO Perplexity, Aravind Srinivas, menyatakan: “Kebutuhan adalah ibu dari penemuan. Karena mereka harus menemukan solusi, mereka akhirnya membangun produk yang lebih efisien.”

Meta Chief AI Expert: Kemajuan DeepSeek Menunjukkan Model Open Source Mulai Mengungguli Model Proprietary

Business Insider melaporkan bahwa setelah merilis model AI baru DeepSeek-R1, kebangkitan cepat perusahaan kecerdasan buatan open source asal Tiongkok, DeepSeek, telah menarik perhatian Silicon Valley. Dalam pengujian benchmark oleh pihak ketiga, performanya mengungguli perusahaan-perusahaan AI terkemuka AS seperti OpenAI, Meta, dan Anthropic.

Yann LeCun, Kepala Ahli AI di Meta, berpendapat bahwa pelajaran terbesar dari kesuksesan DeepSeek bukanlah ancaman yang meningkat dari pesaing Tiongkok, melainkan nilai dari menjaga model AI tetap open source agar siapa pun dapat mengambil manfaatnya.

Dalam sebuah postingan di media sosial Threads, LeCun menyatakan bahwa ini bukan berarti tingkat kecerdasan buatan Tiongkok “telah melampaui Amerika Serikat,” melainkan bahwa “model open source sedang mengungguli model proprietary.” DeepSeek “mendapat manfaat dari penelitian terbuka dan open source,” dan inilah kekuatan dari penelitian terbuka dan open source.

DeepSeek R1 sendiri adalah model AI open source, sama seperti model Llama milik Meta. OpenAI awalnya didirikan sebagai perusahaan AI open source, tetapi belakangan ini telah beralih ke model tertutup.

Pada 20 Januari, DeepSeek menyatakan dalam peluncuran model AI baru DeepSeek-R1 bahwa model tersebut “menunjukkan kemampuan penalaran yang luar biasa” dan sedang “mendorong batas-batas AI open source.”

Beberapa hari setelah pengumuman DeepSeek, CEO Meta, Mark Zuckerberg, mengumumkan bahwa perusahaan tersebut berencana untuk berinvestasi lebih dari 600 miliar dolar di bidang AI pada tahun 2025. Zuckerberg sendiri telah lama menjadi pendukung model AI open source.

Para pendukung model AI open source berargumen bahwa karena siapa pun dapat memodifikasi dan mendistribusikan ulang kode program, model open source memungkinkan perkembangan teknologi yang cepat dan demokratis. Di sisi lain, pendukung model tertutup berpendapat bahwa model tersebut lebih aman karena kode programnya bersifat rahasia.

Larangan Chip Biden Sulit Menghambat Ambisi Teknologi Tinggi Beijing


Financial Times melaporkan bahwa meskipun larangan chip Biden berupaya menghalangi ambisi teknologi tinggi Beijing, DeepSeek, yang didirikan oleh miliarder Tiongkok dan pengelola dana lindung nilai, Liang Wenfeng, tetap membangun model AI baru DeepSeek R1 meskipun dengan anggaran keuangan yang terbatas.

Setelah pemerintah AS melarang Nvidia mengekspor chip tercanggihnya ke Tiongkok, perusahaan-perusahaan kecerdasan buatan Tiongkok dipaksa mencari metode inovatif untuk memaksimalkan daya komputasi dari jumlah chip yang terbatas. Jelas bahwa DeepSeek, di bawah kepemimpinan Liang Wenfeng, telah menemukan solusi untuk masalah ini.

Dalam wawancara dengan media, seorang peneliti AI yang dekat dengan DeepSeek mengatakan: “Para insinyur DeepSeek tahu bagaimana memanfaatkan potensi penuh dari GPU ini, meskipun itu bukan produk teknologi paling canggih.”

Para pelaku industri menyatakan bahwa fokus DeepSeek pada penelitian menjadikannya pesaing yang berbahaya karena mereka bersedia membagikan terobosan mereka, alih-alih melindunginya untuk keuntungan komersial. DeepSeek belum mengumpulkan dana dari sumber eksternal dan belum mengambil langkah besar untuk memonetisasi model mereka.

Seorang investor AI di Beijing mengatakan: “Cara DeepSeek beroperasi mirip dengan cara DeepMind pada awal berdirinya,” yang terutama berfokus pada pengembangan AI dan proyek-proyek kecerdasan buatan terkait.

DeepSeek dan High-Flyer belum menanggapi permintaan komentar

Menurut pernyataan yang dirilis oleh DeepSeek, model AI baru ini, yang terdiri dari 671 miliar parameter, hanya menggunakan 2.048 chip Nvidia H800 dengan biaya hanya 5,6 juta dolar. Ini hanyalah sebagian kecil dari biaya yang dikeluarkan oleh OpenAI dan Google untuk melatih model dengan skala yang setara.

Para pelaku industri semikonduktor menyatakan bahwa meskipun DeepSeek telah mencapai kemajuan yang mengesankan dengan sumber daya yang terbatas, apakah mereka dapat mempertahankan daya saingnya di industri ini masih menjadi tanda tanya. (jhn/yn)

FOKUS DUNIA

NEWS