Ada pemain AI baru di kota ini, dan Anda mungkin ingin memperhatikan yang satu ini.
Pada hari Senin, perusahaan kecerdasan buatan Tiongkok DeepSeek meluncurkan model bahasa besar sumber terbuka baru yang disebut DeepSeek R1.
Menurut DeepSeek, R1 mengungguli LLM populer lainnya (model bahasa besar) seperti OpenAI dalam beberapa tolok ukur penting, dan sangat baik dalam tugas matematika, pengkodean, dan penalaran.
Tweet mungkin telah dihapus
DeepSeek R1 sebenarnya merupakan penyempurnaan dari DeepSeek R1 Zero, yang merupakan LLM yang dilatih tanpa metode konvensional yang disebut dengan supervisi fine-tuning. Hal ini membuatnya sangat mampu dalam tugas-tugas tertentu, tetapi seperti yang dikatakan DeepSeek sendiri, Zero memiliki “keterbacaan dan pencampuran bahasa yang buruk”. Masukkan R1, yang memperbaiki masalah ini dengan menggabungkan “pelatihan multi-tahap dan data cold-start” sebelum dilatih dengan pembelajaran penguatan.
Kecepatan Cahaya yang Dapat Dihancurkan
Selain bahasa teknis yang misterius (detailnya tersedia online jika Anda tertarik), ada beberapa hal penting yang harus Anda ketahui tentang DeepSeek R1. Pertama, ini bersifat open source, artinya dapat diawasi oleh para ahli, sehingga dapat mengurangi kekhawatiran mengenai privasi dan keamanan. Kedua, gratis untuk digunakan sebagai aplikasi web, sementara akses API sangat murah ($0,14 untuk satu juta token masukan, dibandingkan dengan OpenAI sebesar $7,5 untuk model penalarannya yang paling kuat, o1).
OpenAI akan segera merilis Operator alat AI agen
Yang terpenting, benda ini sangat-sangat mumpuni. Untuk mengujinya, saya segera melemparkannya ke perairan dalam, memintanya untuk membuat kode aplikasi web yang cukup rumit yang diperlukan untuk mengurai data yang tersedia untuk umum, dan membuat situs web dinamis dengan informasi perjalanan dan cuaca untuk wisatawan. Hebatnya, DeepSeek langsung menghasilkan kode HTML yang benar-benar dapat diterima, dan mampu menyempurnakan situs berdasarkan masukan saya sambil meningkatkan dan mengoptimalkan kodenya sendiri.

Aku akan melakukan semua itu…besok.
Kredit: Stan Schroeder / Mashable / DeepSeek
Saya juga memintanya untuk meningkatkan keterampilan catur saya dalam lima menit, yang dibalas dengan sejumlah tips yang tertata rapi dan sangat berguna (keterampilan catur saya tidak meningkat, tetapi hanya karena saya terlalu malas untuk benar-benar mengikuti saran DeepSeek) .
Saya kemudian meminta DeepSeek untuk membuktikan seberapa pintarnya dalam tiga kalimat. Tindakan buruk yang saya lakukan, karena saya, sebagai manusia, tidak cukup pintar untuk memverifikasi atau bahkan memahami sepenuhnya salah satu dari tiga kalimat tersebut. Perhatikan, pada tangkapan layar di bawah, Anda dapat melihat “proses berpikir” DeepSeek saat ia menemukan jawabannya, yang mungkin bahkan lebih menarik daripada jawabannya sendiri.

Kami mengerti, Anda pintar.
Kredit: Stan Schroeder / Mashable / DeepSeek
Sangat mengesankan untuk digunakan. Namun seperti dicatat ZDnet, latar belakang semua ini adalah biaya pelatihan yang jauh lebih rendah dibandingkan beberapa model pesaing, serta chip yang tidak sekuat chip yang tersedia untuk perusahaan AI AS. Dengan demikian, DeepSeek menunjukkan bahwa AI yang sangat cerdas dengan kemampuan berpikir tidak harus terlalu mahal untuk dilatih — atau digunakan.
Topik
Kecerdasan Buatan