Dalam seminggu saja, model bahasa besar R1 Deepseek telah mencopot chatgpt di App Store, mengguncang pasar saham, dan menjadi ancaman serius bagi Openai dan, dengan ekstensi, dominasi AS dari industri AI.
Senin lalu, perusahaan AI China Deepseek merilis LLM open-source bernama Deepseek R1, menjadi chatbot AI paling buzzest sejak chatgpt. Ini konon sama baiknya – jika tidak lebih baik – daripada model Openai, lebih murah untuk digunakan, dan diduga dikembangkan dengan lebih sedikit chip daripada para pesaingnya. Inilah yang perlu Anda ketahui tentang Deepseek R1 dan mengapa semua orang tiba -tiba membicarakannya.
Deepseek R1 mengklaim melampaui model openai dalam tolok ukur utama
Dengan rilis Deepseek R1, perusahaan menerbitkan laporan tentang kemampuannya, termasuk kinerja pada tolok ukur standar industri. Deepseek mengklaim LLM mengalahkan model penalaran Openai O1 pada tes matematika dan pengkodean lanjutan (AIME 2024, Math-500, SWE-Bench diverifikasi) dan diperoleh tepat di bawah O1 pada benchmark pemrograman lain (Codeforces), Science Level-Level (GPQA Diamond), dan Pengetahuan Umum (MMLU).
Deepseek AI mungkin lebih pintar dari AI paling cerdas di Openai, dan Anda dapat mencobanya sekarang
Stan Schroeder dari Mashable menguji Deepseek R1 dengan memintanya untuk “kode aplikasi web yang cukup kompleks yang perlu mengurai data yang tersedia untuk umum, dan membuat situs web yang dinamis dengan informasi perjalanan dan cuaca untuk wisatawan,” dan datang terkesan dengan kemampuannya.
Pada titik ini, ada beberapa LLM yang berkinerja sebanding dengan model Openai, seperti Anthropic Claude, model Llama open-source meta, dan Google Gemini. Tetapi kinerja Deepseek R1, dikombinasikan dengan faktor -faktor lain, menjadikannya pesaing yang kuat.
Kecepatan cahaya yang dapat dipasangkan
Tidak seperti model openai, Deepseek R1 adalah open source
Karena Deepseek R1 adalah open source, siapa pun dapat mengakses dan mengubahnya untuk tujuan mereka sendiri. Ini juga memungkinkan programmer untuk melihat di bawah kap dan melihat cara kerjanya. Model open-source dianggap penting untuk meningkatkan penggunaan AI dan mendemokratisasi kemampuan AI karena pemrogram dapat membangunnya alih-alih membutuhkan daya komputasi bernilai jutaan dolar untuk membangun sendiri.
Meta mengambil pendekatan ini dengan merilis Llama sebagai open source, dibandingkan dengan Google dan Openai, yang dikritik oleh pendukung sumber terbuka sebagai penjaga gerbang. Model Gemini Google adalah sumber tertutup, tetapi memang memiliki keluarga model open-source yang disebut Gemma.
Murah untuk digunakan dan murah untuk dibangun
Deepseek R1 memiliki versi aplikasi web gratis, dapat diakses melalui chat.deepseek.com, dan API yang harganya jauh lebih murah daripada akses API Openai ke modelnya yang paling canggih. Model penalarannya berharga $ 0,14 untuk satu juta token input yang di -cache, dibandingkan dengan $ 7,50 per satu juta token input cache untuk model O1 Openai. Itu adalah mencuri mutlak yang tidak mengejutkan membuat programmer berbondong -bondong ke sana.
Untuk orang dalam industri AI dan investor teknologi, pencapaian paling signifikan dari Deepseek R1 adalah betapa sedikitnya kekuatan komputasi (diduga) yang diperlukan untuk membangunnya. Menurut Insinyur Deepseek via The New York Timesmodel R1 hanya membutuhkan 2.000 chip NVIDIA. Itu dibandingkan dengan 10.000 GPU NVIDIA yang dilaporkan diperlukan untuk model Openai pada tahun 2023, jadi tidak diragukan lagi sekarang lebih banyak.
Itu klaim yang cukup berani, tetapi jika benar, itu mempertanyakan berapa banyak investasi yang diperlukan untuk mengembangkan pusat data seperti proyek Stargate $ 500 miliar yang sedang berlangsung. Pasar saham tentu saja memperhatikan dugaan efisiensi biaya Deepseek R1, dengan Nvidia mengambil penurunan harga saham 13 persen pada hari Senin.
Deepseek R1 adalah raja baru di toko aplikasi Apple
Jelas, pengguna telah memperhatikan kecakapan Deepseek R1. Pada hari Senin, The New Kid on the Block menduduki puncak Apple App Store sebagai aplikasi gratis nomor satu, mengganti chatgpt sebagai aplikasi gratis yang berkuasa.
Siapa yang tahu jika momentum Deepseek R1 akan berlanjut, tetapi itu pasti telah menyalakan kembali balapan AI dan membawa kompetisi ke ketinggian global.
Topik
Kecerdasan buatan openai