Kesayangan teknologi Jerman, DeepL, (akhirnya) meluncurkan layanan suara-ke-teks. Ini disebut DeepL Voice, dan mengubah audio dari percakapan langsung atau video menjadi teks terjemahan.
Pengguna DeepL kini dapat mendengarkan orang berbicara dalam bahasa yang tidak mereka pahami dan secara otomatis menerjemahkannya ke bahasa yang mereka pahami — secara real-time. Fitur baru saat ini mendukung bahasa Inggris, Jerman, Jepang, Korea, Swedia, Belanda, Prancis, Turki, Polandia, Portugis, Rusia, Spanyol, dan Italia.
Apa yang membuat peluncuran DeepL Voice menarik adalah bahwa ia berjalan pada jaringan saraf yang sama dengan penawaran teks-ke-teks perusahaan, yang mana klaim adalah “yang terbaik di dunia” AI penterjemah.
Sebagai seseorang yang baru saja pindah ke luar negeri, saya tertarik untuk mencoba penerjemah suara ke teks yang mungkin berhasil. Semua yang saya coba sejauh ini tidak real-time — ada jeda yang menjadikannya tidak berguna — dan kualitas terjemahannya sangat buruk.
Webinar: DNA Unicorn: Cetak Biru untuk Meningkatkan Kesuksesan
Apa yang diperlukan untuk membuat unicorn? Pada tanggal 19 November, pukul 15.00 CET, para eksekutif puncak perusahaan unicorn akan mengungkapkan pola pikir, strategi, dan pemikiran inovatif yang mendorong perusahaan mereka mencapai puncak.
Untuk percakapan tatap muka, Anda dapat meluncurkan DeepL Voice di ponsel Anda dan menempatkannya di antara Anda dan pembicara lainnya. Ini kemudian menampilkan percakapan Anda sehingga setiap orang dapat mengikuti terjemahan dengan mudah di satu perangkat.
Anda juga dapat mengintegrasikan DeepL Voice ke dalam Microsoft Teams dan konferensi video lintas kendala bahasa. Teks yang diterjemahkan muncul di sidebar sebagai keterangan. Masih harus dilihat apakah DeepL Voice akan tersedia di platform seperti Zoom atau Google Meet dalam waktu dekat.
'Perbatasan berikutnya'
Meskipun ini adalah penawaran pertama DeepL, kemungkinan besar ini bukan yang terakhir. Pendiri dan CEO DeepL, Jarek Kutylowski ditelepon terjemahan suara waktu nyata yang “perbatasan berikutnya” untuk bisnis.
“DeepL sudah menjadi pemimpin dalam penerjemahan tertulis, namun penerjemahan ucapan secara real-time adalah cerita yang berbeda,” kata pendiri dan CEO DeepL, Jarek Kutylowski.
“Saat menerjemahkan ucapan, Anda menghadapi masukan yang tidak lengkap, masalah pengucapan, latensi, dan banyak lagi, yang semuanya dapat menyebabkan terjemahan tidak akurat dan pengalaman pengguna yang buruk.
“Jadi kami membangun solusi yang akan mempertimbangkan hal ini dan memungkinkan bisnis untuk menghilangkan hambatan bahasa dengan memungkinkan mereka berkomunikasi dalam berbagai bahasa sesuai kebutuhan,” kata Kutylowski.
Kualitas kemungkinan akan menjadi faktor pembeda DeepL Voice dari banyak penyedia terjemahan suara-ke-teks lainnya.
Dari perspektif teknologi, kesuksesan DeepL terletak pada arsitektur jaringan sarafnya, masukan dari editor manusia, dan data pelatihan. Namun Kutylowski juga yakin perusahaan ini memiliki keunggulan utama dibandingkan para pesaingnya: fokus.
“Fokus selalu merupakan hal yang penting,” Kutylowski diberitahu sebelumnya TNW. “Penerjemahan bukanlah bisnis inti Google — ini adalah salah satu dari 100 pekerjaan sampingan. Hal yang sama berlaku jika Anda menganggap LLM dan OpenAI di dunia ini sebagai pesaing kita; terjemahan hanyalah satu hal yang mereka lakukan dan GPU mereka melakukan banyak hal berbeda. Kami fokus pada satu bidang tertentu.”
Pada bulan Mei, DeepL mencapai valuasi $2 miliar setelah mendapatkan investasi baru sebesar $300 juta (€277 juta). Ini mencakup 32 bahasa dan memiliki lebih dari 100.000 pengguna bisnis.