Gagasan tentang asisten kecerdasan buatan seperti manusia yang dapat Anda ajak bicara telah hidup dalam imajinasi banyak orang sejak rilis “Her,” film Spike Jonze 2013 tentang seorang pria yang jatuh cinta dengan AI seperti Siri bernama Samantha. Selama film, protagonis bergulat dengan cara -cara di mana Samantha, nyata seperti yang terlihat, bukan dan tidak akan pernah menjadi manusia.
Dua belas tahun kemudian, ini bukan lagi fiksi ilmiah. Alat AI generatif seperti chatgpt dan asisten digital seperti Apple Siri dan Alexa Amazon membantu orang mendapatkan petunjuk arah mengemudi, membuat daftar belanjaan, dan banyak lagi. Tapi seperti halnya Samantha, sistem pengenalan suara otomatis masih tidak dapat melakukan segala yang bisa dilakukan oleh pendengar manusia.
Anda mungkin memiliki pengalaman frustasi menelepon bank atau perusahaan utilitas Anda dan perlu mengulangi diri Anda sendiri sehingga bot layanan pelanggan digital di jalur lain dapat memahami Anda. Mungkin Anda telah mendikte catatan di ponsel Anda, hanya untuk menghabiskan waktu mengedit kata -kata kacau.
Peneliti linguistik dan ilmu komputer telah menunjukkan bahwa sistem ini bekerja lebih buruk bagi sebagian orang daripada yang lain. Mereka cenderung membuat lebih banyak kesalahan jika Anda memiliki aksen non-pribumi atau regional, berkulit hitam, berbicara dalam bahasa Inggris bahasa Amerika Afrika, switch kode, jika Anda seorang wanita, sudah tua, terlalu muda atau memiliki hambatan bicara.
Telinga timah
Tidak seperti Anda atau saya, sistem pengenalan suara otomatis bukanlah yang oleh para peneliti disebut sebagai “pendengar simpatik.” Alih -alih mencoba memahami Anda dengan mengambil petunjuk berguna lainnya seperti intonasi atau gerakan wajah, mereka menyerah begitu saja. Atau mereka menebak probabilistik, suatu langkah yang kadang -kadang dapat menyebabkan kesalahan.
Karena perusahaan dan lembaga publik semakin mengadopsi alat pengenalan suara otomatis untuk memotong biaya, orang memiliki sedikit pilihan selain berinteraksi dengan mereka. Tetapi semakin banyak sistem ini mulai digunakan di bidang -bidang kritis, mulai dari responden darurat pertama dan perawatan kesehatan hingga pendidikan dan penegakan hukum, semakin besar kemungkinan akan ada konsekuensi besar ketika mereka gagal mengenali apa yang dikatakan orang.
Bayangkan dalam waktu dekat Anda terluka dalam kecelakaan mobil. Anda menghubungi 911 untuk meminta bantuan, tetapi alih -alih terhubung ke operator manusia, Anda mendapatkan bot yang dirancang untuk menyingkirkan panggilan non -darurat. Butuh beberapa putaran untuk dipahami, membuang -buang waktu dan meningkatkan tingkat kecemasan Anda pada saat terburuk.
Apa yang menyebabkan kesalahan semacam ini terjadi? Beberapa ketidaksetaraan yang dihasilkan dari sistem ini dipanggang ke dalam rim data linguistik yang digunakan pengembang untuk membangun model bahasa besar. Pengembang melatih sistem kecerdasan buatan untuk memahami dan meniru bahasa manusia dengan memberi mereka sejumlah besar file teks dan audio yang berisi ucapan manusia nyata. Tapi pidato siapa mereka memberi mereka makan?
Jika suatu sistem mencetak tingkat akurasi tinggi ketika berbicara dengan orang kulit putih Amerika yang kaya berusia pertengahan 30-an, masuk akal untuk menebak bahwa itu dilatih menggunakan banyak rekaman audio orang yang sesuai dengan profil ini.
Dengan pengumpulan data yang ketat dari beragam sumber, pengembang AI dapat mengurangi kesalahan ini. Tetapi untuk membangun sistem AI yang dapat memahami variasi tak terbatas dalam ucapan manusia yang timbul dari hal -hal seperti gender, usia, ras, bahasa pertama vs kedua, status sosial ekonomi, kemampuan dan banyak hal lain, membutuhkan sumber daya dan waktu yang signifikan.
Bahasa Inggris 'tepat'
Bagi orang yang tidak berbicara bahasa Inggris – artinya, kebanyakan orang di seluruh dunia – tantangannya bahkan lebih besar. Sebagian besar sistem AI generatif terbesar di dunia dibangun dalam bahasa Inggris, dan mereka bekerja jauh lebih baik dalam bahasa Inggris daripada dalam bahasa lain. Di atas kertas, AI memiliki banyak potensi sipil untuk terjemahan dan meningkatkan akses orang ke informasi dalam berbagai bahasa, tetapi untuk saat ini, sebagian besar bahasa memiliki jejak digital yang lebih kecil, sehingga sulit bagi mereka untuk memberi daya model bahasa besar.
Bahkan dalam bahasa yang dilayani dengan baik oleh model bahasa besar, seperti bahasa Inggris dan Spanyol, pengalaman Anda bervariasi tergantung pada dialek bahasa yang Anda gunakan.
Saat ini, sebagian besar sistem pengenalan suara dan chatbot AI generatif mencerminkan bias linguistik dari dataset yang dilatih. Mereka menggemakan gagasan preskriptif, terkadang berprasangka tentang “kebenaran” dalam pidato.
Faktanya, AI telah terbukti “meratakan” keragaman linguistik. Sekarang ada perusahaan startup AI yang menawarkan untuk menghapus aksen pengguna mereka, memanfaatkan asumsi bahwa pelanggan utama mereka adalah penyedia layanan pelanggan dengan pusat panggilan di negara -negara asing seperti India atau Filipina. Penawaran melanggengkan gagasan bahwa beberapa aksen kurang valid daripada yang lain.
Koneksi manusia
AI mungkin akan menjadi lebih baik dalam pemrosesan bahasa, memperhitungkan variabel seperti aksen, pengalihan kode dan sejenisnya. Di AS, layanan publik diwajibkan berdasarkan hukum federal untuk menjamin akses yang adil ke layanan terlepas dari bahasa apa yang dibicarakan seseorang. Tetapi tidak jelas apakah itu saja akan menjadi insentif yang cukup bagi industri teknologi untuk bergerak menuju menghilangkan ketidakadilan linguistik.
Banyak orang mungkin lebih suka berbicara dengan orang sungguhan ketika mengajukan pertanyaan tentang tagihan atau masalah medis, atau setidaknya memiliki kemampuan untuk memilih keluar dari berinteraksi dengan sistem otomatis saat mencari layanan utama. Itu bukan untuk mengatakan bahwa miskomunikasi tidak pernah terjadi dalam komunikasi interpersonal, tetapi ketika Anda berbicara dengan orang sungguhan, mereka siap menjadi pendengar yang simpatik.
Dengan AI, setidaknya untuk saat ini, itu berfungsi atau tidak. Jika sistem dapat memproses apa yang Anda katakan, Anda siap melakukannya. Jika tidak bisa, tanggung jawab ada pada Anda untuk membuat diri Anda dipahami.
Roberto Rey Agudo, Asisten Peneliti Profesor Spanyol dan Portugis, Dartmouth College
Artikel ini diterbitkan ulang dari percakapan di bawah lisensi Creative Commons. Baca artikel asli.