Teknologi Al bisa Tiru Suara Artis, Ancaman atau Keuntungan? – Baru baru ini, suara Ariana Grande yang “menyanyikan” lagu lagu Indonesia berseliweran di linimasa media sosial kita. Bahkan, Presiden RI, Joko Widodo (Jokowi) juga ikut “menyanyikan” lagu Asmalibrasi milik group musik Soegi Bornean.
Tantu saja itu tidak nyata karena suara tersebut dibuat menggunakan teknologi artificial intelligence (Al) atau kecerdasan buatan. Hampir saja kita kegocek, ya?
Namun, Al pengubah suara ini menuai pro-kontra dari masyarakat. Banyak yang menikmati, tetapi tidak sedikit pula yang menentang. Mengapa demikian?
1. Salah satu platform yang diklaim paling realistis adalah ElevenLabs
Mengutip LiveMint, salah satu Al voice generators yang banyak digunakan dan diklaim paling realistis adalah ElevenLabs. Selain itu, ada pula BandLab dan Voicemod.net. Dengan ini, kita bisa mengubah tulisan menjadi suara dalam hitungan suara dalam hitungan detik, tanpa perlu registrasi terlebih dahulu.
Menggunakan model text-to-speech (TTS), ElevenLabs bisa mengonversi tulisan apa pun yang kita ketik menjadi audio. Terdapat sembilan preset suara laki-laki dan perempuan yang bisa dipilih sesuai preferensi masing-masing.
Jika kita adalah content creator, suara tersebut bisa dimasukkan ke dalam video sebagai narasi. Selain itu, juga bisa digunakan untuk membacakan berita maupun audiobook.
2. Tetapi, teknologi ini mulai banyak disalahgunakan
Sebagian orang menggunakan AI ini untuk bersenang-senang, seperti membuat selebriti atau public figure menyanyikan sebuah lagu. Tetapi, perlu diingat bahwa tidak semua orang di internet itu innocent.
Ada yang memiliki niat jahat, menggunakan suara tokoh terkenal untuk menyebarkan ujaran kebencian (hate speech), propaganda politik, melakukan penipuan, hingga ucapan berbau seks.
Contohnya, ada yang membuat Emma Watson seolah membacakan Mein Kampf, manifesto yang ditulis oleh Adolf Hitler. Atau membuat Presiden AS, Joe Biden, seolah mengumumkan invasi ke Rusia.
Tentu saja, ini akan merusak reputasi atau image orang tersebut. Bahkan, bisa membuat seseorang tersandung masalah hukum hingga memantik perang!
3. Verifikasi tambahan diperlukan sebagai perlindungan
Sadar akan potensi bahaya, ElevenLabs berencana meluncurkan perlindungan tambahan, seperti mewajibkan pengguna melengkapi identitas, meng-update informasi pembayaran, hingga memverifikasi secara manual setiap permintaan kloning suara.
Selain itu, ElevenLabs juga meminta pengguna Twitter untuk memberikan feedback tentang bagaimana penyalahgunaan kloning suara bisa dihentikan. Ini dicuitkan lewat akun Twitter resmi mereka, @elevenlabsio, pada 30 Januari 2023.
Perusahaan menuntut untuk menggunakan suara Remie Michelle Clarke. Artis vokal pemenang penghargaan, aksen Irlandianya yang halus mendukung iklan untuk Mazda dan Mastercard dan merupakan suara mesin pencari Microsoft, Bing, di Irlandia.
Namun pada bulan Januari, teknisi suaranya memberi tahu Michelle Clarke bahwa dia menemukan suara yang terdengar sangat mirip dengan miliknya di suatu tempat yang tidak terduga: di Revoicer.com , dikreditkan ke seorang wanita bernama “Olivia”. Dengan biaya bulanan yang rendah, pelanggan Revoicer dapat mengakses ratusan suara yang berbeda dan, melalui alat yang didukung kecerdasan buatan, mengubah mereka untuk mengatakan apa saja — menyuarakan iklan, membacakan pelatihan perusahaan, atau menceritakan buku.
Revoicer mengiklankan “Olivia” dengan foto seorang wanita berambut abu-abu, yang tampaknya keturunan Asia, dan uraian singkat: “Suara yang dalam, tenang dan baik hati. Luar biasa [sic] untuk buku audio.”
Brunette berusia 38 tahun, Michelle Clarke tidak terlihat seperti “Olivia”. Tapi ketika dia menekan play, dia disambut dengan suara menggelegar dari apa yang hanya bisa menjadi suaranya sendiri: “Halo sayangku, namaku Olivia,” katanya. “Saya memiliki suara yang lembut dan penuh perhatian.”
“Ini benar-benar aneh,” kata Michelle Clarke dalam sebuah wawancara dengan The Washington Post. “Saat Anda melihat suara Anda telah diubah dan dirusak… ada sesuatu yang sangat mengganggu.”
Tapi Michelle Clarke bukan satu-satunya yang mendapati suaranya dirampas dari kendalinya. Kemajuan dalam kecerdasan buatan generatif, teknologi yang membentuk teks, gambar, atau suara berdasarkan data yang diberikannya, telah memungkinkan perangkat lunak untuk membuat ulang suara orang dengan presisi yang menakutkan. Perangkat lunak semacam itu dapat dengan cepat menemukan pola, membandingkan sampel kecil dengan database jutaan suara, memungkinkan pengguna menggunakan alat text-to-speech sederhana untuk mengubah suara agar mengatakan apa pun yang mereka ketik.
Teknologi tersebut menjadi perhatian publik bulan ini, ketika seorang produser musik mengklaim menggunakan versi AI dari suara Drake dan Weeknd untuk membuat lagu baru, “Heart on My Sleeve”, yang menyebar dengan cepat di TikTok. Sejumlah selebritas telah mengalami deepfake verbal ini, termasuk Emma Watson, yang suaranya yang dikloning membacakan bagian-bagian dari Mein Kampf Adolf Hitler, dan Presiden Biden, yang secara artifisial dibuat untuk mengatakan bahwa dia lebih menyukai mariyuana berkualitas rendah.
Namun teknologi tersebut menempatkan aktor suara, para profesional yang seringkali tidak disebutkan namanya yang menarasikan buku audio, video game, dan iklan, dalam posisi yang sangat berbahaya. Sementara suara mereka sering dikenal, mereka jarang memerintahkan kekuatan bintang yang diperlukan untuk mengendalikan suara mereka. Undang-undang tersebut menawarkan sedikit perlindungan, karena ketentuan hak cipta belum bergulat dengan kemampuan kecerdasan buatan untuk membuat ulang ucapan, teks, dan foto seperti manusia. Dan para ahli mengatakan kontrak lebih sering berisi ketentuan-ketentuan cetak halus yang memungkinkan perusahaan menggunakan suara aktor dalam permutasi yang tak ada habisnya, bahkan menjualnya ke pihak lain.
Neal Throdes, pengembang Revoicer.com , mengatakan perusahaan menggunakan suara tersebut melalui perjanjian lisensi dengan Microsoft, yang memungkinkan mereka mengakses sampel Michelle Clarke tanpa batas. Beberapa jam setelah The Post menghubungi Revoicer.com , perusahaan tersebut berjanji untuk menghapus suara tersebut dari situs mereka. “Kami telah mengambil tanggung jawab,” kata Throdes dalam email, menambahkan ” Revoicer.com tidak bertanggung jawab atas situasi yang [Michelle Clarke] alami.”