Inikah Deepfake Tersembunyi di Film Anthony Bourdain?


Kapan pelari jalan, sebuah film dokumenter tentang mendiang koki TV dan pelancong Anthony Bourdain, dibuka di bioskop bulan lalu, sutradaranya, Morgan Neville, membumbui wawancara promosi dengan pengungkapan yang tidak konvensional untuk seorang dokumenter. Beberapa kata yang penonton dengar Bourdain berbicara dalam film itu dipalsukan oleh perangkat lunak kecerdasan buatan yang digunakan untuk meniru suara sang bintang.

Tuduhan dari penggemar Bourdain bahwa Neville telah bertindak tidak etis dengan cepat mendominasi liputan film tersebut. Terlepas dari perhatian itu, berapa banyak suara Bourdain palsu dalam film dua jam itu, dan apa yang dikatakannya, tidak jelas—sampai sekarang.

Dalam sebuah wawancara yang membuat filmnya terkenal, Neville mengatakan Orang New York bahwa dia telah membuat tiga klip Bourdain palsu dengan izin dari tanah miliknya, semua dari kata-kata yang telah ditulis atau dikatakan koki tetapi itu tidak tersedia sebagai audio. Dia hanya mengungkapkan satu, email Bourdain “membaca” di trailer film, tetapi membual bahwa dua klip lainnya tidak akan terdeteksi. “Jika Anda menonton film itu,” Orang New York mengutip perkataan Neville pemenang Oscar, “Anda mungkin tidak tahu apa kalimat lain yang diucapkan oleh AI, dan Anda tidak akan tahu.”

Pakar audio di Pindrop, perusahaan rintisan yang membantu bank dan lainnya memerangi penipuan telepon, merasa mereka tahu. Jika analisis perusahaan benar, kontroversi Bourdain deepfake berakar pada audio kurang dari 50 detik dalam film berdurasi 118 menit.

Analisis Pindrop menandai kutipan email yang diungkapkan oleh Neville dan juga klip di awal film yang tampaknya diambil dari esai yang ditulis Bourdain tentang Vietnam berjudul “The Hungry American,” yang dikumpulkan dalam bukunya tahun 2008, Bit yang Menjijikkan. Itu juga menyoroti audio di tengah film di mana koki mengamati bahwa banyak koki dan penulis memiliki “naluri tanpa henti untuk mengacaukan hal yang baik.” Kalimat yang sama muncul dalam wawancara Bourdain dengan situs makanan First We Feast pada kesempatan ulang tahunnya yang ke-60 pada tahun 2016, dua tahun sebelum dia meninggal karena bunuh diri.

Ketiga klip terdengar seperti Bourdain. Namun, pada pendengaran dekat, mereka tampaknya memiliki ciri-ciri ucapan sintetik, seperti prosodi aneh dan frikatif seperti bunyi “s” dan “f”. Seorang pengguna Reddit secara independen menandai tiga klip yang sama dengan Pindrop, menulis bahwa mereka mudah didengar saat menonton film untuk kedua kalinya. Distributor film, Focus Features, tidak menanggapi permintaan komentar; Perusahaan produksi Neville menolak berkomentar.

Direktur Roadrunner mengatakan klip koki yang merenungkan kebahagiaan ini disintesis menggunakan perangkat lunak AI.

Sumber audio: Pindrop

Ketika Neville memperkirakan bahwa penggunaan media yang dihasilkan AI, kadang-kadang disebut deepfake, tidak akan terdeteksi, dia mungkin melebih-lebihkan kecanggihan pemalsuannya sendiri. Dia mungkin tidak mengantisipasi kontroversi atau perhatian yang akan diambil dari penggunaan tekniknya dari penggemar dan pakar audio. Ketika kehebohan mencapai telinga para peneliti di Pindrop, mereka melihat kasus uji yang sempurna untuk perangkat lunak yang mereka buat untuk mendeteksi audio deepfake; mereka mengaturnya agar berfungsi ketika film tersebut memulai debutnya di layanan streaming awal bulan ini. “Kami selalu mencari cara untuk menguji sistem kami, terutama dalam kondisi nyata—ini adalah cara baru untuk memvalidasi teknologi kami,” kata Collin Davis, chief technology officer Pindrop.

Hasil Pindrop mungkin telah memecahkan misteri deepfake yang hilang dari Neville, tetapi episode ini menandakan kontroversi di masa depan karena deepfake menjadi lebih canggih dan dapat diakses untuk proyek kreatif dan jahat.

Diposting oleh : Lagutogel