Mantan Jurnalis Ini Menggunakan AI untuk Menangkap Pencemaran Nama Baik Online


Wawasan yang mendorong CalibreAI adalah bahwa alam semesta ini adalah a dibatasi tak terhingga. Meskipun moderasi AI sama sekali tidak dapat secara tegas memutuskan kebenaran dan kepalsuan, ia harus dapat mengidentifikasi bagian dari pernyataan yang bahkan berpotensi mencemarkan nama baik.

Carl Vogel, seorang profesor linguistik komputasi di Trinity College Dublin, telah membantu CalibreAI membangun modelnya. Ia memiliki formula kerja untuk pernyataan yang kemungkinan besar akan mencemarkan nama baik: Pernyataan tersebut harus secara implisit atau eksplisit menyebutkan nama individu atau kelompok; mengajukan klaim sebagai fakta; dan menggunakan semacam bahasa atau gagasan yang tabu — seperti saran pencurian, mabuk, atau jenis ketidakwajaran lainnya. Jika Anda memberi algoritme pembelajaran mesin sampel teks yang cukup besar, itu akan mendeteksi pola dan asosiasi di antara kata-kata negatif berdasarkan perusahaan yang mereka pertahankan. Itu akan memungkinkannya untuk membuat tebakan cerdas tentang istilah mana, jika digunakan tentang kelompok atau orang tertentu, menempatkan sebuah konten ke dalam zona bahaya pencemaran nama baik.

Cukup logis, tidak ada kumpulan data dari materi yang memfitnah yang dapat digunakan CalibreAI, karena penerbit bekerja sangat keras untuk menghindari hal itu ke dunia nyata. Jadi perusahaan membangunnya sendiri. Conor Brady memulai dengan memanfaatkan pengalamannya yang panjang dalam jurnalisme untuk menghasilkan daftar pernyataan yang mencemarkan nama baik. “Kami memikirkan semua hal buruk yang dapat dikatakan tentang siapa pun dan kami memotong, memotong, dan mencampurnya sampai kami menjalankan keseluruhan kelemahan manusia,” katanya. Kemudian sekelompok anotator, diawasi oleh Alan Reid dan Abby Reynolds, seorang ahli bahasa komputasi dan ahli bahasa data dalam tim, menggunakan daftar asli untuk membuat daftar yang lebih besar. Mereka menggunakan kumpulan data yang dibuat-buat ini untuk melatih AI untuk menetapkan skor probabilitas ke kalimat, dari 0 (jelas tidak memfitnah) hingga 100 (hubungi pengacara Anda).

Hasilnya, sejauh ini, adalah seperti pemeriksaan ejaan untuk pencemaran nama baik. Anda dapat bermain dengan versi demo di situs web perusahaan, yang memperingatkan bahwa “Anda mungkin melihat positif / negatif palsu saat kami menyempurnakan model prediktif kami”. Saya mengetik “Saya percaya John adalah pembohong”, dan program tersebut memberikan probabilitas 40, di bawah ambang pencemaran nama baik. Lalu saya mencoba “Semua orang tahu John adalah pembohong”, dan program tersebut mengeluarkan probabilitas 80 persen, menandai “Semua orang tahu” (pernyataan fakta), “John” (orang tertentu), dan “pembohong” (bahasa negatif) . Tentu saja, itu tidak menyelesaikan masalah. Dalam kehidupan nyata, risiko hukum saya akan bergantung pada apakah saya dapat membuktikan bahwa John benar-benar pembohong.

“Kami mengklasifikasikan pada tingkat linguistik dan mengembalikan nasihat itu kepada pelanggan kami,” kata Paul Watson, kepala bagian teknologi perusahaan. “Kemudian pelanggan kami harus menggunakan pengalaman bertahun-tahun mereka untuk mengatakan, ‘Apakah saya setuju dengan nasihat ini?’ Saya pikir itu adalah fakta yang sangat penting dari apa yang kami bangun dan coba lakukan. Kami tidak mencoba membangun mesin kebenaran dasar untuk alam semesta. “

Wajar untuk bertanya-tanya apakah jurnalis profesional benar-benar membutuhkan algoritme untuk memperingatkan bahwa mereka mungkin mencemarkan nama baik seseorang. “Setiap editor atau produser yang baik, jurnalis berpengalaman, harus mengetahuinya ketika dia melihatnya,” kata Sam Terilli, seorang profesor di Sekolah Komunikasi Universitas Miami dan mantan penasihat umum dari Miami Herald. “Mereka harus dapat setidaknya mengidentifikasi pernyataan atau bagian yang berpotensi berisiko dan layak untuk dilihat lebih dalam.”

Namun, cita-cita tersebut mungkin tidak selalu dapat dicapai, terutama selama periode anggaran yang tipis dan tekanan berat untuk menerbitkan secepat mungkin.

“Saya pikir ada kasus penggunaan yang sangat menarik dengan organisasi berita,” kata Amy Kristin Sanders, seorang pengacara media dan profesor jurnalisme di University of Texas. Dia menunjukkan risiko tertentu yang terkait dengan pelaporan berita terbaru, ketika sebuah berita mungkin tidak melalui proses editorial yang menyeluruh. “Untuk ruang redaksi berukuran kecil hingga menengah — yang tidak memiliki penasihat umum yang hadir bersama mereka setiap hari, yang mungkin mengandalkan banyak freelancer, dan yang mungkin memiliki staf yang singkat, sehingga konten mendapatkan lebih sedikit ulasan editorial daripada di masa lalu — saya pikir mungkin ada nilai dalam alat semacam ini. ”

Diposting oleh : Lagutogel