Bisakah AI Memprediksi Bahasa Mutasi Viral?

Bisakah AI Memprediksi Bahasa Mutasi Viral?

[ad_1]

Virus memimpin a keberadaan yang agak berulang. Mereka memasuki sel, membajak mesinnya untuk mengubahnya menjadi mesin penyalin virus, dan salinan itu menuju ke sel lain yang dipersenjatai dengan instruksi untuk melakukan hal yang sama. Jadi begitulah, terus menerus. Tetapi agak sering, di tengah-tengah copy-paste yang berulang ini, banyak hal menjadi campur aduk. Mutasi muncul dalam salinan. Kadang-kadang, mutasi berarti asam amino tidak terbentuk dan protein penting tidak terlipat — jadi versi virus masuk ke tong sampah sejarah evolusi. Terkadang mutasi tidak menghasilkan apa-apa, karena urutan berbeda yang menyandikan protein yang sama membuat kesalahan tersebut. Tapi sesekali, mutasi berjalan sempurna. Perubahan tersebut tidak mempengaruhi kemampuan virus untuk hidup; sebaliknya, mereka menghasilkan perubahan yang membantu, seperti membuat virus tidak dapat dikenali oleh pertahanan kekebalan seseorang. Ketika itu memungkinkan virus menghindari antibodi yang dihasilkan dari infeksi masa lalu atau dari vaksin, varian virus mutan itu dikatakan telah “lolos”.

Ilmuwan selalu mencari tanda-tanda kemungkinan melarikan diri. Itu benar untuk SARS-CoV-2, ketika strain baru muncul dan para ilmuwan menyelidiki apa arti perubahan genetik untuk vaksin yang tahan lama. (Sejauh ini, semuanya terlihat baik-baik saja.) Itu juga yang membingungkan para peneliti yang mempelajari influenza dan HIV, yang secara rutin menghindari pertahanan kekebalan kita. Jadi dalam upaya untuk melihat apa yang mungkin terjadi, peneliti membuat mutan hipotetis di laboratorium dan melihat apakah mereka dapat menghindari antibodi yang diambil dari pasien atau penerima vaksin baru-baru ini. Tetapi kode genetik menawarkan terlalu banyak kemungkinan untuk diuji setiap cabang evolusi virus mungkin membutuhkan waktu. Ini masalah menjaga.

Musim dingin yang lalu, Brian Hie, seorang ahli biologi komputasi di MIT dan penggemar puisi lirik John Donne, sedang memikirkan masalah ini ketika dia turun ke sebuah analogi: Bagaimana jika kita memikirkan urutan virus seperti yang kita pikirkan tentang bahasa tertulis? Setiap urutan virus memiliki semacam tata bahasa, ia beralasan — seperangkat aturan yang harus diikuti untuk menjadi virus tersebut. Ketika mutasi melanggar tata bahasa itu, virus mencapai jalan buntu evolusioner. Dalam istilah virologi, ia tidak memiliki “kebugaran”. Seperti halnya bahasa, dari sudut pandang sistem imun, barisan juga bisa dikatakan memiliki semacam semantik. Ada beberapa urutan yang dapat diinterpretasikan oleh sistem kekebalan — dan dengan demikian menghentikan virus dengan antibodi dan pertahanan lainnya — dan beberapa yang tidak dapat dilakukan. Jadi pelarian virus dapat dilihat sebagai perubahan yang mempertahankan tata bahasa urutan tetapi mengubah artinya.

Analoginya sederhana, hampir terlalu sederhana, keanggunan. Tapi bagi Hie, itu juga praktis. Dalam beberapa tahun terakhir, sistem AI menjadi sangat baik dalam memodelkan prinsip tata bahasa dan semantik dalam bahasa manusia. Mereka melakukan ini dengan melatih sistem dengan kumpulan data miliaran kata, disusun dalam kalimat dan paragraf, dari mana sistem tersebut memperoleh pola. Dengan cara ini, tanpa diberi tahu aturan khusus apa pun, sistem mempelajari ke mana letak koma dan cara menyusun klausa. Itu juga dapat dikatakan untuk memahami arti dari urutan tertentu — kata dan frasa — berdasarkan banyak konteks di mana mereka muncul di seluruh kumpulan data. Itu polanya, sampai ke bawah. Begitulah cara model bahasa yang paling maju, seperti OpenAI’s GPT-3, dapat belajar menghasilkan prosa tata bahasa yang sempurna yang berhasil tetap sesuai topik.

Salah satu keuntungan dari ide ini adalah dapat digeneralisasikan. Bagi model pembelajaran mesin, urutan adalah urutan, entah itu disusun dalam soneta atau asam amino. Menurut Jeremy Howard, seorang peneliti AI di University of San Francisco dan seorang ahli model bahasa, menerapkan model tersebut ke urutan biologis bisa membuahkan hasil. Dengan data yang cukup dari, katakanlah, urutan genetik virus yang diketahui dapat menular, model tersebut secara implisit akan mempelajari sesuatu tentang bagaimana virus yang menular terstruktur. “Model itu akan memiliki banyak pengetahuan yang canggih dan kompleks,” katanya.

Diposting oleh : joker123

Releated

2020 Adalah Salah Satu Tahun Terpanas dalam Catatan

2020 Adalah Salah Satu Tahun Terpanas dalam Catatan

[ad_1] Bumi menyala kebakaran tahun lalu (seandainya Anda lupa), dengan kebakaran hutan Pantai Barat yang memecahkan rekor, gelombang panas Siberia, dan badai Atlantik. Sekarang para ilmuwan pemerintah telah menghitung angka di balik kekacauan planet ini. NASA baru saja merilis laporan tahunan tentang suhu tahunan, dan dikatakan bahwa 2020 melampaui atau menyamai 2016 sebagai tahun terpanas […]