AI Ini Bisa Beranjak Dari ‘Seni’ Menjadi Mengemudikan Mobil yang Mengemudi Sendiri


Anda mungkin tidak pernah bertanya-tanya seperti apa rupa seorang ksatria yang terbuat dari spageti, tetapi inilah jawabannya — berkat program kecerdasan buatan baru yang cerdas dari OpenAI, sebuah perusahaan di San Francisco.

Program DALL-E yang dirilis awal bulan ini dapat membuat gambar dari segala macam hal aneh yang tidak ada, seperti kursi berlengan alpukat, robot jerapah, atau lobak yang memakai tutus. OpenAI menghasilkan beberapa gambar, termasuk ksatria spaghetti, atas permintaan WIRED.

DALL-E adalah versi GPT-3, model AI yang dilatih pada teks yang diambil dari web yang mampu menghasilkan teks koheren yang mengejutkan. DALL-E diberi gambar dan deskripsi yang menyertainya; sebagai tanggapan, ini dapat menghasilkan gambar mashup yang layak.

Gambar dibuat oleh DALL-E sebagai tanggapan atas “ilustrasi lobak bayi daikon dengan tutu berjalan-jalan dengan anjing.”

Atas kebaikan OpenAI

Orang-orang yang iseng dengan cepat melihat sisi lucu DALL-E, misalnya mencatat bahwa DALL-E dapat membayangkan jenis makanan baru Inggris. Tetapi DALL-E dibangun di atas kemajuan penting dalam visi komputer yang didukung AI, yang dapat memiliki aplikasi yang serius dan praktis.

Disebut CLIP, ini terdiri dari jaringan saraf tiruan yang luas — algoritme yang terinspirasi oleh cara otak belajar — memberi makan ratusan juta gambar dan menyertai teks teks dari web dan dilatih untuk memprediksi label yang tepat untuk sebuah gambar.

Para peneliti di OpenAI menemukan bahwa CLIP dapat mengenali objek seakurat algoritme yang dilatih dengan cara biasa — menggunakan kumpulan data yang dikurasi di mana gambar dicocokkan dengan rapi ke label.

Hasilnya, CLIP dapat mengenali lebih banyak hal, dan dapat memahami seperti apa tampilan hal-hal tertentu tanpa memerlukan banyak contoh. CLIP membantu DALL-E menghasilkan karya seninya, secara otomatis memilih gambar terbaik dari gambar yang dibuatnya. OpenAI telah merilis sebuah makalah yang menjelaskan bagaimana CLIP bekerja serta versi kecil dari program yang dihasilkan. Itu belum merilis kertas atau kode apa pun untuk DALL-E.

gambar item

Panduan WIRED untuk Kecerdasan Buatan

Algoritme supersmart tidak akan mengambil semua pekerjaan, tetapi mereka belajar lebih cepat dari sebelumnya, melakukan segalanya mulai dari diagnostik medis hingga menayangkan iklan.

Baik DALL-E dan CLIP “sangat mengesankan,” kata Karthik Narasimhan, asisten profesor di Princeton yang berspesialisasi dalam visi komputer. Dia mengatakan CLIP dibangun di atas pekerjaan sebelumnya yang berusaha untuk melatih model AI besar menggunakan gambar dan teks secara bersamaan, tetapi melakukannya pada skala yang belum pernah terjadi sebelumnya. “CLIP adalah demonstrasi skala besar untuk dapat menggunakan bentuk pengawasan yang lebih alami — cara kita berbicara tentang berbagai hal,” katanya.

Dia mengatakan CLIP dapat berguna secara komersial dalam banyak hal, mulai dari meningkatkan pengenalan gambar yang digunakan dalam penelusuran web dan analisis video, hingga membuat robot atau kendaraan otonom lebih pintar. CLIP dapat digunakan sebagai titik awal untuk algoritme yang memungkinkan robot belajar dari gambar dan teks, seperti instruksi manual, katanya. Atau dapat membantu mobil yang bisa mengemudi sendiri mengenali pejalan kaki atau pepohonan dalam suasana yang tidak biasa.

Diposting oleh : Lagutogel