Bagaimana Big Data Membawa Teori Grafik Ke Dimensi Baru


Teori graf tidak cukup.

Bahasa matematika untuk berbicara tentang koneksi, yang biasanya bergantung pada jaringan—simpul (titik) dan tepi (garis yang menghubungkannya)—telah menjadi cara yang sangat berharga untuk memodelkan fenomena dunia nyata setidaknya sejak abad ke-18. Tetapi beberapa dekade yang lalu, munculnya kumpulan data raksasa memaksa para peneliti untuk memperluas kotak peralatan mereka dan, pada saat yang sama, memberi mereka kotak pasir yang luas untuk menerapkan wawasan matematika baru. Sejak itu, kata Josh Grochow, seorang ilmuwan komputer di University of Colorado, Boulder, ada periode pertumbuhan pesat yang menggembirakan karena para peneliti telah mengembangkan jenis model jaringan baru yang dapat menemukan struktur dan sinyal kompleks dalam kebisingan data besar.

Grochow adalah salah satu peneliti yang menunjukkan bahwa dalam hal menemukan koneksi dalam data besar, teori grafik memiliki batasnya. Grafik mewakili setiap hubungan sebagai angka dua, atau interaksi berpasangan. Namun, banyak sistem yang kompleks tidak dapat diwakili oleh koneksi biner saja. Kemajuan terbaru di lapangan menunjukkan bagaimana untuk bergerak maju.

Pertimbangkan untuk mencoba membentuk model jaringan pengasuhan anak. Jelas, setiap orang tua memiliki koneksi ke anak, tetapi hubungan pengasuhan bukan hanya jumlah dari dua tautan, seperti yang mungkin dimodelkan oleh teori grafik. Hal yang sama berlaku untuk mencoba memodelkan fenomena seperti tekanan teman sebaya.

“Ada banyak model intuitif. Efek tekanan teman sebaya pada dinamika sosial hanya ditangkap jika Anda sudah memiliki grup dalam data Anda,” kata Leonie Neuhäuser dari RWTH Aachen University di Jerman. Tetapi jaringan biner tidak menangkap pengaruh kelompok.

Matematikawan dan ilmuwan komputer menggunakan istilah “interaksi tingkat tinggi” untuk menggambarkan cara kompleks bahwa dinamika kelompok, daripada tautan biner, dapat memengaruhi perilaku individu. Fenomena matematika ini muncul dalam segala hal mulai dari interaksi keterjeratan dalam mekanika kuantum hingga lintasan penyakit yang menyebar melalui suatu populasi. Jika seorang farmakologis ingin memodelkan interaksi obat, misalnya, teori grafik mungkin menunjukkan bagaimana dua obat saling merespons—tetapi bagaimana dengan tiga obat? Atau empat?

Meskipun alat untuk menjelajahi interaksi ini bukanlah hal baru, hanya dalam beberapa tahun terakhir kumpulan data berdimensi tinggi telah menjadi mesin untuk penemuan, memberikan ide-ide baru kepada matematikawan dan ahli teori jaringan. Upaya ini telah menghasilkan hasil yang menarik tentang batas grafik dan kemungkinan peningkatan skala.

“Sekarang kita tahu bahwa jaringan hanyalah bayangan dari benda itu,” kata Growow. Jika kumpulan data memiliki struktur dasar yang kompleks, maka memodelkannya sebagai grafik mungkin hanya mengungkapkan proyeksi terbatas dari keseluruhan cerita.

Emilie Purvine dari Pacific Northwest National Laboratory sangat antusias dengan kecanggihan alat seperti hypergraph untuk memetakan koneksi yang lebih halus antar titik data.

Foto: Andrea Starr/Laboratorium Nasional Pacific Northwest

“Kami menyadari bahwa struktur data yang kami gunakan untuk mempelajari berbagai hal, dari perspektif matematika, tidak cukup sesuai dengan apa yang kami lihat dalam data,” kata ahli matematika Emilie Purvine dari Pacific Northwest National Laboratory.

Itulah sebabnya matematikawan, ilmuwan komputer, dan peneliti lain semakin berfokus pada cara untuk menggeneralisasi teori graf—dalam banyak samarannya—untuk mengeksplorasi fenomena tingkat tinggi. Beberapa tahun terakhir telah membawa banyak cara yang diusulkan untuk mengkarakterisasi interaksi ini, dan untuk memverifikasinya secara matematis dalam kumpulan data dimensi tinggi.

Bagi Purvine, eksplorasi matematis dari interaksi tingkat tinggi seperti pemetaan dimensi baru. “Pikirkan grafik sebagai fondasi pada sebidang tanah dua dimensi,” katanya. Bangunan tiga dimensi yang bisa di atas bisa sangat bervariasi. “Ketika Anda turun di permukaan tanah, mereka terlihat sama, tetapi apa yang Anda bangun di atas berbeda.”

Masukkan Hipergraf

Pencarian untuk struktur dimensi yang lebih tinggi adalah di mana matematika menjadi sangat keruh—dan menarik. Analog orde yang lebih tinggi dari grafik, misalnya, disebut hypergraph, dan bukannya tepi, ia memiliki “hyperedges.” Ini dapat menghubungkan beberapa node, yang berarti dapat mewakili hubungan multi-arah (atau multilinier). Alih-alih garis, hyperedge dapat dilihat sebagai permukaan, seperti terpal yang dipasang di tiga tempat atau lebih.

Tidak apa-apa, tapi masih banyak yang belum kita ketahui tentang bagaimana struktur ini berhubungan dengan struktur konvensional. Matematikawan saat ini sedang mempelajari aturan teori graf mana yang juga berlaku untuk interaksi tingkat tinggi, menyarankan area eksplorasi baru.

Untuk mengilustrasikan jenis-jenis hubungan yang dapat ditarik oleh hipergraf dari kumpulan data besar—dan grafik biasa tidak bisa—Purvine menunjuk ke contoh sederhana yang dekat dengan rumah, dunia publikasi ilmiah. Bayangkan dua set data, masing-masing berisi makalah yang ditulis bersama oleh hingga tiga matematikawan; untuk mempermudah, beri nama mereka A, B, dan C. Satu kumpulan data berisi enam kertas, dengan dua kertas masing-masing dari tiga pasangan berbeda (AB, AC, dan BC). Yang lain hanya berisi total dua makalah, masing-masing ditulis bersama oleh ketiga ahli matematika (ABC).

Diposting oleh : joker123