Pemadaman Internet Global Selasa Berasal Dari Satu Perusahaan Yang Tidak Jelas


Dan itu tidak semua! CDN tidak hanya menyimpan konten lebih dekat ke perangkat yang menginginkannya. Mereka juga membantu mengarahkannya di internet. “Ini seperti mengatur arus lalu lintas pada sistem jalan yang masif,” kata Ramesh Sitaraman, ilmuwan komputer di University of Massachusetts di Amherst yang membantu menciptakan CDN besar pertama sebagai arsitek utama di Akamai. “Jika beberapa tautan di internet gagal atau macet, algoritme CDN dengan cepat menemukan rute alternatif ke tujuan.”

Jadi Anda dapat mulai melihat bagaimana ketika CDN turun, ia dapat mengambil banyak bagian dari internet bersamanya. Meskipun itu saja tidak cukup menjelaskan bagaimana dampak pada hari Selasa begitu luas, terutama ketika ada begitu banyak redundansi yang dibangun ke dalam sistem ini. Atau setidaknya, harus ada.

CDN Konsolidasi

Sekali lagi, tidak jelas persis apa yang terjadi di Fastly. “Kami mengidentifikasi konfigurasi layanan yang memicu gangguan di seluruh POP kami secara global dan telah menonaktifkan konfigurasi itu,” kata juru bicara perusahaan dalam sebuah pernyataan. “Jaringan global kami akan kembali online.”

“Konfigurasi layanan” dapat berarti banyak hal; satu-satunya kepastian adalah bahwa apa pun akar masalahnya, itu memiliki efek yang luas. Menurut laman laporan insiden Fastly, setiap benua selain Antartika merasakan dampaknya. Bahkan setelah Fastly memperbaiki masalah yang mendasarinya, Fastly memperingatkan bahwa pengguna masih dapat melihat “rasio hit cache” yang lebih rendah—seberapa sering Anda dapat menemukan konten yang Anda cari sudah disimpan di server terdekat—dan “peningkatan beban asal,” yang mengacu pada proses kembali ke sumber untuk item yang tidak ada dalam cache. Dengan kata lain, lemari masih cukup kosong.

Terjadinya pemadaman adalah hal yang mengejutkan, mengingat CDN biasanya dirancang untuk mengatasi prahara ini. “Pada prinsipnya, ada redundansi besar-besaran,” kata Sitaraman, berbicara tentang CDN secara umum. “Jika server gagal, server lain dapat mengambil alih beban. Jika seluruh pusat data gagal, beban dapat dipindahkan ke pusat data lainnya. Jika semuanya bekerja dengan sempurna, Anda dapat mengalami banyak pemadaman jaringan, masalah pusat data, dan kegagalan server; mekanisme ketahanan CDN akan memastikan bahwa pengguna tidak pernah melihat degradasi.”

Ketika ada yang salah, kata Sitaraman, biasanya terkait dengan bug perangkat lunak atau kesalahan konfigurasi yang didorong ke beberapa server sekaligus.

Meski begitu, situs dan layanan yang menggunakan CDN biasanya memiliki redundansinya sendiri. Atau setidaknya, mereka harus. Faktanya, Anda dapat melihat petunjuk tentang betapa beragamnya berbagai layanan dalam kecepatan respons mereka pagi ini, kata Medina. Amazon membutuhkan waktu sekitar 20 menit untuk kembali aktif dan berjalan, karena dapat mengalihkan lalu lintas ke penyedia CDN lainnya. Siapa pun yang hanya mengandalkan Fastly, atau yang tidak memiliki sistem otomatis untuk mengakomodasi gangguan, harus menunggu.

“Pemadaman adalah hasil dari monokultur,” kata Roland Dobbins, insinyur utama perusahaan keamanan Netscout Arbor. Dia menyarankan bahwa setiap organisasi dengan kehadiran online yang substansial harus memiliki banyak penyedia CDN untuk menghindari situasi seperti ini.

Namun, pilihan mereka semakin terbatas. Sama seperti cloud yang sebagian besar telah dimasukkan oleh Amazon, Google, dan Microsoft, tiga penyedia CDN—Cloudflare, Akamai, dan Fastly—mendominasi aliran konten online. “Ada banyak konsentrasi penggunaan dalam penyedia layanan yang sangat sedikit,” kata Medina. “Setiap kali salah satu dari ketiga penyedia tersebut memiliki masalah, biasanya itu bukan sesuatu yang berlangsung lama, tetapi memiliki dampak besar di internet.”

Itulah sebagian besar, kata Medina, mengapa pemadaman semacam ini lebih sering terjadi akhir-akhir ini, dan mengapa mereka hanya akan terus memburuk. Baseball membutuhkan seorang pria cutoff; persimpangan membutuhkan polisi lalu lintas. Semakin sedikit yang bisa diandalkan, semakin banyak koneksi yang terlewatkan, dan semakin besar kerusakannya.

Pelaporan tambahan oleh Lily Hay Newman.


Lebih Banyak Cerita WIRED yang Hebat

Diposting oleh : SGP Prize