Clakclik.com, 14 Maret 2026--Google memperkenalkan metode prediksi bencana banjir bandang di berbagai belahan dunia dengan menggunakan mesin akal imitasi (AI). Kumpulan berita banjir bandang dari tahun ke tahun yang tidak terstruktur di berbagai belahan dunia diolah menjadi sebuah arsip terstruktur dan ditandai lokasinya. Ketika dimasukkan ke dalam mesin AI, data ini bisa digunakan untuk memprediksi bencana banjir.
Banjir bandang termasuk salah satu peristiwa cuaca paling mematikan di dunia. Bencana alam dan belakangan disebut bencana hidrometeorologi tersebut menewaskan lebih dari 5.000 orang setiap tahun. Selama ini banjir bandang juga termasuk yang paling sulit diprediksi. Datangnya tiba-tiba dan kekuatan berskala besar serta mematikan.
Google berusaha memecahkan masalah ini. Sebuah hasil riset dengan judul Groundsource: A Dataset of Flood Events from News dikeluarkan Tim Riset Google pada 9 Maret 2026. Meskipun manusia telah mengumpulkan banyak data cuaca, banjir bandang terlalu singkat dan terlokalisasi untuk diukur secara komprehensif, seperti halnya suhu atau bahkan aliran sungai yang dipantau dari waktu ke waktu.
Data yang dikumpulkan manusia masih terdapat kesenjangan. Kesenjangan data tersebut memberi kita informasi bahwa dengan data yang tidak terstruktur, metode pemrosesan data dengan menggunakan deep learning model (model pembelajaran mendalam) tidak dapat memprediksi banjir bandang.
Untuk mengatasi masalah tersebut, menurut Techcrunch, para peneliti Google menggunakan Gemini—model bahasa besar (LLM) Google—untuk menyaring 5 juta artikel berita dari seluruh dunia, mengisolasi laporan tentang 2,6 juta banjir yang berbeda, dan mengubah laporan tersebut menjadi rangkaian waktu yang diberi tanda (tag) geografis yang disebut Groundsource.
Untuk pertama kalinya Google menggunakan model bahasa (language model) untuk jenis pekerjaan ini. Penelitian dan kumpulan data tersebut dibagikan secara publik pada Kamis pagi pekan ini.
Menurut para peneliti, data peristiwa sejarah (dalam hal ini bencana banjir bandang) berlimpah, tetapi tidak terstruktur, seperti artikel berita atau laporan pemerintah, dan beberapa dataset. Data tekstual yang tidak terstruktur memerlukan upaya manual yang lumayan berat untuk proses ekstraksi dan standardisasi.
Akan tetapi, kemajuan dalam AI generatif memungkinkan kita untuk mengatasi banyak kendala ini. Mereka kemudian memperkenalkan Groundsource, sebuah dataset global akses terbuka yang terdiri atas 2,6 juta peristiwa banjir historis yang dikurasi dari pemrosesan lebih dari 5 juta artikel berita berbasis laman internet di lebih dari 150 negara.
Groundsource menyediakan data berbasis peristiwa dengan resolusi temporal harian dan batas spasial lokal dari tahun 2000 hingga saat ini. Data banjir historis berkualitas tinggi sangat penting untuk manajemen risiko bencana, perencanaan infrastruktur, dan atribusi perubahan iklim.
Dengan mengubah media berita global yang tidak terstruktur menjadi arsip peristiwa yang terstruktur dan terlokalisasi, Groundsource menyediakan sumber daya yang besar dan dapat diperluas untuk mendukung pelatihan model hidrologi prediktif, mengukur paparan historis, dan memajukan penelitian bencana global.
Menanggapi pengumuman itu, jurnalis teknologi Jan Martindale di laman PCMag menulis, dengan dataset tersebut sebagai dasar, Google menggunakan model AI yang dilatih pada jaringan saraf, yaitu model yang digunakan untuk prediksi berdasarkan seri data yang panjang long short-term memory (LSTM) untuk menganalisis prakiraan cuaca dan membuat prediksi berdasarkan arsip liputan berita.
Model tersebut dapat memperkirakan probabilitas banjir bandang di area tertentu dan telah membantu layanan darurat untuk merespons lebih cepat. Selama ini, meskipun terdapat banyak data tentang curah hujan, aliran sungai, dan pola curah hujan global, memprediksi banjir bandang terbukti sulit.
Apalagi banjir bandang berlangsung sangat singkat sehingga pengumpulan data yang berguna menjadi sulit, dan data historis tampaknya tidak memberikan korelasi yang cukup untuk menunjukkan kapan dan di mana banjir bandang mungkin terjadi.
Namun, liputan berita jauh lebih luas dan lebih lama, dan dengan membandingkan laporan banjir dengan data cuaca, Google yakin telah menemukan formula ajaibnya.
Meski demikian, Techcrunch melaporkan, model ini masih memiliki keterbatasan. Pertama, resolusinya cukup rendah, hanya mengidentifikasi risiko di area seluas 20 kilometer persegi. Oleh karena itu, model ini tidak seakurat sistem peringatan banjir Badan Layanan Cuaca Nasional AS. Penyebabnya, sebagian karena model Google tidak menggabungkan data radar lokal yang memungkinkan pelacakan curah hujan senyatanya (real-time).
Meski demikian, dengan temuan ini, bencana lain kemungkinan bisa diprediksi. Menurut Jan Martindale, kolaborasi antara data konkret dan pelaporan berita ini adalah sesuatu yang ingin dieksplorasi lebih lanjut oleh Google seiring dengan ditemukannya kegunaan baru untuk alat AI Gemini miliknya.
Penerapan poin-poin ini pada peristiwa cuaca lainnya, seperti tanah longsor dan gelombang panas, mungkin juga dapat dilakukan dengan menggunakan teknik ini. Hal ini juga dapat membuka wawasan penting bagi sektor pertanian dan konstruksi.
Lebih dari itu, salah satu poin pentingnya adalah proyek ini dirancang untuk berfungsi di tempat-tempat pemerintah daerah tidak mampu berinvestasi dalam infrastruktur penginderaan cuaca yang mahal atau tidak memiliki catatan data meteorologi yang ekstensif.
Ditulis Oleh Andreas Maryoto | Kompas | 13 Maret 2026