REKAMAN WEBINAR

Validasi Protokol Pencarian untuk Penggalian Kejadian Kesehatan dan Penyakit di Twitter

Ilustrasi Health Tweet dan Virus Tweet

Pada tahun 2016, ada lebih dari 24 juta orang Indonesia yang menggunakan Twitter untuk berbagi berita, kejadian-kejadian, dan tentunya, perasaan dan pengalaman pribadi mereka di Twitter. Studi ini mencoba untuk menvalidasi protokol pencarian yang terkait dengan masalah kesehatan menggunakan data real-time dari Twitter. Data-data tersebut nantinya dapat digunakan untuk memahami dan melihat bagaimana informasi terkini kesehatan di Indonesia.

Studi validasi protokol penggalian data, para peneliti yang terdiri dari kolaborasi peneliti Indonesia dan Swedia ini, mengekstrak postingan percakapan di Twitter berbasis geo-location yang berhubungan dengan kesehatan dan penyakit dengan menggunakan kata kunci-kata kunci yang sudah ditetapkan, menilai prevalensinya, melihat frekuensi dan waktu dari isi didalam setiap percakapan, dan memvalidasi bagaimana protokol pencarian ini dapat mendeteksi tweet-tweet yang relevan.

Kelompok-kelompok dari sejumlah kata dan frase yang relevan dengan gelaja penyakit dan kesembuhan digunakan untuk membuat protokol kedalam Bahasa Indonesia untuk mengekstrak konten-konten yang relevan dari feeds berbasis geo-tagged di Twitter. Algoritma pembelajaran terpantau menggunakan Classification and Regression Trees untuk memvalidasi protokol pencarian dari data hits penyakit dan kesehatan tersebut dibandingkan dengan data yang diindentifikasi oleh tim yang terdiri dari para ahli. Para ahli tersebut kemudian mengkategorikan tweet-tweet sebagai positif atau negatif terhadap kejadian-kejadian kesehatan.

Para peneliti mengobservasi 390 tweet dari riwayat feeds dan 1,145,649 tweet dari stream feeds di Twitter selama periode 26 Juli sampai 1 Agustus 2016. Data yang diambil hanya berasal dari hits twitter dengan kata kunci berbahasa Indonesia yang berhubungan dengan kesehatan. Keakurasian dari prediksi didalam hits yang tertimbun versus hits yang telah divalidasi dengan algoritma CART oleh para ahli menunjukan validitas yang baik dengan AUC di atas 0.8.

Penelitian ini menunjukan bahwa memonitoring sentimen publik di Twitter, yang dikombinasikan dengan pengetahuan kontekstual tentang penyakit, ternyata dapat mendeteksi tweet-tweet yang menandakan kesehatan maupun penyakit, serta berpotensi untuk digunakan sebagai real-time proxy yang berharga untuk kejadian-kejadian kesehatan lintas ruang dan waktu.

Paper Validating search protocols for mining of health and disease events on Twitter yang dipublikasikan secara online oleh Cornel University Library ini, dapat memberikan pembaca gambaran mengenai bagaimana platform media sosial dapat berkontribusi untuk meningkatkan monitoring kesehatan di masyarakat, khususnya di Indonesia.

Semoga bermanfaat 🙂

Link: Validating search protocols for mining of health and disease events on Twitter

Review ditulis oleh Yudha E. Saputra, S.Farm, Apt.

Trackback from your site.

Leave a comment