Skip to content

Text Analytics pada Akun FUFUFAFA pada Platform KASKUS

Published: at 09:10 AMSuggest Changes

Di tengah hiruk pikuk media sosial, munculnya kontroversi seputar akun Fufufafa di platform Kaskus telah menarik perhatian publik Indonesia. Tanpa bermaksud mengungkap identitas pemilik akun, artikel ini akan fokus pada analisis konten tekstual dari postingan-postingan yang dibuat.

Table of Contents

Open Table of Contents

Pengumpulan Data

Artikel ini menggunakan teknik web scraping untuk mengumpulkan data dari postingan akun Fufufafa di Kaskus. Proses ini dilakukan dengan skrip otomatis yang secara sistematis mengekstraksi teks, tanggal, dan metadata lainnya dari setiap postingan. Total dataset yang terkumpul mencakup 1.900 postingan dalam rentang waktu 2013 hingga 2019. Dari hasil scraping, berikut adalah contoh data yang diperoleh:

DateReplied ToThread TitlePost Content
14-11-2019 09:54beritafilistinPerekam Wanita di Kamar Ganti Baju Mall Kerap Ceramah Agama di MedsosDia pasti alumni 212
1/10/2019 5:38:00 PMibelinduaGubernur Anies Sampaikan Ancaman Penggantian Ideologi Pancasila Dengan KomunisGak pernah ngaca ya
28-09-2019 10:56matadewa909Kecewa Ponakan Prabowo Batal Baca Doa, Gerindra WO dari MPRAlumni 212 mana suaranya
17-09-2019 12:41SENORITA88Pria India Bikin Helm Pakai AC, Kepala Dingin Saat MacetMalah masuk angin ntar
28-08-2019 13:45matthysse76Jokograd & Mandalanusa, Usulan Nama Ibu Kota Baru Indonesia Menurut WarganetWowoland city of kamprets

Text Analytics ?

Text analytics adalah proses mengolah data tekstual tidak terstruktur menjadi informasi bermakna yang dapat dianalisis. Teknik ini digunakan untuk menemukan pola, tren, dan wawasan dari data dalam skala besar.

Berikut adalah hasil analisis berdasarkan dataset yang tersedia:

1. Word Cloud Analysis

Word Cloud Berdasarkan word cloud yang dianalisis, terlihat bahwa beberapa kata kunci muncul dengan frekuensi tinggi, menunjukkan tema utama diskusi akun Fufufafa di platform Kaskus. Kata-kata berikut menjadi pusat perhatian:

Secara keseluruhan, word cloud ini mengindikasikan bahwa diskusi yang melibatkan akun ini kerap bersinggungan dengan isu politik nasional, sering disertai dengan nada yang emosional dan kadang-kadang sarkastik.

2. Bigram Analysis

Bigram

Visualisasi bigram menunjukkan frasa dua kata yang paling sering muncul dalam postingan. Bigram yang mendominasi adalah:

Interpretasi

Bigram yang muncul memperkuat temuan sebelumnya bahwa diskusi dalam dataset ini memiliki nuansa politik yang kuat dengan elemen dukungan, kritik, serta penggunaan bahasa yang ekspresif.

3. Sentiment Analysis

Sentiment Distribution Tahap ini menggunakan pendekatan lexicon-based sentiment analysis untuk menganalisis sentimen dari setiap postingan. Dengan memanfaatkan kamus sentimen dari Repository GitHub, setiap kata diberi bobot positif atau negatif berdasarkan makna emosionalnya.

Berikut adalah contoh hasil analisis sentimen untuk lima konten:

ContentsSentiment
Anjrit ngomong apa sih wkwkwkkwNegatif
Kwkwkw kampret insafNegatif
Suruh jadi imam sholat duluNetral
Gak pernah ngaca yaPositif
Wowoland city of kampretsNetral

Word Cloud Sentimen

Selain distribusi sentimen, word cloud membantu mengidentifikasi kata-kata yang paling sering muncul dalam masing-masing kategori sentimen.

Analisis sentimen ini memberikan gambaran tentang bagaimana emosi pengguna tercermin dalam postingan mereka. Pemahaman lebih lanjut dapat dilakukan dengan menggali konteks penggunaan kata dalam setiap kategori sentimen.

4. Time Series Analysis

Analisis ini dilakukan dalam dua bagian:

  1. Time Series Berdasarkan Postingan:
    Trend Posting Aktivitas posting mencapai puncaknya pada tahun 2014 bulan mei, bertepatan dengan menjelangnya peristiwa pemilu di Indonesia.

  2. Time Series Berdasarkan Sentimen:
    Trend Sentiment

Kesimpulannya, aktivitas akun fufufafa di Kaskus sangat dipengaruhi oleh momen-momen tertentu, terutama terkait politik, dengan kecenderungan dominasi sentimen negatif selama puncak aktivitas.


5. Text Network

Text Network

Visualisasi Text Network di atas menggambarkan hubungan antar kata dalam dataset yang dianalisis. Semakin besar ukuran node (lingkaran), semakin sering kata tersebut muncul dalam teks. Garis yang menghubungkan antar kata menunjukkan hubungan atau kemunculan kata-kata tersebut dalam satu konteks yang sama.

Interpretasi:

  1. Kata-kata utama
    Beberapa kata dengan node yang lebih besar, seperti bodoh, prabowo, panasbung, dan jokowi, menunjukkan bahwa kata-kata ini sering muncul dalam dataset dan memiliki keterkaitan tinggi dengan kata-kata lain.

  2. Hubungan antar kata

    • Kata bodoh memiliki banyak koneksi dengan berbagai kata lain, yang mengindikasikan sering digunakan dalam berbagai konteks.
    • Prabowo dan Jokowi menunjukkan keterkaitan dengan kata-kata politik seperti rakyat, presiden, dan kampret.
    • Kata panasbung (panasbunglon) juga memiliki koneksi yang cukup banyak, yang mungkin menunjukkan diskusi seputar opini politik.
  3. Polarisasi opini

    • Beberapa kata seperti kampret, fitnah, dan najs bisa menunjukkan adanya sentimen negatif atau ujaran sarkasme dalam diskusi.
    • Sebaliknya, kata-kata seperti orang, hidup, dan rakyat mungkin lebih netral atau umum digunakan dalam berbagai diskusi.

6. Topic Modelling

Topic Modelling

Pada tahap ini, dilakukan Topic Modelling menggunakan BERTopic untuk mengidentifikasi topik utama yang muncul dalam kumpulan teks. BERTopic bekerja dengan cara mengelompokkan teks berdasarkan representasi vektor dari kata-kata yang digunakan.

Metode yang Digunakan

Dalam implementasi ini, model BERTopic dikonfigurasi dengan:

Interpretasi:

  1. Topic 0 (Politik dan Tokoh Publik)

    • Kata-kata seperti prabowo, jokowi, panasbung, presiden, dan kampret menunjukkan bahwa topik ini berkaitan dengan perbincangan politik, khususnya figur publik dan afiliasi politik mereka.
  2. Topic 1 (Sentimen Negatif dan Opini Kasar)

    • Kata-kata dominan seperti bodoh, bodo, nasbung, dan salah menunjukkan adanya opini negatif, kritik, atau sindiran terhadap suatu pihak dalam diskusi.
  3. Topic 2 (Ekspresi dan Ungkapan Slang)

    • Kata-kata seperti mampus, please, god, jon, dan bocah mengindikasikan percakapan yang lebih santai atau mungkin terkait dengan ujaran emosional dalam diskusi.
  4. Topic 3 (Aksi Sosial dan Kampus)

    • Kata-kata seperti alumni, 212, boikot, demo, dan kampusnya menunjukkan topik yang berkaitan dengan gerakan sosial, aksi mahasiswa, atau peristiwa di lingkungan akademik.

Visualisasi ini membantu dalam memahami bagaimana percakapan dalam kumpulan data dapat dikelompokkan ke dalam beberapa topik utama.

7. NLP: Named Entity Recognition

Trend Sentiment

Named Entity Recognition (NER) digunakan untuk mendeteksi nama tokoh yang sering muncul dalam teks. Model yang digunakan adalah cahya/bert-base-indonesian-NER dari Hugging Face.

Hasil:


Kesimpulan

Melalui analisis ini, dapat menemukan pola komunikasi yang dinamis dari akun Fufufafa di Kaskus. Aktivitas akun ini menunjukkan lonjakan besar pada pertengahan tahun 2014, yang kemungkinan terkait dengan peristiwa politik penting, dengan fokus pada diskusi tokoh politik tertentu seperti terlihat dari bigram dominan, misalnya “hidup prabowo” dan “prabowo pemimpin.”

Sentimen yang muncul pada periode tersebut cenderung didominasi oleh sentimen negatif, meskipun sentimen netral juga signifikan. Hal ini menunjukkan bahwa diskusi pada saat itu kemungkinan besar melibatkan kritik atau debat yang intens terhadap isu-isu yang sedang hangat.

Pendekatan berbasis data ini memberikan wawasan objektif tentang pola komunikasi akun tersebut. Walaupun terdapat keterbatasan dalam analisis sentimen berbasis lexicon-based sentiment analysis, hasil ini tetap memberikan gambaran umum yang relevan.

Oleh karena itu, text analytics dapat dianggap sebagai alat yang efektif untuk memahami pola komunikasi dan tren di platform digital.

Disclaimer

⚠️ Hasil analisis ini didasarkan pada kode yang mungkin masih memiliki keterbatasan atau kesalahan. Selain itu, sentiment analysis berbasis lexicon dapat kurang interpretatif dalam menangani sarkasme, ironi, atau konteks bahasa yang kompleks. Oleh karena itu, hasil ini sebaiknya digunakan sebagai wawasan awal dan tidak dianggap sebagai kesimpulan mutlak.


Previous Post
Exploration Data Analysis Sample Data Breach NPWP
Next Post
How to Use Sherlock for OSINT by Username