DATA CRAWLING USING RAPIDMINER ON TWITTER

Diemas Arya Komara* -  Universitas Pendidikan Indonesia, Indonesia

DOI : 10.24269/pls.v6i2.6326

Twitter is one of the social media that is favored by various groups, Twitter itself can display information in the form of textual information which can be supplemented with videos or images. This study will discuss how to crawl data on Twitter social media, using the Rapidminer application, 10000 data can be retrieved in one operation. This study aims to provide knowledge about how to use Rapidminer programming to obtain data that can later be processed for purposes related to information science. The results of this study are to show how to collect data on Twitter social media quickly using text mining.
  1. Al Asad, N., Pranto, M. A. M., Afreen, S., & Islam, M. M. (2019, November). Depression detection by analyzing social media posts of user. In 2019 IEEE International Conference on Signal Processing, Information, Communication & Systems (SPICSCON) (pp. 13-17). IEEE.
  2. Ang, P. S., Teo, D. C. H., Dorajoo, S. R., Prem Kumar, M., Chan, Y. H., Choong, C. T., ... & Poh, J. W. W. (2021). Augmenting product defect surveillance through web crawling and machine learning in Singapore. Drug safety, 44(9), 939-948.
  3. Auxier, B., & Anderson, M. (2021). Social media use in 2021. Pew Research Center, 1, 1-4.
  4. Chadijah, I. (2022). PERILAKU CELEBRITY WORSHIP DAN HUBUNGAN PARASOSIAL DI MEDIA SOSIAL (STUDI KASUS FOLLOWERS TWITTER@ jefrinichol) (Doctoral dissertation, Universitas Hasanuddin).
  5. Dakhi, R. P. B., & Aji, A. M. B. (2022). Sentiment Analysis Of Public Opinions On The Effectiveness Of Online Learning Using Naïve Bayes Algorithm. JISICOM (Journal of Information System, Informatics and Computing), 6(1), 273-279.
  6. Darmawan, R. (2020). Implementasi Metode K-Nearest Neighbor (K-Nn) Untuk Identifikasi Ujaran Kebencian Terhadap Tokoh Politik Pada Twitter (Doctoral Dissertation, Universitas Islam Negeri Sultan Syarif Kasim Riau).
  7. Edwanto, I. K. (2019). Pembangunan Aplikasi Media Sosial Untuk Penyebaran Informasi Keadaan Sekitar Dengan Memanfaatkan Gps Dan Geofencing Berbasis Android (Doctoral dissertation, Universitas Komputer Indonesia).
  8. Fadly, M., & Wantoro, A. (2019, August). Model Sistem Informasi Manajemen Hubungan Pelanggan Dengan Kombinasi Pengelolaan Digital Asset Untuk Meningkatkan Jumlah Pelanggan. In Prosiding Seminar Nasional Darmajaya (Vol. 1, pp. 46-55).
  9. Furqon, R. M., & Setiawan, E. B. (2020). Deteksi berita rumor pada sosial media twitter menggunakan metode naïve bayes multinomial dengan pembobotan tf-idf. eProceedings of Engineering, 7(2).
  10. Hanif, M. H. M., Adewole, K. S., Anuar, N. B., & Kamsin, A. (2018). Performance evaluation of machine learning algorithms for spam profile detection on Twitter using WEKA and RapidMiner. Advanced Science Letters, 24(2), 1043-1046.
  11. Hofmann, M., & Klinkenberg, R. (Eds.). (2016). RapidMiner: Data mining use cases and business analytics applications. CRC Press.
  12. Juditha, C. (2019). Dukungan Sosial Warganet Di Twitter Terhadap Gaya Komunikasi Pasangan Calon Presiden Pada Debat Pemilu 2019. Jurnal Studi Komunikasi dan Media, 23(1), 87-100.
  13. Karami, A., & Collins, M. (2018). What do the US West Coast public libraries post on Twitter?. Proceedings of the Association for Information Science and Technology, 55(1), 216-225.
  14. Khder, M. A. (2021). Web Scraping or Web Crawling: State of Art, Techniques, Approaches and Application. International Journal of Advances in Soft Computing & Its Applications, 13(3).
  15. Kurniawan, F. W., & Maharani, W. (2020). Analisis Sentimen Twitter Bahasa Indonesia dengan Word2Vec. eProceedings of Engineering, 7(2).
  16. Lee, S. Y., & Kwon, Y. (2018). Twitter as a place where people meet to make suicide pacts. Public health, 159, 21-26.
  17. Muri, M. F. A., Utomo, H. S., & Sayyidati, R. (2019). Search Engine Get Application Programming Interface. Jurnal Sains dan Informatika, 5(2), 88-97.
  18. Murthy, D. (2018). Twitter. Cambridge: Polity Press.
  19. Mustafa, M. Z., Kasmani, M. F., Ariffin, M. Y. M., & Noor, K. M. (2020). Perhubungan Awam, Media Sosial, Etika Kerja Islam Serta Trend Penggunaan Media Sosial di Sektor Awam Kementerian di Malaysia. ABQARI: Journal of Islamic Social Sciences and Humanity.
  20. Nofitri, R., & Irawati, N. (2019). Analisis Data Hasil Keuntungan Menggunakan Software Rapidminer. JURTEKSI (Jurnal Teknologi dan Sistem Informasi), 5(2), 199-204.
  21. Norris, D. (2013). Rapid Miner-a potential game changer. IT-Director. com.
  22. Pakpahan, S., & Simanullang, A. (2022). Analisis Sentimen Integritas KPK Tahun 2021 Pencegahan Korupsi pada Twitter KPK Menggunakan Metode K-Nearest Neighbor dan Naïve Bayes. Citra Sains Teknologi, 2(1), 63-73.
  23. Pattiiha, F. S., & Hendry, H. (2022). Perbandingan Metode K-NN, Naïve Bayes, Decision Tree untuk Analisis Sentimen Tweet Twitter Terkait Opini Terhadap PT PAL Indonesia. JURIKOM (Jurnal Riset Komputer), 9(2), 506-514.
  24. Pratama, R. P. (2018). Aplikasi deteksi plagiarisme menggunakan metode cosine similarity (Doctoral dissertation, Universitas Islam Negeri Maulana Malik Ibrahim).
  25. Putri, A. D. (2021). Maksimalisasi Media Sosial untuk Meningkatkan Pendapatan dan Pengembangan Diri Generasi Z di MAN 1 Pesawaran. Journal of Social Sciences and Technology for Community Service (JSSTCS), 2(2), 37-42.
  26. Rachmawaty, A. (2021). Optimasi Media Sosial Dalam Meningkatkan Penjualan di Masa Pembatasan Sosial Berskala Besar. Tematik: Jurnal Teknologi Informasi Komunikasi (e-Journal), 8(1), 29-44.
  27. Raharjo, M. (2021). Analisis Sentiment Twitter Terkait Kondisi Social Distancing Di Indonesia Dengan Model Voting Ensemble.
  28. Rennhard, M., Kushnir, M., Favre, O., Esposito, D., & Zahnd, V. (2022). Automating the Detection of Access Control Vulnerabilities in Web Applications. SN Computer Science, 3(5), 1-24.
  29. Ruhyana, N. (2019). Analisis Sentimen Terhadap Penerapan Sistem Plat Nomor Ganjil/Genap Pada Twitter Dengan Metode Klasifikasi Naive Bayes. ikraith-informatika, 3(1), 94-99.
  30. Samsir, S., Ambiyar, A., Verawardina, U., Edi, F., & Watrianthos, R. (2021). Analisis Sentimen Pembelajaran Daring Pada Twitter di Masa Pandemi COVID-19 Menggunakan Metode Naïve Bayes. Jurnal Media Informatika Budidarma, 5(1), 157-163.
  31. Sanusi, R. (2021). Analisis Sentimen Pada Twitter Terhadap Program Kartu Prakerja Menggunakan Long Short Term Memory (Doctoral Dissertation, Stmik Akakom).
  32. Seprina, I. (2019). Analisis Sentimen Masyarakat Terhadap Data Tweet Lazada Menggunakan Text Mining Dan Algoritma Naive Bayes Classifier. In Bina Darma Conference on Computer Science (BDCCS) (Vol. 1, No. 4, pp. 998-1004).
  33. Sooai, A. G., & Laniwati, M. (2021). Ekstraksi Ulasan Sentimen Film dari Twitter dengan Naïve Bayes pada Situs Web Media Sosial Penggemar Film. INSYST: Journal of Intelligent System and Computation, 3(1), 49-54.
  34. Sudarsono, B. G., Leo, M. I., Santoso, A., & Hendrawan, F. (2021). Analisis Data Mining Data Netflix Menggunakan Aplikasi Rapid Miner. JBASE-Journal of Business and Audit Information Systems, 4(1).
  35. Sulastomo, H., Ramadiansyah, R., Gibran, K., Maryansyah, E., & Tegar, A. (2022). Analisis Sentimen Pada Twitter@ Ovo_Id dengan Metode Support Vectore Machine (SVM). J-SAKTI (Jurnal Sains Komputer dan Informatika), 6(2), 1050-1056.
  36. Yadav, S. (2013). Protection from Crawler using. htaccess. IJLTET International Journal of Latest Trends in Engineering and Technology.
  37. Yudhana, A., Riadi, I., & Zuhriyanto, I. (2019). Analisis Live Forensics Aplikasi Media Sosial Pada Browser Menggunakan Metode Digital Forensics Research Workshop (DFRWS). Techno (Jurnal Fakultas Teknik, Universitas Muhammadiyah Purwokerto), 20(2), 125-130.

Full Text:
Article Info
Submitted: 2022-12-14
Published: 2023-04-12
Section: Articles
Article Statistics: