Search for collections on Repository Universitas Maritim Raja Ali Haji

OTOMATISASI PENDETEKSI KATA BAKU DAN TIDAK BAKU PADA DATA TWITTER BERBASIS KBBI MENGGUNAKAN METODE LEXICON-BASED

RAIF, M IRFAN and Matulatan, Tekad and Novia Hidayati, Nuraisa (2024) OTOMATISASI PENDETEKSI KATA BAKU DAN TIDAK BAKU PADA DATA TWITTER BERBASIS KBBI MENGGUNAKAN METODE LEXICON-BASED. S1 thesis, Universitas Maritim Raja Ali Haji.

[img] Text (Cover)
M Irfan Raif_2001020056_Teknik Informatika_Cover.pdf - Published Version

Download (340kB)
[img] Text (Abstrak)
M Irfan Raif_2001020056_Teknik Informatika_Abstrak.pdf - Published Version

Download (50kB)
[img] Text (BAB 1)
M Irfan Raif_2001020056_Teknik Informatika_BAB 1.pdf - Published Version

Download (65kB)
[img] Text (Daftar Pustaka)
M Irfan Raif_2001020056_Teknik Informatika_Daftar Pustaka.pdf - Published Version

Download (98kB)
[img] Text (Full Teks)
M Irfan Raif_2001020056_Teknik Informatika_Full Teks.pdf - Published Version
Restricted to Repository staff only

Download (1MB) | Request a copy
Official URL: http://lib.umrah.ac.id

Abstract

Berdasarkan Kamus Besar Bahasa Indonesia (KBBI), penelitian ini berkonsentrasi pada pembuatan sistem deteksi otomatis yang dapat membedakan kata baku dan tidak baku dalam data Twitter. Penelitian ini sangat penting untuk menjamin komunikasi yang efektif karena Twitter adalah platform media sosial yang sering menggunakan kata-kata yang tidak baku karena terdapat batasan pengunaan kata. Melalui normalisasi kata-kata tidak baku, penelitian ini membantu preprocessing dan analisis tweet, yang merupakan langkah penting dalam klasifikasi teks media sosial. Sistem otomatis yang dikembangkan oleh penelitian ini tidak hanya memudahkan peneliti untuk mengidentifikasi penggunaan kata-kata slang atau tidak baku, tetapi juga meningkatkan kualitas komunikasi dan pemahaman pesan dalam tweet yang mengikuti tren bahasa terbaru. Penelitian ini menggunakan metode lexicon-Based untuk kamus opini, mengumpulkan data, melakukan preprocessing, menemukan bahasa yang tidak baku, menemukan slang, dan menghapus kata berimbuhan. Metode ini membantu analisis sentimen dalam pengolahan teks dan memastikan bahwa hasil klasifikasi sentimen pada data Twitter lebih akurat. Hasil percobaan menunjukkan bahwa langkah preprocessing meningkatkan akurasi metode penentuan polarisasi secara efektif, Tingkat accuracy InSet adalah 66,66% dan F1-score adalah 61,40%.

Item Type: Thesis (S1)
Contributors:
ContributionNameNIP / NIDN
UNSPECIFIEDMatulatan, TekadNIP.197308282021211006
UNSPECIFIEDNovia Hidayati, NuraisaNIP.1989112320140220001
Subjects: 000_umum > 000. Ilmu Umum dan Komputer > 005.1.Pemrograman
000_umum > 000. Ilmu Umum dan Komputer > 005.12. Sistem Analisa dan Desain Perangkat Lunak
000_umum > 000. Ilmu Umum dan Komputer > 006.754. Situs Jejaring Sosial, Sosial Media
Divisions: Fakultas Teknik > Program Studi Teknik Informatika
Depositing User: user Teknik Informatika
Date Deposited: 31 Jul 2024 02:22
Last Modified: 31 Jul 2024 02:23
URI: http://repositori.umrah.ac.id/id/eprint/7752

Actions (login required)

View Item View Item