Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
TEXT MINING DENGAN METODE LEXICON BASED UNTUK
SENTIMENT ANALYSIS PELAYANAN PT. POS INDONESIA MELALUI
MEDIA SOSIAL TWITTER
Jurnal
Diajukan kepada
Fakultas Teknologi Informasi
Untuk Memperoleh Gelar Master of Computer Science
Oleh:
Febrilien Matresya Matulatuwa
972012004
Program Studi Magister Sistem Informasi
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
September 2017
i
Text Mining dengan Metode Lexicon Based untuk
Sentiment Analysis Pelayanan PT. POS Indonesia Melalui
Media Sosial Twitter
Jurnal
Diajukan kepada
Fakultas Teknologi Informasi
untuk memperoleh Gelar Master of Computer Science
Oleh:
Febrilien Matresya Matulatuwa
NIM : 972012004
Program Studi Magister Sistem Informasi
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
September 2017
ii
Pernyataan Tidak Plagiat
iii
Pernyataan Persetujuan Akses
iv
Lembar Persetujuan Pembimbing
v
Lembar Pengesahan
vi
Kata Pengantar
Puji syukur ke hadirat ALLAH BAPA, TUHAN YESUS, DAN ROH KUDUS atas kasih
anugerah serta penyertaan-Nya sehingga penulis dapat menyelesaikan laporan tesis yang
berjudul “Text Mining dengan Metode Lexicon Based untuk Sentiment Analysis Pelayanan
PT. POS Indonesia Melalui Media Sosial Twitter”. Laporan tesis ini diajukan sebagai
persyaratan dalam memperoleh gelar Master of Computer Science (M.Cs) pada Program Studi
Magister Sistem Informasi, Fakultas Teknologi Informasi Universitas Kristen Satya Wacana.
Laporan tesis ini dapat selesai berkat bantuan dari berbagai pihak yang telah
memberikan bimbingan, ide, dan berbagai dukungan lainnya kepada penulis. Oleh karena itu,
pada kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:
1. Bapak Dr. Dharmaputra T. Palekahelu, M.Pd., selaku Dekan Fakultas Teknologi
Informasi, Universitas Kristen Satya Wacana, Salatiga. Tuhan Yesus Berkati.
2. Bapak Prof. Ir. Danny Manongga, M.Sc., Ph.D., selaku Ketua Program Studi Magister
Sistem Informasi, Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana,
Salatiga dan juga selaku dosen penguji pertama ujian akhir. Tuhan Yesus Berkati.
3. Bapak Prof. Dr. Ir. Eko Sediyono, M.Kom., selaku dosen pembimbing pertama dan Ibu
Dr. Ade Iriani, M.M., selaku dosen pembimbing kedua, terima kasih atas kesabaran dalam
memberi bimbingan, masukan, motivasi dan pengarahan yang berarti sehingga laporan
tesis ini dapat terselesaikan dengan baik. Tuhan Yesus Berkati.
4. Bapak Hindriyanto D. Purnomo, ST., MIT., Ph.D., selaku Wakil Dekan Fakultas
Teknologi Informasi, Universitas Kristen Satya Wacana, Salatiga dan selaku dosen
penguji kedua ujian kelayakan dan ujian akhir. Terima kasih telah memberi masukan yang
berarti untuk laporan tesis ini. Tuhan Yesus Berkati.
5. Bapak Dr. Kristoko Dwi Hartomo, M.Kom., selaku dosen penguji pertama ujian
kelayakan, terima kasih memberi masukan yang berarti untuk laporan tesis ini. Tuhan
Yesus Berkati.
6. Para staff pengajar di MSI FTI UKSW yang telah memberikan banyak ilmu selama
kuliah. Tuhan Yesus Berkati.
7. ”Big Thanks” par Papa Et, Mama Oci, Melnix, Grepma, Antagracea, Junes dan seluruh
keluarga besar Matulatuwa-Titahena-Hutubessy di manapun berada. Terima kasih atas
perhatian, dukungan, bantuan, semangat dan doanya. Tuhan Yesus Berkati.
vii
8. Orang Spesial, Big Greogory Kaitelapatay dan Aldian Umbu Tamu Ama, ”Dangke Banya
par Senyum deng Canda Tawa yang Pernah Dong Kase, Tete Manis Sayang Dong Dua”.
9. Ibu Yuni selaku sekretaris MSI FTI UKSW yang telah membantu mengurus administratif
selama kuliah. Tuhan Yesus Berkati.
10. Teman-teman angkatan 10 MSI FTI UKSW (Ten Generation): ”Kaka Emants G. Siak,
Kaka Nina Setiyawati, Alessandro Christoforus Baramuli, Abdi Samuel, Jemaictry
Tamaela” yang telah menemani selama kuliah dengan canda dan tawa. Tuhan Berkati.
11. Teman-teman MSI FTI UKSW yang lain, khususnya ”Jun, Hanny, Om Ito, Bobby,
Antonio, Fiktor, Mike, Arny, kaka Ceril” terima kasih untuk bantuan, dukungan dan
semangat dari kalian. Tuhan Yesus Berkati.
12. Ketua dan Majelis Jemaat GPM Haruru Klasis Masohi, terima kasih untuk dukungan dan
doanya. Tuhan Yesus Berkati.
13. Redaksi Jurnal Masyarakat Informatika Indonesia (JMII) Bandung dan Redaksi Jurnal
Teknologi Informasi dan Sistem Informasi (JuTISI) Bandung beserta para reviewer
masing-masing redaksi jurnal, terima kasih sudah menerima, me-review dan menerbitkan
jurnal penulis. Tuhan Yesus Berkati.
14. ”Ity, Erin, Bongso, Om Tete” terima kasih untuk bantuan dan doanya. Tuhan Berkati.
15. Tamang-Tamang Bae ”Ainsten Peiter Tahalea, Alicia Gladies Hursepuny, Silvia Marlen
Manusiwa, Johannes Latuny, Olivia Isabella Tuhumena, Arthur Huwae, Ketrina Tress
Surlialy” terima kasih buat bantuan dan kebersamaan selama ini. Tuhan Yesus Berkati.
16. Pdt. Jacob D. Engel., ”Danke Om zhu Bantu Beta”. Tuhan Yesus Berkati.
17. Alumni SMA Negeri 1 Masohi 2007 yang begitu luar biasa, yang satu per satu tidak dapat
disebutkan karena ”Paleng Abis Banya”. Terima kasih untuk kebersamaan dan canda tawa
selama ini, Tuhan Yesus Berkati. ”Katong Samua Batamang Bae”.
18. ”Usi Kos, Pa Murjio dan keluarga, Pa Sapto dan keluarga” terima kasih atas tempat
tinggal yang disediakan. Tuhan Yesus Berkati.
19. Teman-teman kost: Syeni, Cia, Elsye, Thalia, Taya, terima kasih buat kebersamaannya
selama ini. Tuhan Yesus Berkati.
20. Teman-teman Muger GPIB Tamansari Salatiga khususnya ”Kaka Tity, Kaka Gies, Juniart,
Ampy, Rey, Tasya, Tatu, Lia, Juned, Ela, Icat, James, Mega, Ledy, Ecika, Eca, Li, Ariel,
Thea, Kaka Ete, Icha, Manda, Ane, Une, Angga, Engklin, Merry, Ulen, Nana, Christian”,
terima kasih untuk canda tawa dan kebersamaan selama ini. Tuhan Yesus Berkati.
viii
21. Orang Bae, Kaka Lances ”Danke Banya kaka Ganteng, zhu bantu Beta bage kuesioner
deng kase semangat par Beta, Tete Manis Sayang Kaka”.
22. PT. POS Indonesia khususnya ”Kantor POS Masohi dan Kantor POS Ambon”,
terimakasih sudah mengijinkan dan membantu penulis selama melakukan penelitian dan
pengambilan data. Tuhan Yesus Berkati.
23. Ade-ade di Salatiga ”Ino, Gelino, Meno, Mano, Neni, Eten, Arlien, Jenet, Monic, Dita,
Edy, Vicky, Paul” terima kasih untuk bantuan dan semangat dari kalian. Tuhan Berkati.
24. Ketua dan Majelis Jemaat serta Paduan Suara Jemaat dan PelKat Gerakan Pemuda GPIB
Tamansari Salatiga, terima kasih untuk semangat dan doanya. Tuhan Yesus Berkati.
25. Om Piet Lumalessil deng Tanta Miets Lumalessil, terima kasih untuk dorongan dan
semangat yang diberikan. Tuhan Yesus Berkati.
26. ”Kaka Onal, Coken, Gefan, Nusye, Obio, Dedy, Alon, Paet, Jeck, Yondri” terima kasih
untuk bantuan, dukungan, semangat dan doanya. Tuhan Yesus Berkati.
27. Semua pihak yang tidak dapat penulis sebutkan satu per satu yang telah membantu penulis
selama penyusunan laporan tesis ini. Tuhan Yesus Berkati.
Penulis sangat menyadari bahwa dalam penulisan laporan tesis ini masih banyak sekali
kekurangan dan masih jauh dari kesempurnaan. Oleh karena itu penulis mengharapkan kritik
dan saran yang membangun untuk melengkapi dan menyempurnakan laporan tesis ini. Semoga
laporan tesis ini dapat menjadi bahan kajian yang baik untuk pembelajaran selanjutnya dan
berguna untuk keperluan pendidikan. Terima kasih semuanya. Syallom dan diberkati selalu.
“Karya besar di dunia ini, umumnya dihasilkan oleh orang yang tetap melakukan,
Meskipun harapannya nyaris putus.” Om Big
Salatiga, 16 September 2017
Febrilien Matresya Matulatuwa
ix
Daftar Isi
Halaman
Halaman Judul ..................................................................................................................i
Pernyataan Tidak Plagiat .................................................................................................ii
Pernyataan Persetujuan Akses .........................................................................................iii
Lembar Persetujuan Pembimbing ...................................................................................iv
Lembar Pengesahan ..........................................................................................................v
Kata Pengantar .................................................................................................................vi
Daftar Isi............................................................................................................................ix
Daftar Gambar ..................................................................................................................xi
Daftar Tabel ......................................................................................................................xii
Abstract ..............................................................................................................................1
I. PENDAHULUAN ............................................................................................................2
II. KAJIAN LITERATUR.....................................................................................................3
A. Penelitian Terdahulu ..............................................................................................3
B. Text Mining ............................................................................................................4
C. Sentiment Analysis .................................................................................................4
D. Lexicon Based ........................................................................................................4
III. METODE PENELITIAN ..................................................................................................5
IV. HASIL DAN PEMBAHASAN ............................................................................................6
A. Data Acquisition ....................................................................................................6
B. Load Dictionary 1 ..................................................................................................7
C. Preprocessing ........................................................................................................7
1. Normalize Sentences ..........................................................................................7
a) Normalisasi Pertama ......................................................................................7
b) Normalisasi Kedua ........................................................................................8
2. Tokenization ......................................................................................................8
D. Load Dictionary 2 ..................................................................................................9
x
E. Extract Keyword ....................................................................................................9
F. Determine Sentiment ..............................................................................................10
G. Analisis Emoticon ..................................................................................................11
V. KESIMPULAN DAN SARAN ............................................................................................12
REFERENSI .........................................................................................................................12
LAMPIRAN .........................................................................................................................13
xi
Daftar Gambar
Halaman
Gambar 1. Opini Negatif tentang PT. POS Indonesia ..........................................................2
Gambar 2. Opini Positif dan Negatif di Twitter PT. POS Indonesia .....................................3
Gambar 3. Tahapan dalam Text Mining ...............................................................................4
Gambar 4. Algoritma Metode Lexicon Based Secara Umum ...............................................5
Gambar 5. Alur Proses Ekstraksi Kata Kunci ......................................................................5
Gambar 6. Alur Proses Ekstraksi Emoticon .........................................................................5
Gambar 7. Algoritma Metode Lexicon Based ......................................................................6
Gambar 8. Sentimen Pelanggan PT. POS Indonesia ............................................................11
Gambar 9. Emoticon dari Opini Pelanggan PT. Pos Indonesia ............................................12
xii
Daftar Tabel
Halaman
Tabel 1. Kamus Emoticon................................................................................................5
Tabel 2. Data Acquisition ................................................................................................7
Tabel 3. Normalisasi Pertama ..........................................................................................7
Tabel 4. Normalisasi Kedua.............................................................................................8
Tabel 5. Hasil Tokenization .............................................................................................9
Tabel 6. Hasil Extract Keyword .......................................................................................10
Tabel 7. Hasil Determine Sentiment .................................................................................10
Tabel 8. Hasil Pengolahan Data Opini Pelanggan ............................................................10
Tabel 9. Hasil Analisis Emoticon .....................................................................................11
Tabel 10. Hasil Pengolahan Data Emoticon .......................................................................11
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
1 Jurnal Nasional JMII 2017
TEXT MINING DENGAN METODE LEXICON BASED UNTUK
SENTIMENT ANALYSIS PELAYANAN PT. POS INDONESIA MELALUI
MEDIA SOSIAL TWITTER
Febrilien Matresya Matulatuwa, Eko Sediyono, Ade Iriani Fakultas Teknologi Informasi, Program Studi Magister Sistem Informasi
Universitas Kristen Satya Wacana Jalan Diponegoro 52-60, Salatiga, Indonesia
[email protected], [email protected], [email protected]
Abstract
PT. POS Indonesia or known as the POST Office is one of the Business Entity engaged in service delivery and in particular correspondence. The phenomenon of increasing social media usage that is so rapidly allows
companies to evaluate products based on sentiments that are posted on social media. A sentiment analysis task
performing polarization documents such as documents classification into positive and negative sentiment. One of
the widely used social media is Twitter. Through the number of posts to reach thousands of tweets per second the
availability of sentiment for a product is very rich. The problem that arises is how to do classification of such
sentiment to be useful for evaluating the product and service for customer. This research uses Lexicon Based
method to analyze consumer opinion on services of PT. POS Indonesia. Use of Lexicon Based method is shown
able to capture sentiment information from social media such as twitter. The result of this research can help the
post office to understand the extent of the services provided to customers and anything of services that needs to be
improved.
Keywords: PT. POS Indonesia, Sentiment Analysis, Lexicon Based, Twitter.
Abstrak
PT. POS Indonesia atau lebih dikenal dengan Kantor Pos adalah salah satu Badan Usaha yang bergerak di
bidang jasa khususnya pengiriman barang dan surat menyurat. Fenomena meningkatnya penggunaan media sosial
yang begitu pesat memudahkan perusahaan untuk mengevaluasi produk-produknya berdasarkan sentimen-
sentimen yang diposting di media sosial tersebut. Analisis sentimen merupakan suatu tugas yang melakukan
polarisasi dokumen berupa pengklasifikasian dokumen ke dalam sentimen positif dan negatif. Salah satu
media sosial yang banyak digunakan adalah Twitter. Dengan jumlah postingan mencapai ribuan tweet perdetik ketersediaan sentimen untuk suatu produk sangat melimpah. Permasalahan yang muncul adalah bagaimana
melakukan klasifikasi terhadap sentimen tersebut agar berguna untuk mengevaluasi produk dan pelayanan kepada
pelanggan. Penelitian ini menggunakan metode Lexicon Based untuk menganalisa opini pelanggan terhadap
pelayanan PT. POS Indonesia. Penggunaan metode Lexicon Based ditunjukkan mampu untuk menangkap
informasi sentimen dari media sosial seperti twitter. Hasil dari penelitian ini dapat membantu kantor pos untuk
mengetahui sejauh mana tingkat pelayanan yang diberikan kepada pelanggan dan hal apa saja dari pelayanan
yang perlu ditingkatkan.
Kata kunci: PT. Pos Indonesia, Sentiment Analysis, Lexicon Based, Twitter.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
2 Jurnal Nasional JMII 2017
I. PENDAHULUAN
Informasi dapat diibaratkan sebagai darah
yang mengalir di dalam tubuh manusia, seperti
halnya informasi di dalam sebuah perusahaan yang
sangat penting untuk mendukung kelangsungan perkembangannya, sehingga terdapat alasan bahwa
informasi sangat dibutuhkan bagi sebuah
perusahaan. Perolehan informasi yang tepat dan
cepat akan membantu dalam kemajuan dari suatu
organisasi untuk dapat melakukan perubahan yang
menjawab permasalahan yang dihadapi.
Informasi bisa didapatkan dari Media Sosial.
Data dari media sosial misalnya twitter dapat
dimanfaatkan untuk mengetahui sentimen positif
atau negatif dari suatu produk layanan. Kata
sentimen positif digunakan untuk mengekspresikan beberapa keadaan yang diinginkan sementara kata
sentimen negatif digunakan untuk
mengekspresikan beberapa keadaan yang tidak
diinginkan. Contoh kata sentimen positif yaitu
baik, indah, sangat bagus, dan menakjubkan.
Contoh kata sentimen negatif yaitu buruk,
mengerikan, malas dan miskin [1].
Penelitian dalam analisis sentimen didorong
oleh suatu pemikiran bahwa informasi memiliki
nilai sentimen positif atau negatif yang merupakan
hal penting dan dibutuhkan. Sentimen berhubungan dengan penilaian terhadap suatu konteks atau
wacana. Sentimen positif menyatakan pemberian
nilai yang baik pada konteks dalam teks dan
sentimen negatif menyatakan kebalikannya.
Sebagai contoh, analisis sentimen dapat
diaplikasikan pada perusahaan yang mengeluarkan
suatu produk dan menyediakan layanan untuk
menerima pendapat (feedback) dari konsumen
untuk produk dan layanan tersebut. Analisis
sentimen diaplikasikan untuk mengelompokkan
feedback positif dan negatif dari konsumen
sehingga mempercepat dan mempermudah tugas perusahaan untuk meninjau kembali kekurangan
produk dan layanan mereka, berdasarkan feedback
negatif yang diterima dari konsumen, atau untuk
mengetahui tingkat penerimaan konsumen terhadap
produk tersebut [2].
Opini pelanggan adalah hal penting karena
mempunyai kekuatan yang dapat mempengaruhi
citra perusahaan yang erat sekali kaitannya dengan
kualitas pelayanan dari perusahaan itu sendiri.
Kualitas pelayanan jasa kantor pos dapat
mempengaruhi persepsi individu yang kemudian
mempengaruhi opini publik. Oleh karena itu,
kualitas pelayanan sebuah perusahaan harus terus
diperhatikan dan dijaga sehingga menimbulkan
opini yang positif dan tidak membuat citra
perusahaan merosot atau menjadi buruk.
PT. POS Indonesia sebagai penyedia layanan
pengiriman paket dan surat banyak dikomentari oleh pelanggannya melalui media sosial, ada opini
yang positif dan juga yang negatif. Contoh opini
negatif dari pelanggan kantor pos di media sosial
seperti terlihat pada Gambar 1. Gambar 1 adalah
opini negatif tentang kiriman EMS luar negeri Pos
Indonesia yang sudah satu bulan belum sampai dan
yang sudah seminggu belum sampai.
Gambar 1. Opini Negatif tentang PT. Pos Indonesia
[3]
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
3 Jurnal Nasional JMII 2017
Salah satu media sosial media sosial yang
digunakan PT. Pos Indonesia adalah twitter.
Contoh opini positif dan negatif di twitter terkait
layanan kantor pos seperti terlihat pada Gambar 2.
Gambar 2. Opini Positif dan Negatif di twitter PT. Pos
Indonesia [4]
Gambar 2 adalah opini positif dan negatif di
twitter terkait pelayanan kantor pos. Opini positif dari Tas Kulit Polos, sedangkan opini negatif dari
Putri Wanasita.
Kebutuhan informasi terkait opini pelanggan
yang mendorong penelitian analisis sentimen,
sekaligus yang memotivasi penelitian ini. Karena
banyaknya opini pelanggan terkait pelayanan PT.
POS Indonesia terutama pada keterlambatan
pengiriman paket/surat, sehingga mendorong
penelitian untuk melakukan analisis sentimen
terhadap pelayanan PT. POS Indonesia melalui
media sosial twitter. Untuk mempermudah analisis
sentimen tersebut digunakan metode lexicon based. Metode lexicon based adalah metode yang
sederhana, layak dan praktis untuk analisis
sentimen dari data twitter. Penelitian analisis
sentimen dengan metode lexicon based ini
diharapkan dapat membantu dalam menjawab
kebutuhan informasi sentimen yang memperkaya
ketersediaan informasi bagi PT. POS Indonesia
untuk pengembangan pelayanan kepada pelanggan.
II. KAJIAN LITERATUR
A. Penelitian Terdahulu
Penelitian pertama dengan judul Lexicon
Based Methods for Sentiment Analysis membahas
tentang pendekatan berbasis leksikon untuk
mengekstraksi sentimen dari teks. Penelitian ini
menghasilkan beberapa hal, yaitu yang pertama
The Semantic Orientation CALkulator (SO-CAL)
menggunakan kamus dari kata-kata yang dijelaskan
dengan orientasi semantic yang menggabungkan intensifikasi dan negasi, yang kedua yaitu
gambaran proses penciptaan kamus yang
penggunaannya dari Mechanical Turk sampai
memeriksa kamus untuk konsistensi dan
kehandalan, yang ketiga yaitu kamus secara manual
yang memberikan dasar yang kuat untuk
pendekatan berbasis leksikon yang diperlukan
untuk mendapatkan manfaat penuh dari sistem SO-
CAL dan yang keempat yaitu menghasilkan
statistik signifikan perbaikan dari instansiasi
sebelumnya untuk sistem SO-CAL. Sistem SO-
CAL pada penelitian ini diterapkan pada tugas
klasifikasi polaritas, proses untuk menempatkan
label positif atau negatif terhadap teks [5].
Penelitian kedua dengan judul Text Mining dengan metode Naïve Bayes Clasifier dan Support
Vector Machines untuk Sentiment Analysis
membahas klasifikasi opini sebagai opini positif
dan opini negatif pada data berbahasa Inggris dan
data berbahasa Indonesia menggunakan metode
Naïve Bayes Classifier (NBC) dan Support Vector
Machine (SVM). Baik metode NBC maupun
metode SVM memberikan unjuk kerja yang baik
dalam sentiment analysis pengklasifikasian opini
berbahasa Inggris dan berbahasa Indonesia. Hasil
percobaan menunjukkan bahwa metode SVM
memberikan unjuk kerja yang lebih baik daripada metode NBC untuk mengklasifikasikan opini
berbahasa Inggris dan opini positif berbahasa
Indonesia. Sedangkan NBC memberikan unjuk
kerja yang lebih baik dalam mengklasifikasikan
data uji opini negatif berbahasa Indonesia [6].
Penelitian ketiga dengan judul Analisis
Sentimen Berbasis Ontologi di Level Kalimat
untuk Mengukur Persepsi Produk, dibahas
Penggunaan kerangka ontologi untuk pencarian
data di twitter. Tujuan dari penelitian ini adalah
untuk melakukan analisis sentimen pada data di twitter dengan menggunakan algoritma klasifikasi
naïve bayes. Penelitian ini didasarkan pada
kebiasaan pengguna twitter yang sering menulis
opini, ekspresi, atau sentimen tentang suatu produk,
terutama smartphone. Dari 14.437 tweets yang
diteliti ditemukan 13 tweets yang tidak terkait
dengan domain pembahasan. Penggunaan
algoritma klasifikasi naïve bayes terbukti mampu
untuk mengklasifikasi tweets dengan tingkat
akurasi yang tinggi. Hal ini dibuktikan dengan hasil
rata-rata uji di masing-masing lapisan klasifikasi.
Juga untuk rata-rata keseluruhan sistem. Hasil akurasi yang bisa dicapai berada pada kisaran
84.16% sampai dengan 87.54% [7].
Perbedaan penelitian ini dengan penelitian
yang pertama adalah pada hasil sentimennya,
sentimen yang dihasilkan dalam penelitian ini ada
empat yaitu sentimen positif, negatif, netral dan
nihil. Perbedaan penelitian ini dengan penelitian
yang kedua adalah pada metode yang digunakan
dan opini yang diuji, penelitian ini menggunakan
metode lexicon based dan opini yang diuji
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
4 Jurnal Nasional JMII 2017
berbahasa Indonesia. Perbedaan penelitian ini
dengan penelitian ketiga adalah pada metode yang
digunakan, penelitian ini menggunakan metode
lexicon based.
Penelitian ini akan dibahas tentang text
mining untuk analisis sentimen terhadap pelayanan
PT. POS Indonesia melalui media sosial twitter
dengan menggunakan metode lexicon based,
dimana dapat diketahui klasifikasi opini pelanggan ke dalam setimen positif, negatif, netral dan nihil
terhadap pelayanan kantor POS Indonesia,
sehingga dapat membantu untuk mengetahui sejauh
mana tingkat pelayanan yang diberikan kepada
pelanggan dan hal apa saja dari pelayanan yang
perlu diperhatikan untuk pengembangan pelayanan
kepada pelanggan.
B. Text Mining
Text mining memiliki defenisi menambang
data yang berupa teks dimana sumber data biasanya
didapatkan dari dokumen, dengan tujuannya adalah
mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa
keterhubungan antar dokumen [8]. Tahapan yang
dilakukan secara umum dalam text mining
ditunjukkan seperti pada Gambar 3.
Gambar 3. Tahapan dalam Text Mining [8]
Tahap tokenizing adalah tahap pemotongan
string input berdasarkan tiap kata yang
menyusunnya. Tahap filtering adalah tahap
mengambil kata-kata penting dari hasil token yang
biasanya menggunakan algoritma stop list (membuang kata yang kurang penting) atau word
list (menyimpan kata penting). Tahap stemming
adalah tahap mencari root kata dari tiap kata hasil
filtering. Tahap tagging adalah tahap mencari
bentuk awal/root dari tiap kata lampau atau kata
hasil stemming. Tahap analyzing merupakan tahap
penentuan seberapa jauh keterhubungan antar kata-
kata pada dokumen yang ada [8].
C. Sentiment Analysis
Sentiment analysis atau opinion mining
merupakan sebuah cabang penelitian di domain text mining yang mulai marak pada tahun 2003.
Opinion mining atau sentiment analysis adalah riset
komputasional dari opini, sentimen dan emosi yang
diekspresikan secara tekstual. Jika diberikan satu
set dokumen teks yang berisi opini (atau sentimen)
mengenai suatu objek, maka opinion mining
bertujuan untuk mengekstrak atribut dan komponen
dari objek yang telah dikomentari pada setiap
dokumen dan untuk menentukan apakah komentar
tersebut positif, atau negatif [9]. Opinion mining adalah bagian pekerjaan yang
melakukan review yang berkaitan dengan
perlakuan komputasional opini, sentimen dan
subjektifitas dari teks [10].
D. Lexicon Based
Metode Lexicon Based dipilih dalam
penelitian ini karena metode ini sederhana, layak
dan praktis untuk analisis sentimen dari data media
sosial. Data yang cocok dengan metode lexicon
based yaitu data kuesioner, data twitter, data
facebook, atau media sosial lainnya yang berupa
opini pelanggan tentang suatu produk atau
pelayanan jasa.
Lexicon based didasarkan pada asumsi bahwa
orientasi sentimen kontekstual adalah jumlah dari
orientasi sentimen setiap kata atau frase. Metode
leksikon dapat digunakan untuk mengekstrak
sentimen dari blog dengan mengkombinasi lexical
knowledge dan klasifikasi teks [11]. Metode
leksikon dapat dibuat secara manual [5] atau
diperluas secara otomatis dari seed of words [12].
Kamus adalah komponen penting dalam
sistem yang menggunakan metode lexicon based. Kamus digunakan dalam proses normalisasi
kalimat dan ekstraksi kata kunci. Berikut adalah
contoh kamus dan isinya [13]:
1. Positive keywords: baik, banyak, bisa, ok,
best, pintar, lancar, cepat, bagus, senang.
2. Negative keywords: bangkrut, banjir,
bodoh, gagal, kurang, susah, lambat,
parah, bohong.
3. Negation keywords: belum, bukan, tidak
4. Emoticon: (nilainya: 1), (nilainya: -
1)
5. Kamus konversi bahasa gaul: bgmn =
bagaimana, bgs = bagus, beud = banget
Algoritma metode lexicon based secara
umum, seperti terlihat pada Gambar 4.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
5 Jurnal Nasional JMII 2017
Gambar 4. Algoritma Metode Lexicon Based Secara
Umum [13]
Penjelasan dari algoritma diatas adalah [13]:
1. Data Acquisition. Pada proses ini
dilakukan pengambilan data dari media
sosial berbahasa Indonesia. Hasil dari
proses ini adalah daftar opini pembaca
serta metadata seperti: username dan
waktu.
2. Load Dictionary. Pada proses ini
dilakukan me-load kamus. Kamus yang
digunakan adalah positive keyword,
negative keyword, negation keyword,
kamus emoticon dan kamus bahasa
gaul/alay.
3. Preprocessing. Proses ini bertujuan untuk
menyiapkan kalimat sebelum dilakukan
ekstraksi kata kunci dan penentuan
sentimen. Yang dilakukan dalam proses
ini adalah Normalisasi Kalimat dan
Tokenisasi.
4. Extract Keyword. Proses ini bertujuan
untuk mengekstraksi kata kunci penentu
sentimen positif dan negatif.
5. Determine Sentiment. Proses ini bertujuan
untuk menentukan sentimen suatu kalimat
opini. Penentuan sentimen dilakukan
dengan menghitung probabilitas
kemunculan kata kunci positif dan kata
kunci negatif.
Alur Proses Ekstraksi Kata Kunci dan Emoticon seperti ditunjukan Gambar 5 dan Gambar
6.
Gambar 5. Alur Proses Ekstraksi Kata Kunci [13]
Setelah kalimat dinormalisasi, selanjutnya
kalimat dipecah kedalam token-token
menggunakan pembatas. Terdapat 3 jenis token
yaitu [13]:
Unigrams: yaitu token yang terdiri dari
hanya satu kata, contohnya: kantor.
Bigrams: yaitu token yang terdiri dari dua
kata, contohnya: kantor pos.
Trigrams: yaitu token yang terdiri dari tiga
kata, contohnya: kantor pos masohi.
Setelah terbentuk unigram, bigram dan
trigram, selanjutnya diekstrak kata kunci dari
kalimat menggunakan ketiga jenis token tersebut
dicocokkan dengan kamus untuk mendapatkan kata
kunci positif, negatif dan netral.
Gambar 6. Alur Proses Ekstraksi Emoticon [13]
Gambar 6 merupakan alur proses ekstraksi
Emoticon. Dari awal kalimat dicari emoticon-nya.
Untuk mengekspresikan persetujuan atau
pertidaksetujuan dalam suatu kalimat biasanya
digunakan emoticon. Maka dari itu, emoticon
dalam kalimat dianggap penting dan memiliki
kontribusi dalam menentukan nilai sentimen suatu kalimat. Ekstraksi emoticon ini dilakukan dengan
menggunakan referensi kamus emoticon yang
mengandung nilai sentimen dari setiap emoticon
[13].
Contoh isi kamus emoticon, seperti terlihat
pada Tabel 1 berikut:
Tabel 1. Kamus Emoticon
Emoticon Nilai Sentimen
1
-1
:D 1
:P -1
-_-‘ -1
III. METODE PENELITIAN
Alur proses sentiment analysis menggunakan
metode lexicon based, seperti pada Gambar 7. Gambar 7 merupakan algoritma proses sentiment
analysis menggunakan metode lexicon based.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
6 Jurnal Nasional JMII 2017
Gambar 7. Algoritma Metode Lexicon Based
Penjelasan dari algoritma pada gambar 7
sebagai berikut:
1. Tahap pertama adalah Data Acquisition. Dalam
tahapan ini dilakukan pengambilan teks dari media sosial twitter PT. Pos Indonesia. Hasil
dari proses ini adalah data user seperti nama
user, id user, opini dan waktu.
2. Tahap kedua adalah Load Dictionary pertama.
Dalam tahapan ini dilakukan load kamus yaitu
Kamus Bahasa Indonesia (KBI) dan Kamus
Normalisasi Bahasa Gaul/Alay.
3. Tahap ketiga adalah Preprocessing. Proses yang
dilakukan dalam tahapan ini yaitu Normalisasi
kalimat dan Tokenisasi. Pada penelitian ini,
proses normalisasi kalimat dilakukan dua kali.
Proses normalisasi yang pertama yaitu menghilangkan simbol selain alfabet,
menghilangkan huruf yang berulang dan
mengubah kalimat menjadi Bahasa Indonesia
yang baik dan benar. Sedangkan proses
normalisasi yang kedua yaitu menghilangkan
tanda baca dan mengubah kalimat menjadi
huruf kecil. Dalam proses tokenisasi dilakukan
pemecahan kalimat ke dalam token-token
menggunakan pembatas. Evaluasi token yang
digunakan dalam penelitian ini yaitu unigrams,
bigrams dan trigrams.
4. Tahap keempat adalah Load Dictionary kedua.
Dalam tahapan ini dilakukan load kamus yaitu
positive keyword, negative keyword dan
negation keyword.
5. Tahap kelima adalah Extract Keyword. Dalam
tahapan ini dilakukan ekstrak kata kunci dari
kalimat menggunakan ketiga jenis token yang
dicocokkan dengan kamus untuk mendapatkan kata kunci positif dan negatif. Kemudian
dihitung nilai sentimen untuk setiap kata kunci
positif dan negatif.
6. Tahap keenam adalah Determine Sentiment.
Penentuan sentimen dilakukan dengan
menghitung probabilitas kemunculan kata kunci
positif dan kata kunci negatif, mana yang lebih
dominan. Jika nilai sentimen positif lebih
dominan, maka nilai sentimen untuk kalimat
tersebut adalah positif. Namun jika nilai
sentimen negatif lebih dominan, maka nilai
sentimennya adalah negatif. Jika nilainya sama antara sentimen negatif dan positif, maka nilai
sentimennya adalah netral. Dan jika tidak ada
nilai untuk sentimen positif maupun negatif,
maka nilai sentimennya adalah nihil.
IV. HASIL DAN PEMBAHASAN
A. Data Acquisition
Data acquisition seperti terlihat pada Tabel 2. Tabel 2 merupakan sebagian data acquisition dari
data twitter PT. Pos Indonesia yang menampilkan
data user yaitu nomor, nama, id, opini dan waktu
pelanggan berkomentar. Data diambil secara acak
dan di-filter terlebih dahulu, sehingga yang masuk
pada data acquisition hanya data berupa opini
pelanggan tentang layanan kantor pos.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
7 Jurnal Nasional JMII 2017
Tabel 2. Data Acquisition
No Nama User ID User Opini Waktu
93 ferdi @GreenDesign_jkt @PosIndonesia astaga, saya di jakarta. Masa harus ke sby? Ga profesional banget sih
02-Mar-15
107 Dessy Framita Sari
@DessyFramita @PosIndonesia makasih Pos Indonesia, ngirim motor dari
Lombok dateng tepat waktu, good job! Thank you!
03-Mar-15
133 Bosco Januar
@bosco_jp @PosIndonesia maaf min, paketnya udah nyampe barusan, tapi info nya kok salah ya di web nya pos indonesia?
29-Apr-15
194 Desga @desga_ @PosIndonesia saya mohon secepatnya ya :) 22-Sep-15
276 eko_cand @eko_cand1 @PosIndonesia met siang sampe saat ini kok belum sampe
kiriman paket nya ya
28-Nov-16
291 Putra Elbert Shop
@PutraElbertShop @PosIndonesia sudah bisa. Terima kasih banyak :) 01-Des-16
* * * * *
318 Mega @vipxxmega @PosIndonesia min nomer resi 15474561782. Belum sampe juga udah 4 hari. Biasa nya 2 hari sampe.
02-Feb-17
B. Load Dictionary 1
Setelah proses data acquisition, proses
selanjutnya adalah load dictionary 1. Dalam proses
load dictionary yang pertama ini, dilakukan load
kamus yaitu kamus Bahasa Indonesia (KBI) dan
kamus normalisasi bahasa gaul/alay.
C. Preprocessing
1. Normalize Sentences
a) Normalisasi Pertama
Normalisasi pertama seperti terlihat pada
Tabel 3. Tabel 3 merupakan sebagian dari data
twitter PT. Pos Indonesia yang menampilkan hasil
dari proses normalisasi pertama. Pada proses
normalisasi pertama ini, simbol selain alfabet
dihilangkan, huruf yang berulang juga dihilangkan
dan kalimatnya diubah menjadi Bahasa Indonesia
yang benar berdasarkan load dictionary pertama.
Tabel 3. Normalisasi Pertama
No Nama User ID User Opini Waktu
93 ferdi @GreenDesign_jkt Pos Indonesia astaga, saya di jakarta. Masa harus ke surabaya? tidak profesional banget
02-Mar-15
107 Dessy Framita Sari
@DessyFramita Pos Indonesia terima kasih Pos Indonesia, kirim motor dari Lombok datang tepat waktu, good job! Thank you!
03-Mar-15
133 Bosco Januar
@bosco_jp Pos Indonesia maaf admin, paketnya sudah sampai baru saja, tapi informasinya kok salah ya di situs web pos indonesia?
29-Apr-15
194 Desga @desga_ Pos Indonesia saya mohon secepatnya :) 22-Sep-15
276 eko_cand @eko_cand1 Pos Indonesia selamat siang sampai saat ini kok belum sampai
kiriman paketnya ya
28-Nov-16
291 Putra Elbert Shop
@PutraElbertShop Pos Indonesia sudah bisa. Terima kasih banyak :) 01-Des-16
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
8 Jurnal Nasional JMII 2017
* * * * *
318 Mega @vipxxmega Pos Indonesia admin nomor resi 15474561782 Belum sampai juga sudah empat hari. Biasanya dua hari sampai.
02-Feb-17
b) Normalisasi Kedua
Normalisasi kedua seperti terlihat pada Tabel
4. Tabel 4 merupakan sebagian data twitter PT. Pos
Indonesia yang menampilkan hasil dari proses
normalisasi kedua. Pada proses normalisasi kedua
ini, tanda baca dihilangkan, kalimat dijadikan huruf
kecil semua dan emoticon dihilangkan.
Tabel 4. Normalisasi Kedua
No Nama User ID User Opini Waktu
93 ferdi @GreenDesign_jkt pos indonesia astaga saya di jakarta masa harus ke surabaya tidak profesional banget
02-Mar-15
107 Dessy Framita Sari
@DessyFramita pos indonesia terima kasih pos indonesia kirim motor dari lombok datang tepat waktu good job thank you
03-Mar-15
133 Bosco Januar
@bosco_jp pos indonesia maaf admin paketnya sudah sampai baru saja tapi informasinya kok salah ya di situs web pos indonesia
29-Apr-15
194 Desga @desga_ pos indonesia saya mohon secepatnya 22-Sep-15
276 eko_cand @eko_cand1 pos indonesia selamat siang sampai saat ini kok belum sampai kiriman paketnya ya
28-Nov-16
291 Putra Elbert Shop
@PutraElbertShop pos indonesia sudah bisa terima kasih banyak 01-Des-16
* * * * *
318 Mega @vipxxmega pos indonesia admin nomor resi belum sampai juga sudah empat hari biasanya dua hari sampai
02-Feb-17
2. Tokenization
Setelah kalimat dinormalisasi, selanjutnya
kalimat dipecah ke dalam token-token
menggunakan pembatas. Hasil proses tokenisasi
seperti pada Tabel 5. Tabel 5 merupakan sebagian
data twitter PT. Pos Indonesia yang menampilkan
hasil proses tokenisasi dalam unigrams, bigrams
dan trigrams. Dalam Tabel 5 ditampilkan calon
keyword-nya dan juga hasil load dictionary kedua.
Untuk dapat membedakannya digunakan Bold,
Italic, dan Underline. Kata yang di-Bold
merupakan positive keyword, kata yang di-italic
merupakan negative keyword dan kata yang di-
underline merupakan negation keyword.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
9 Jurnal Nasional JMII 2017
Tabel 5. Hasil Tokenization
No Unigrams Brigrams Trigrams
93 pos, indonesia, astaga, saya, di, jakarta, masa, harus, ke, surabaya, tidak, profesional, banget
pos indonesia, indonesia astaga, astaga saya, saya di, di jakarta, jakarta masa, masa harus, harus ke, ke surabaya, surabaya tidak, tidak profesional, profesional banget
pos indonesia astaga, indonesia astaga saya, astaga saya di, saya di jakarta, di jakarta masa, jakarta masa harus, masa harus ke, harus ke surabaya, ke surabaya tidak, surabaya tidak profesional, tidak profesional banget
107 pos, indonesia,
terima, kasih, pos, indonesia, kirim, motor, dari, lombok, datang, tepat, waktu, good, job, thank, you
pos indonesia, indonesia terima,
terima kasih, kasih pos, pos indonesia, indonesia kirim, kirim motor, motor dari, dari lombok, lombok datang, datang tepat, tepat waktu, waktu good, good job, job thank, thank you
pos indonesia terima, indonesia terima kasih,
terima kasih pos, kasih pos indonesia, pos indonesia kirim, indonesia kirim motor, kirim motor dari, motor dari lombok, dari lombok datang, lombok datang tepat, datang tepat waktu, tepat waktu good, waktu good job, good job thank, job thank you
133
pos, indonesia, maaf,
admin, paketnya, sudah, sampai, baru, saja, tapi, informasinya, kok, salah, ya, di, situs, web, pos, indonesia
pos indonesia, indonesia maaf, maaf
admin, admin paketnya, paketnya sudah, sudah sampai, sampai baru, baru saja, saja tapi, tapi informasinya, informasinya kok, kok salah, salah ya, ya di, di situs, situs web, web pos, pos indonesia
pos indonesia maaf, indonesia maaf admin, maaf
admin paketnya, admin paketnya sudah, paketnya sudah sampai, sudah sampai baru, sampai baru saja, baru saja tapi, saja tapi informasinya, tapi informasinya kok, informasinya kok salah, kok salah ya, salah ya di, ya di situs, di situs web, situs web pos, situs web pos indonesia
194 pos, indonesia, saya, mohon, secepatnya, ya
pos indonesia, indonesia saya, saya mohon, mohon secepatnya, secepatnya ya
pos indonesia saya, indonesia saya mohon, saya mohon secepatnya, mohon secepatnya ya
276
pos, indonesia, selamat, siang, sampai, saat, ini, kok, belum, sampai, kiriman, paketnya, ya
pos indonesia, indonesia selamat, selamat siang, siang sampai, sampai saat, saat ini, ini kok, kok belum, belum sampai, sampai kiriman, kiriman paketnya, paketnya ya
pos indonesia selamat, indonesia selamat siang, selamat siang sampai, siang sampai saat, sampai saat ini, saat ini kok, ini kok belum, kok belum sampai, belum sampai kiriman, sampai kiriman paketnya, kiriman paketnya ya
291 pos, indonesia, sudah, bisa, terima,
kasih, banyak
pos indonesia, indonesia sudah, sudah bisa, bisa terima, terima
kasih, kasih banyak
pos indonesia sudah, indonesia sudah bisa, sudah bisa terima, bisa terima kasih, terima kasih
banyak
* * * *
318
pos, indonesia, admin, nomor, resi, belum, sampai, juga, sudah, empat, hari, biasanya, dua, hari, sampai
pos indonesia, indonesia admin, admin nomor, nomor resi, resi belum, belum sampai, sampai juga, juga sudah, sudah empat, empat hari, hari biasanya, biasanya dua,
dua hari, hari sampai
pos indonesia admin, indonesia admin nomor, admin nomor resi, nomor resi belum, resi belum sampai, belum sampai juga, sampai juga sudah, juga sudah empat, sudah empat hari, empat hari biasanya, hari biasanya dua, biasanya dua hari, dua
hari sampai
D. Load Dictionary 2
Setelah proses tokenisasi, selanjutnya
dilakukan proses load dictionary 2. Dalam proses
load dictionary yang kedua ini, dilakukan load
kamus yaitu kamus kata kunci sentimen positif,
negatif dan negasi. Hasil dari load dictionary yang
kedua bisa dilihat pada Tabel 5 yaitu pada kata
yang di-bold, di-italic, dan di-underline.
E. Extract Keyword
Setelah terbentuk unigram, bigram, dan
trigram, selanjutnya diekstrak kata kunci dari
kalimat menggunakan ketiga jenis token dan
dicocokkan dengan kamus untuk mendapatkan kata
kunci positif dan negatif. Hasil proses extract
keyword seperti pada Tabel 6. Tabel 6 merupakan
sebagian data twitter PT. Pos Indonesia yang
menampilkan hasil proses extract keyword dalam
positive keyword, negation keyword dan negative
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
10 Jurnal Nasional JMII 2017
keyword. Dalam Tabel 6 terlihat positive keyword
yang di-strikethrough (profesional, profesional banget,
sampai). Ketiga keyword ini awalnya adalah kata
kunci positif, tapi karena sebelumnya diikuti kata
negasi yaitu tidak dan belum, maka ketiga keyword
tersebut berubah menjadi kata kunci negatif.
Tabel 6. Hasil Extract Keyword
No Positive Keyword
Negation Keyword
Negative Keyword
93 profesional, profesional banget
Tidak tidak profesional, tidak profesional
banget
107 terima, datang, tepat, good, tepat waktu, good job, datang tepat waktu
- -
133 sudah, sampai, baru, sudah sampai, paketnya sudah sampai
- salah, kok salah, salah ya, informasinya kok salah, kok salah ya
194 - - -
276 selamat,
sampai, sampai
Belum kok belum,
belum sampai, kok belum sampai
291 sudah, bisa, terima, sudah bisa, bisa terima, sudah bisa terima
- -
* * * *
318 sampai, sudah, sampai
Belum belum sampai, belum sampai juga
F. Determine Sentiment
Hasil determine sentiment seperti terlihat pada
Tabel 7. Tabel 7 merupakan merupakan sebagian
data twitter PT. Pos Indonesia yang menampilkan
hasil proses determine sentiment yang terdiri dari
jumlah nilai kata kunci positif (∑PK), jumlah nilai
kata kunci negatif (∑NK) dan penentuan sentimennya. Dari Tabel 8 terlihat opini 93 bernilai
negatif karena nilai sentimen negatif lebih dominan
dari positif, opini 107 bernilai positif karena nilai
sentimen positif lebih dominan dari negatif, opini
133 bernilai netral karena nilainya sama antara
sentimen positif dan negatif dan opini 194 bernilai
nihil karena tidak ada nilai sentimennya.
Tabel 7. Hasil Determine Sentiment
No
Opini ∑PK ∑NK
Sen
Pos
Sen
Net
Sen
Neg
Sen
Nih
93 0 2
107 7 0
133 5 5
194 0 0
276 2 3
291 6 0
* * * * * * *
318 2 2
Tabel 8. Hasil Pengolahan Data Opini Pelanggan
No Sentimen Jumlah (Angka) Jumlah (%)
1 Sentimen Positif 99 31%
2 Sentimen Negatif 184 58%
3 Sentimen Netral 32 10%
4 Sentimen Nihil 3 1%
Total Opini 318 100%
Tabel 8 merupakan hasil pengolahan data
twitter PT. Pos Indonesia. Dari 185 user,
ditemukan 318 opini pelanggan, dimana Sentimen
Positif sebanyak 99 opini, Sentimen Negatif
sebanyak 184 opini, Sentimen Netral sebanyak 32
opini dan Sentimen Nihil sebanyak 3 opini. Hasil
pengolahan data ini menunjukan bahwa sentimen
positif 31%, sentimen negatif 58%, sentimen netral
10% dan sentimen nihil 1%. Sentimen positif
sebesar 31% artinya hanya sebagian kecil dari
pelanggan yang merasa puas dengan pelayanan jasa yang diberikan PT. Pos Indonesia. Hal ini bisa
dilihat dari keyword opini positif pelanggan, seperti
nyaman, good job, paketnya sudah sampai dan lain
sebagainya. Sentimen negatif sebesar 58% artinya
masih banyak pelanggan yang mengeluhkan
pelayanan yang diberikan oleh PT Pos Indonesia.
Hal ini bisa dilihat dari keyword opini negatif
pelanggan, seperti hilang, unsuccesfull delivery,
barang tidak sampai dan lain sebagainya. Sentimen
netral sebesar 10% artinya adanya kesamaan antara
nilai sentimen positif dan negatif pelanggan.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
11 Jurnal Nasional JMII 2017
Sentimen nihil senilai 1% artinya hanya beberapa
pelanggan yang tidak berargumen tentang
pelayanan kantor pos.
Hasil analisis opini pelanggan terkait
pelayanan jasa PT. Pos Indonesia dapat dilihat pada
Gambar 8.
Gambar 8. Sentimen Pelanggan PT. POS Indonesia
G. Analisis Emoticon
Hasil analisis emoticon seperti terlihat pada
Tabel 9. Tabel 9 merupakan sebagian data hasil
analisis emoticon dari opini pelanggan PT. Pos
Indonesia di media sosial twitter. Pada Tabel 9,
opini pelanggan nomor 1 mengandung emoticon
positif, jadi nilai sentimen emoticon-nya adalah 1,
sedangkan opini pelanggan nomor 2 mengandung
emoticon negatif, jadi nilai sentimen emoticon-nya
adalah -1.
Tabel 9. Hasil Analisis Emoticon
No Opini Pelanggan Simbol
Emo
Emo Pos Emo Neg Nilai Sentimen
1 pos indonesia terima kasih kakak admin pos indonesia :) :) 1
2 pos indonesia bisa tolong cek barangnya sudah sampai mana nomor
resi dan pos indonesia barangnya belum sampai :(
:( -1
32 pos indonesia terima kasih pos indonesia, kirim motor dari lombok
datang tepat waktu good job thank you 1
34 pos indonesia terus biar dapat informasi yang update bagaimana om
-1
50 pos indonesia admin cek resi kirim tanggal sampai sekarang tanggal
belum sampai juga bekasi bali bagaimana -1
* * * * * *
61 pos indonesia selamat pagi saya mau tanya tentang kiriman saya
dengan nomor receipt apakah sudah sampai alamat tujuan 1
66 pos indonesia nomor telpon tidak bisa dihubungi T_T T_T -1
Tabel 10. Hasil Pengolahan Data Emoticon
No Sentimen Jml (Angka)
Jml (%)
Total Nilai Emo
1 Emo Positif 40 61% 40
2 Emo Negatif 26 39% -26
Total Opini Emo 66 100%
Tabel 10 merupakan hasil pengolahan data
twitter PT. Pos Indonesia terkait emoticon dari
opini pelanggan. Berdasarkan hasil pengolahan
data ini, ditemukan 66 Emoticon, dimana Emoticon
Positif sebanyak 40 dengan nilai sentimennya 40
dan Emoticon Negatif sebanyak 26 dengan nilai
sentimennya -26. Hasil ini menunjukkan bahwa
Emoticon Positif sebesar 61% dan Emoticon
Negatif sebesar 39%. Hasil tersebut
menggambarkan bahwa pelanggan yang beropini
positif lebih besar dari pelanggan yang beropini
negatif. Hasil opini pelanggan terkait pelayanan
PT. Pos Indonesia berdasarkan Emoticon
pelanggan dapat dilihat pada Gambar 9.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
12 Jurnal Nasional JMII 2017
Gambar 9. Emoticon dari Opini Pelanggan PT. POS
Indonesia
V. KESIMPULAN DAN SARAN
Dari hasil analisis dan pembahasan, dapat
disimpulkan bahwa hasil opini positif sebesar 31%,
opini negatif sebesar 58%, opini netral sebesar 10%
dan opini nihil sebesar 1%. Hal ini menunjukan
bahwa sentimen negatif lebih besar dari sentimen
positif. Hasil analisisnya lebih banyak opini negatif
karena lebih banyak keluhan pelanggan yang disebabkan oleh beberapa faktor, yaitu
keterlambatan pengiriman paket, paket yang
dibongkar, karyawan yang bersikap kurang sopan
dalam melayani pelanggan, website yang kadang-
kadang error membuat lambatnya pelayanan yang
diberikan sehingga membuat pelanggan harus
menunggu, pelanggan harus ke kantor pos untuk
mengambil paketnya, dan lain sebagainya.
Sebaliknya dari hasil analisis emoticon, opini
positif sebesar 61% dan opini negatif sebesar 39%.
Saran untuk penelitian selanjutnya adalah pada
proses tokenisasi, bisa ditambahkan dengan jenis token lainnya. Selain itu juga analisisnya bisa
dikombinasikan dengan metode pengukur analisis
sentimen yang lain, sehingga bisa dibandingkan
hasilnya, mana yang memberikan hasil yang lebih
baik.
REFERENSI
[1]. Liu, B. 2012. Sentiment Analysis and Opinion mining. Synthesis Lectures on
Human Language Technologies. Morgan &
Claypool Publishers.
[2]. Frangky. 2008. Analisis Sentimen pada Data
Tekstual menggunakan Dokumen Review
dalam Domain Film. Tugas Akhir, Fasilkom.
[3]. Firdaus, M. & Sari, N. 2017. Media
Konsumen. Diperoleh 27 Februari 2017, dari
https://mediakonsumen.com/2016/11/14/surat
-pembaca/kiriman-ems-luar-negeri-pos-
indonesia-sudah-satu-bulan-belum-sampai.
[4]. Pos Indonesia. 2016. Twitter Pos Indonesia.
Diperoleh 8 Desember 2016, dari
http://twitter.com/PosIndonesia.
[5]. Taboada, M., Brooke, J., Tofiloski, M., Voll,
K. & Stede, M. 2011. Lexicon-based methods
for sentiment analysis. Computational
Linguistics. Volume 37, No. 2, pp. 267–307,
MIT Press.
[6]. Saraswati, N. W. S. 2011. Text Mining
dengan Metode Naïve Bayes Classifier dan
Support Vector Machines untuk Sentiment
Analysis. Tesis. Program Studi Teknik Elektro, Program pasca Sarjana, Universitas
Udayana, Bali, Indonesia.
[7]. Akbar, A. S., Nurhayati, O. D. & Sediyono,
E. 2015. Analisis Sentimen Berbasis Ontologi
di Level Kalimat untuk Mengukur Persepsi
Produk. Magister Sistem Informasi,
Universitas Diponegoro, Semarang. Jurnal
Sistem Informasi Bisnis.
[8]. Iwan, A. 2009. Text Mining. Diperoleh 16
September 2016, dari http://lecturer.eepis-
its.edu/~iwanarif/kuliah/dm/6Text%20Mining
.pdf.
[9]. Liu, B. 2010. Sentiment Analysis and
Subjectivity. Handbook of Natural Language
Processing. N. Indurkhya and F.J. Damerau,
eds.
[10]. Pang, B. & Lee, L. 2008. Opinion Mining and
Sentiment Analysis. Foundations and Trends
in Information Retrieval 2, 1-2, 1–135.
[11]. Melville, P., Gryc, W. & Lawrence, D, R.
2011. Sentiment analysis of blogs by
combining lexical knowledge with text
classification. Proceedings of the 15th ACM SIGKDD international conference on
Knowledge discovery and data mining, pp.
1275–1284. ACM.
[12]. Kaji, N., Kitsuregawa, M. 2007. Building
lexicon for sentiment analysis from massive
collection of HTML documents. Proceedings
of the joint conference on empirical methods
in natural language processing and
computational natural language learning
(EMNLP-CoNLL), pp. 1075–1083.
Association for Computational Linguistics.
[13]. Nurfalah, A., Adiwijawa. & Suryani, A. A. 2017. Analisis Sentimen Berbahasa Indonesia
dengan Pendekatan Lexicon-Based pada
Media Sosial Twitter. Telkom University,
Bandung. Jurnal Masyarakat Informatika
Indonesia, Vol 2, No. 1, Januari-Maret,
Hal 1-8.
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
13 Jurnal Nasional JMII 2017
LAMPIRAN
JURNAL MASYARAKAT INFORMATIKA INDONESIA (JMII Vol 2/III/2017) JMII Vol 2, No. 3, Juli-September 2017 ISSN: 2541-5093
Jurnal Nasional JMII 2017