17

R.M. NASRUL HALIM D., M.KOM

26111 22 text mining

Download PDF Report

Upload
universitas-bina-darma-palembang
View
77
Download
2

Embed Size (px)

Citation preview

Page 1: 26111 22 text mining

R.M. NASRUL HALIM D., M.KOM

Page 2: 26111 22 text mining

DEFINISI Menambang data berupa text/kata.

Sumber data didapatkan dari dokumen.

Proses ekstraksi pola berupa informasi danpengetahuan yang berguna dari sejumlah besarsumber data teks, seperti dokumen Word, PDF,kutipan teks, e-mail, dll.

Page 3: 26111 22 text mining

TUJUAN Tujuannya untuk mencari kata-kata yang dapat

mewakili apa yang ada di dalam dokumen, sehingga dapat dilakukan analisa hubungan antar dokumen

Page 4: 26111 22 text mining

KARAKTERISTIK Dokumen email merupakan dokumen yang tidak

memiliki struktur bahasa yang baku, karena didalamnya terkadang muncul istilah slank seperti ”r uthere?”, ”helllooo bosss, whatzzzzzzz up?”, dansebagainya.

Diperlukan beberapa tahap agar teks dapat diubahmenjadi lebih terstruktur.

Page 5: 26111 22 text mining

PROSES TEXT MINING

Page 6: 26111 22 text mining

TAHAPAN Tokenizing (Penandaan)

Filtering (Penyaringan)

Stemming (Asal Kata)

Tagging (Pelabelan)

Analyzing (Analisis)

Page 7: 26111 22 text mining

Tokenizing Proses memecah sekumpulan karakter dalam suatu

teks ke dalam satuan kata.

Bagaimana membedakan karakter-karakter tertentuyang dapat diperlakukan sebagai pemisah kata ataubukan.

Contoh: karakter whitespace, seperti enter, tabulasi,spasi dianggap sebagai pemisah kata.

Dalam memperlakukan karakter-karakter dalam tekssangat tergantung sekali pada kontek aplikasi yangdikembangkan.

Page 8: 26111 22 text mining

Tokenizing

Page 9: 26111 22 text mining

Filtering Tahap mengambil kata-kata penting dari hasil token.

Bisa menggunakan algoritma stop list (membuangkata yang kurang penting) atau word list (menyimpankata penting)

Page 10: 26111 22 text mining

Filtering

Page 11: 26111 22 text mining

Stemming Tahap mencari kata dasar dari tiap kata hasil filtering.

Page 12: 26111 22 text mining

Stemming

Page 13: 26111 22 text mining

Tagging Tahap mencari bentuk awal/dasar dari tiap kata

lampau atau kata hasil stemming.

Page 14: 26111 22 text mining

Tagging

Page 15: 26111 22 text mining

Analyzing Tahap penentuan seberapa jauh keterhubungan antar

kata-kata antar dokumen yang ada.

Term Frequency-Inversed Document Frequency (TF-TDF) merupakan algoritma yang paling sederhanayang biasanya digunakan untuk penentuan skor.

Page 16: 26111 22 text mining

Analyzing

Page 17: 26111 22 text mining

מצגת קיירוס מרים 26111

מצגת קיירוס מרים 26111

Internet

Introduction to Text Mining - en.cs.uni-paderborn.de · Introduction to Text Mining Part VIII: Text Mining using Classiﬁcation and Regression Henning Wachsmuth Text Mining VIII

Introduction to Text Mining - en.cs.uni-paderborn.de · Introduction to Text Mining Part VIII: Text Mining using Classiﬁcation and Regression Henning Wachsmuth Text Mining VIII

Documents

Introduction to Text Mining and SAS Text Minersupport.sas.com/publishing/pubcat/chaps/59410.pdf · Introduction to Text Mining and SAS Text Miner Tips for Text Mining 3 The Text Mining

Introduction to Text Mining and SAS Text Minersupport.sas.com/publishing/pubcat/chaps/59410.pdf · Introduction to Text Mining and SAS Text Miner Tips for Text Mining 3 The Text Mining

Documents

Data Mining 1 Mining...ถ้าไม่มีโครงสร้างจะเป็น text-mining, web-mining, image-mining

Data Mining 1 Mining...ถ้าไม่มีโครงสร้างจะเป็น text-mining, web-mining, image-mining

Documents

Historical Text Mining Historical Text Mining, and Historical Text Mining…ucrel.lancs.ac.uk/events/htm06/RobSandersonHTM06.pdf · · 2006-08-30Historical Text Mining Historical

Historical Text Mining Historical Text Mining, and Historical Text Mining…ucrel.lancs.ac.uk/events/htm06/RobSandersonHTM06.pdf · · 2006-08-30Historical Text Mining Historical

Documents

Documents

CSE 634 – Data Mining: Text Mining · Text Mining vs. • Data Mining – In Text Mining, patterns are extracted from natural language text rather than databases. • Web Mining

CSE 634 – Data Mining: Text Mining · Text Mining vs. • Data Mining – In Text Mining, patterns are extracted from natural language text rather than databases. • Web Mining

Documents

Mining Text Using Keyword Distributions - Hebrew …pluto.huji.ac.il/~rfeldman/papers/feldmanHirsh.pdfKeywords: data mining, text mining, text categorization, distribution comparison,

Mining Text Using Keyword Distributions - Hebrew …pluto.huji.ac.il/~rfeldman/papers/feldmanHirsh.pdfKeywords: data mining, text mining, text categorization, distribution comparison,

Documents

A Brief Survey of Text Mining · Text Mining = Text Data Mining. Text mining can be also deﬁned — similar to data mining — as the application of algorithms and methods from

A Brief Survey of Text Mining · Text Mining = Text Data Mining. Text mining can be also deﬁned — similar to data mining — as the application of algorithms and methods from

Documents

Technology

Chapter 5: Text and Web Mining. Learning Objectives Describe text mining and understand the need for text mining Differentiate between text mining, Web

Chapter 5: Text and Web Mining. Learning Objectives Describe text mining and understand the need for text mining Differentiate between text mining, Web

Documents

Text Mining with Oracle - Text Mining Summit

Text Mining with Oracle - Text Mining Summit

Documents

Introduction to Text Mining - uni-paderborn.de...Introduction to Text Mining Part VII: Text Mining using Clustering Henning Wachsmuth Text Mining VII Text Mining using Clustering ©Wachsmuth

Introduction to Text Mining - uni-paderborn.de...Introduction to Text Mining Part VII: Text Mining using Clustering Henning Wachsmuth Text Mining VII Text Mining using Clustering ©Wachsmuth

Documents

Text Mining Webinar - KNIME€¦ · Text Mining Webinar The Textprocessing Extension Rosaria Silipo and Kilian Thiel. KNIME Text Mining Webinar 2 Agenda ... Text Mining Workflow Create

Text Mining Webinar - KNIME€¦ · Text Mining Webinar The Textprocessing Extension Rosaria Silipo and Kilian Thiel. KNIME Text Mining Webinar 2 Agenda ... Text Mining Workflow Create

Documents

Text mining & Web mining

Text mining & Web mining

Documents

CS583 – Data Mining and Text Mining

CS583 – Data Mining and Text Mining

Documents

Text Mining for Clementine Improve Insights with Text Mining

Text Mining for Clementine Improve Insights with Text Mining

Documents

Introduction to Text Mining - uni-paderborn.de · Introduction to Text Mining Part VII: Text Mining using Similarities and Clustering Henning Wachsmuth Text Mining VII Text Mining

Introduction to Text Mining - uni-paderborn.de · Introduction to Text Mining Part VII: Text Mining using Similarities and Clustering Henning Wachsmuth Text Mining VII Text Mining

Documents

Rutgers Lib 26111 1

Rutgers Lib 26111 1

Documents

Text Mining Infrastructure in R - University of Idahostevel/517/Text Mining Infrastructure in R.pdf4 Text Mining Infrastructure in R an established text mining framework with architecture

Text Mining Infrastructure in R - University of Idahostevel/517/Text Mining Infrastructure in R.pdf4 Text Mining Infrastructure in R an established text mining framework with architecture

Documents

Text Mining - Data Mining

Text Mining - Data Mining

Lifestyle

Introduction to Text Mining - EDBT 2006 · Text Mining Text Mining (Def. Wikipedia) Text mining, also known as intelligent text analysis, text data mining or knowledge-discovery in

Introduction to Text Mining - EDBT 2006 · Text Mining Text Mining (Def. Wikipedia) Text mining, also known as intelligent text analysis, text data mining or knowledge-discovery in

Documents

Mining Unstructured Data (Text Data Mining) - Chapters Site IIA Nov5...Mining Unstructured Data (Text Data Mining) ... Text Mining tools and tips for beginning to use text ... free

Mining Unstructured Data (Text Data Mining) - Chapters Site IIA Nov5...Mining Unstructured Data (Text Data Mining) ... Text Mining tools and tips for beginning to use text ... free

Documents

Text Mining Text Classification Text ClusteringText Mining Text Classification Text Clustering 2004. 11

Text Mining Text Classification Text ClusteringText Mining Text Classification Text Clustering 2004. 11

Documents

Text mining and data mining

Text mining and data mining

Technology

Introduction to Text Mining · Introduction to Text Mining Part V: Text Mining using Grammars Henning Wachsmuth Text Mining V Text Mining using Grammars ©Wachsmuth 2018 1

Introduction to Text Mining · Introduction to Text Mining Part V: Text Mining using Grammars Henning Wachsmuth Text Mining V Text Mining using Grammars ©Wachsmuth 2018 1

Documents

Web Mining & Text Mining

Web Mining & Text Mining

Data & Analytics

Information Retrieval & Text Mining - Intranet DEIBhome.deib.polimi.it/.../DMTM/DMTM1112_TextMining.pdf · 2012-06-13 · Information Retrieval & Text Mining Data Mining and Text

Information Retrieval & Text Mining - Intranet DEIBhome.deib.polimi.it/.../DMTM/DMTM1112_TextMining.pdf · 2012-06-13 · Information Retrieval & Text Mining Data Mining and Text

Documents

Text Mining Medline - Oracle€¦ · Data MiningData mining Text Mining Spectrum Data Mining Chemical/sequence Data Model. Title: Text Mining Medline Author: user Created Date: 7/27/2004

Text Mining Medline - Oracle€¦ · Data MiningData mining Text Mining Spectrum Data Mining Chemical/sequence Data Model. Title: Text Mining Medline Author: user Created Date: 7/27/2004

Documents