8

Click here to load reader

Breast Cancer data mining KDD

Embed Size (px)

Citation preview

Page 1: Breast Cancer data mining KDD

การวิเคราะหขอมูลผูปวยมะเร็งเตานมในขั้นตอนการวินิจฉัย

โดยB5304516 นายภูริเดช สุดสี

Sunday, December 9, 12

Page 2: Breast Cancer data mining KDD

ชื่อขอมูล : Wisconsin Diagnostic Breast Cancer (WDBC)

ผูสราง : Dr. William H. Wolberg , W. Nick Street,

Olvi L. Mangasarian

จำนวนตัวอยาง : 569 ตัวอยาง

จำนวน Attributes : 32 Attributes

Missing value : ไมมี

การกระจายของ diagnosis ในกลุมตัวอยาง :

357 benign , 212 malignant

ขอมูลของ Dataset

Sunday, December 9, 12

Page 3: Breast Cancer data mining KDD

3

ลำดับที่ 1 : ID number

ลำดับที่ 2 : ระดับความรุนแรง (M – “รุนแรงมาก” , B – “รุนแรงนอย”)

ลำดับที่ 3-32 : แบงขอมูลออกเปน 3 ชุด แตละชุดมี 10 คาขอมูล ดังนี้

a) รัศมี

b) ความแนน

c) ความยาวโดยรอบ

d) พื้นที่

e) ความเรียบ

f) การจัดกลุม

g) สวนเวา (สวนตางสวนเวาของรูปราง)

h) จุดสวนเวา

i) คาความสมมาตร

j) มิติเศษสวน (“การประมาณชวงขอบ” – 1)

(1) id (2) diagnosis (3) raius_m (4) texture_m (5) perimeter_m

(6) area_m (7) smoothness_m (8) compactness_m (9) concavity_m (10) concave_point_m

(11) symmetry_m (12) fractal_dimension_m (13) raius_se (14) texture_se (15) perimeter_se

(16) area_se (17) smoothness_se (18) compactness_se (19) concavity_se (20) concave_point_se

(21) symmetry_se, (22) fractal_dimension_se (23) raius_w (24) texture_w (25) perimeter_w

(26) area_w (27) smoothness_w (28) compactness_w (29) concavity_w (30) concave_point_w

(31) symmetry_w (32) fractal_dimension_w

Attributes

Sunday, December 9, 12

Page 4: Breast Cancer data mining KDD

Sunday, December 9, 12

Page 5: Breast Cancer data mining KDD

Dataset

Sunday, December 9, 12

Page 6: Breast Cancer data mining KDD

Sunday, December 9, 12

Page 7: Breast Cancer data mining KDD

Target goal เปนระดับ

ความรุนแรง (diagnosis)

Sunday, December 9, 12

Page 8: Breast Cancer data mining KDD

8

Decision Tree 94.56%

Rule Induction 93.15%

k-NN 83.65%

Naive Bayes 93.51%

Sunday, December 9, 12