28
Image Processing6: Image Understanding and Interpretation 1. กลาวนํา ในบทสุดทายนีจะไดกลาวถึงการระบุหรือจําแนกวัตถุในรูป (Object Identification หรือ Feature Extraction) อันเปนกระบวนการสุดทายของ กระบวนการทางการประมวลผลทางภาพ (Image Processing) หรือ เพื่อ บรรลุสูงสุดของ Image Processing ในการที่ทําใหเครื่องคอมพิวเตอร สําหรับเทคนิคการทํา Object Identification หรือ Feature Extraction สามารถจําแนกหรือแยกแยะวัตถุตางๆ ใน Digital Image เราอาจจะแยก การศึกษานี้จาก Image Processing เปนหลายแขนงมาเกี่ยวของ เชน Machine Vision หรือ Pattern Recognition โดยอาศัยคณิตศาสตรที่มี ความซับซอนมากขึ้น แตในที่นีเราแนะนําหลักการพื้นฐานที่สําคัญของ Image Understanding เชน Classification, Man-made Extraction ดังตอไปนี2. การจําแนกรายละเอียด (Classification) ในการสํารวจระยะไกล Classification คือ การจัดกลุมของวัตถุตางๆในภาพ หรืออาจหมายถึง การสรางแผนที่เฉพาะ เรื่อง (Thematic Map) จากภาพ ดาวเทียม โดยหลักการทางคณิตศาสตร รูปที1 Processing Procedure of Classification 2.1 ความรูพื้นฐานสําหรับการ Classification เพื่อใหสามารถเขาใจ Classification ไดดีขึ้น เรามีความจําเปนที่จะตอง ทราบความรูพื้นฐานทางคณิตศาสตรที่เกี่ยวของดังตอไปนีDiscrimination Function โดยความตามรูปแลว Discrimination Function หมายถึง ฟงกชั่นการแยก ความแตกตาง โดยสามารถประยุกตกับการจําแนกรายละเอียดของวัตถุชนิด ตางๆในภาพ อาจจะกลาวอยางๆ คือ การหาระยะที่มากที่สุดของคาเฉลี่ย 64

เอกสารภาษาไทย Image Processing 6

Embed Size (px)

DESCRIPTION

เอกสารภาษาไทย Image Processing 6know2pro.com

Citation preview

Page 1: เอกสารภาษาไทย Image Processing 6

Image Processing6: Image Understanding and Interpretation 1. กลาวนํา ในบทสุดทายนี้ จะไดกลาวถึงการระบุหรือจําแนกวัตถุในรูป (Object Identification หรือ Feature Extraction) อันเปนกระบวนการสุดทายของกระบวนการทางการประมวลผลทางภาพ (Image Processing) หรือ เพื่อบรรลุสูงสุดของ Image Processing ในการที่ทําใหเครื่องคอมพิวเตอร สําหรับเทคนิคการทํา Object Identification หรือ Feature Extractionสามารถจําแนกหรือแยกแยะวัตถุตางๆ ใน Digital Image เราอาจจะแยกการศึกษานี้จาก Image Processing เปนหลายแขนงมาเกี่ยวของ เชน Machine Vision หรือ Pattern Recognition โดยอาศัยคณิตศาสตรที่มีความซับซอนมากขึ้น แตในที่นี้ เราแนะนําหลักการพื้นฐานที่สําคัญของ Image Understanding เชน Classification, Man-made Extraction ดังตอไปนี้ 2. การจําแนกรายละเอียด (Classification) ในการสํารวจระยะไกล Classification คือ การจัดกลุมของวัตถุตางๆในภาพ หรืออาจหมายถึง การสรางแผนที่เฉพาะ เรื่อง (Thematic Map) จากภาพดาวเทียม โดยหลักการทางคณิตศาสตร

รูปที่ 1 Processing Procedure of Classification 2.1 ความรูพื้นฐานสําหรับการ Classification เพื่อใหสามารถเขาใจ Classification ไดดีขึ้น เรามีความจําเปนที่จะตองทราบความรูพื้นฐานทางคณิตศาสตรที่เกี่ยวของดังตอไปนี้ Discrimination Function โดยความตามรูปแลว Discrimination Function หมายถึง ฟงกชั่นการแยกความแตกตาง โดยสามารถประยุกตกับการจําแนกรายละเอียดของวัตถุชนิดตางๆในภาพ อาจจะกลาวอยางๆ คือ การหาระยะที่มากที่สุดของคาเฉลี่ย

64

Page 2: เอกสารภาษาไทย Image Processing 6

ของสองสิง่หรือมากกวา โดยทั่วไปเราเรียกตัวที่ใชแยกหรือจําแนกวา Discriminator หรือ Classifier ซึ่งสามารถอธิบายดวยสมการดังตอไปนี้

a 1 x 1 + a 2 x 2 + ... + a n x n > x 0 (1) a 1, a 2 , … ,a n เปน Variable ที่เกี่ยวกับ x 1, x 2, …, n เปนคา Observation และ x 0 คือ Vectorผลลัพธ ที่เรากําหนด หรืออาจจะนิยามอยางสั้นไดวา

(Ax > x 0 ) equiv B (2) โดยที่ Ax= a 1 x 1 + a 2 x 2 + ... + a n x n และ B= Class ที่ใชในการแยกวัตถุ

รูปที่ 2 การทํางานของ Discrimination Function จากรูปดังกลาวจะเห็นไดวา เราใชสมการเสนตรงในการแยกวัตถุ 2 ชนิดและบนหลักการเดียวกันจะนํามาในการจําแนกรายละเอียด (Classification) โดยทั่วไป Classification ที่นิยมในการสํารวจระยะไกล เราสามารถแบงไดเปน 2 ชนิดที่สําคัญคือ Supervised and Unsupervised Classification โดยจะอธิบายรายละเอียดดังตอไปนี้

65

Page 3: เอกสารภาษาไทย Image Processing 6

2.2 Supervised Classification Supervised Classification หมายถึง การจําแนกรายละเอียดใชการคํานวณเปรียบเทียบชั้นการกําหนดความรูเบื้องตนของวัตถุใดๆในภาพที่ไดเปนชั้นของวัตถุนี้โดยที่เราทราบนัยสําคัญของวัตถุนั้นในภาพ เรียกวา Training Data Set หรือ อาจจะกลาวอีกนัยหนึ่งคือ การใช Prior Decision สําหรับ Supervised Classification นัน้ที่นิยมใชในงาน Remote Sensing มอียูหลายชนิด เชน Table Look-up, Parallelepiped, Minimal Distance เปนตน แตในที่นี้ จะขอยกตัวอยาง Supervised Classification ที่นิยมใชกันอยางแพรหลายชนิดหนึ่งคือ Maximum likelihood Classification ซึ่งจะไดอธิบายในรายละเอียดดังตอไปนี้ Maximum likelihood Classification เปนวิธีหนึ่งที่นิยมใชใน Remote Sensing โดยที่ Pixel ที่มีจะถูกจัดเขา Class ตามที่กําหนดดวยความเหมือน (Maximum likelihood) ของ Pixel นั้นเมื่อเปรียบเทียบกับ Class นั้น โดยที่เราสามารถอธิบายดวยรูปที่ 3 และ สมการที่ 3 ดังตอไปนี้

รูปที่ 3 Maximal Likelihood Classification

66

Page 4: เอกสารภาษาไทย Image Processing 6

รูปที่ 3 Maximal Likelihood Classification (ตอ)

โดยทั่วไปเรานิยาม Maximal Likelihood ในรูปของ the probability density function ในกรณีของ normal distributions ดังตอไปนี้

( )⎭⎬⎫

⎩⎨⎧ −−

Π=

∑t

k

kn

x XXL μ21exp

)2(

1)( 2/1

(3)

โดยที่ n: number of bands X: image data of n bands Lk(X) : likelihood of X belonging to class k k : mean vector of class k k : variance-covariance matrix of class k

โดยที่ตัวอยางของการจําแนกรายละเอียดวัตถุตางๆในภาพถายดาวเทียม Aster ในชวงคลื่น visible (400-700μm) ดวยวิธี Maximum Likelihood Classification จะไดอธิบายกระบวนการทํางานและผลลัพธในรูปที่ 4, 5, 6และ 7 ตามลําดับ

67

Page 5: เอกสารภาษาไทย Image Processing 6

รูปที่ 4 Procedure of Maximum Likelihood Classification สําหรับการจําแนกรายละเอียดภาพดาวเทียม

รูปที่ 5 Original Image เปนถายดาวเทียม Aster

68

Page 6: เอกสารภาษาไทย Image Processing 6

รูปที่ 6 การเลือก Training Data Set

รูปที่ 7 ผลลัพธของการ Maximum likelihood Classification

69

Page 7: เอกสารภาษาไทย Image Processing 6

2.3 Unsupervised Classification Unsupervised Classification หมายถึง การจําแนกรายละเอียดดวยคุณสมบัติของคาPixel Value ภายในภาพ (Image) เองโดยไมอาศัยความรูของวัตถุ (Training Data Set) หรือการสะทอนของวัตถุ (Reflectance) หรือ อาจจะกลาวอีกนัยหนึ่งคือ การใช Posterior Decision ขอดีในของ Unsupervised Classification คือ การลดคาใชจายในการออกสํารวจในสนาม (Field Observation หรือ Ground Truth) แตอยาวไรก็ตาม Unsupervised Classificationก็มีขอเสียอยูบางประการ เชน การใชเวลาคอนขางในการ Processing หรือ การไมรับชนิดของวัตถุใดๆในภาพ สําหรับ Unsupervised Classificationมีหลายชนิดที่นิยมใชในงานทางการสํารวจระยะไกล (Remote Sensing) และงาน Digital Mapping เชน Non-clustering: ISODATA หรือ K-means, Hierarchical Clustering: Nearest neighbor, Furthest neighbor method, Centroid method เปนตน ในที่นี้จะขอยกตัวอยางของ Unsupervised Classification คือ ISODATA ที่จะไดแสดงรายละเอียดดังตอไปนี้ ISODATA (Iterative Self-Organization Data Analysis Technique) หรือ ในตําราบางเลมอาจนิยามเปน K- Mean ซึ่งมีความหมายตางกันเพียงเล็กนอย กลาวคือ K-Mean คือ การจัดกลุม (Cluster) ของ Pixels ในภาพเปนจํานวน K ชั้น ซึ่งก็เริ่มดวยการกําหนดศูนยกลางของ Cluster จํานวน K จากนั้นในขั้นที่สอง Pixels จะจัดรวมกับ Cluster ที่ใกลที่สุดดวยการใช Euclidean Distance แลวศูนยกลางของ Cluster จะถูกคํานวณใหม และทําการคํานวณขั้นที่สองซ้ําจนกระทั่งการเปลี่ยนแปลงนอยกวาขอจํากัด (Tolerance) สวน ISODATA จะไดขั้นตอนของการรวม (Merge) และการแยก (Split) ของ Cluster ดวย เพื่อใหเกิดความเขาใจกระบวนการทํางานของ ISODATA ใหชัอเจนมากขึ้น จะไดกระบวนการทํางานและผลลัพธของการจําแนกรายละเอียดแบบ ISODATA ในรูปที่ 8, 9 และ 10

70

Page 8: เอกสารภาษาไทย Image Processing 6

Selection of parameters

Calculation of the center of gravity of initial clusters

Relocation of members

Correct the center of Gravity of all clusters

Convergence

Removal of the minimum Cluster and of isolated members

The clustering is complete?

Merging Division Stop

Compute statistics of Clusters

Yes

No

Yes

No

Relocation Method

รูปที่ 8 Flowchart of ISODATA classification

71

Page 9: เอกสารภาษาไทย Image Processing 6

รูปที่ 9 Original Image

รูปที่ 10 Classified Image with ISODATA unsupervised classification โดยที่กําหนด 3 Classes และ 30 Iterations

3. Man-made Object Extraction นอกจากการจําแนกรายละเอียด(Classification) ของวัตถุชนิดตางๆในภาพดาวเทียม (Satellite Image) ที่ไดกลาวมาแลวยังมีอีกเร่ืองที่นาสนใจและเปนงานวิจัยอยางแพรหลายสําหรับการนําหลักการ Image Processing มาประยุกตก็คือ Man-made Object Extraction หรือ การระบุชนิดของวัตถุ

72

Page 10: เอกสารภาษาไทย Image Processing 6

หรือสิ่งที่มนุษยสรางขึ้นจากภาพ ในที่นี้จะขอยกตัวอยาง การระบุชนิดปายควบคุมการจราจรจากภาพถายบนพื้นดิน (Traffic Sign Recognition from Terrestrial Imagery) และ การคนหารถจากรูปถายทางอากาศ (Vehicle Detection from Aerial Image) ซึ่งจะไดแสดงรายละเอียดดังตอไปนี้ 3.1 Traffic Sign Recognition from Gray-Scale Image ตัวอยางที่จะไดอธิบายดังตอไปนี้ซึ่งเปน Man-made object Recognition ชนิดหนึ่งโดยนําหลักการพื้นฐานเรื่อง Template Matching และ Affine Transformation คือ การระบุชนิดปายสัญณาณจากภาพ (Traffic Sign Recognition from Gray-Scale Image) โดยที่กอนที่จะอธิบายในรายละเอียด จะไดอธิบายถึงหลักการพื้นฐานเรื่อง Template Matching ดังตอไปนี้ 3.1.1 Template Matching Template matching หมายถึง การตรวจสอบชนิดของวัตถุที่เราทราบ (Template) ในภาพ (Master) เราสามารถอธิบายดวยสมการดังตอไปนี้

(4)

โดยที่ g1 (r,c) = Master, g2 (r,c) =Template , p = Correlation Coefficient หรือ CC และ (r,c) = ตําแหนงของ Pixel ใน Image

รูปที่ 11 Parabolic curve of Coefficient Correlation

73

Page 11: เอกสารภาษาไทย Image Processing 6

จากสมการดังกลาวสามารถวัดความเหมือนวัตถุที่เราทราบในภาพดวยคา Correlation Coefficient สูงสุดดังที่จะแสดงใหเห็นในรูปที่ ซึ่งโดยปกติการทํางานของการคํานวณหา Correlation Coefficient ของ Template Matching ที่สมบูรณจะมีรูป parabolic หรือระฆังคว่ํา แตสําหรับในการศึกษานี้ขนาดของ Master และ Template เทากัน ดังนั้น Template ในการศึกษานี้จะไมวิ่งคนหาแตจะคํานวณหา Correlation Coefficient ระหวาง Master กับ Template ทุกตัว แลวหาคาสูดสุด โดยจะไดแสดงในรายละเอียดในลําดับตอไป 3.1.2 วิธีการของการระบุชนิดปายสัญณาณจากภาพ (Methodology for Traffic Sign Recognition from Gray-Scale Image)

รูปที่ 12 Systematic diagram of Road Sign Recognition การทํางานของระบบ Road Sign Recognition เริ่มดวยในขั้นตอนแรก จะไดทําการแยกปายสัญณาณจราจร (Extraction) จาก Original Image ดวยมือ แตผลลัพธของปายฯดังกลาวที่ไดมีความบิดเบี้ยนจากการฉายของกลอง (Camera Perspective Projection) แลงจึงใช Affine Transformation เพื่อทําการปรับแกความบิดเบี้ยนของปายดังกลาวและมีขนาดเทากับ Template ของปายสัญณาณจราจรในฐานขอมลู จากนั้นในขั้นตอนตอมาใช Template Matching เพื่อการคํานวณหา Coefficient Correlation จาก 4.2.1 โดยเปรียบเทียบ Template of signs ทั้งหมดในฐานขอมูลและคํานวณหาคา Coefficient Correlation ที่เกิดจากการคํานวณเปรียบเทียบระหวางปายกับ Template แตละตัวในฐานขอมูล จากนั้นคนหาคา Coefficient Correlation สูงสุด ซึ่งแสดงวาปาย จาก Original Image มีความคลายหรือเหมือน Template ตัวนั้นในฐานขอมูล

74

Page 12: เอกสารภาษาไทย Image Processing 6

มากที่สุด และ ในทายสุด Template จะแสดงเปนผลลัพธ โดยที่กระบวนทั้งหมดและตังอยางของผลลัพธแสดงในรูปที 13, 14 และ 15 ตามลําดับ

Road Sign Library

Recognition Procedure

The image that is pre- processed will be matched by using the images in the road sign library and measure the time in recognition

Image Matching

algorithm

Template Matching

Techniques

Road Sign Library

Recognition Procedure

The image that is pre- processed will be matched by using the images in the road sign library and measure the time in recognition

Image Matching

algorithm

Template Matching

Techniques

รูปที่ 13 Template matching ในการทํา Road Sign Recognition

Result of traffic sign

From database of template

Extracted SignFrom

Original Image

Geo-CorrectedSign byAffine

Transformation

Original Image

รูปที่ 14 ผลลัพธของ Road Sign Recognition

75

Page 13: เอกสารภาษาไทย Image Processing 6

The Sign No.2 Recognition Result

0

0.001

0.002

0.003

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

The Number of Sign in Sing Library

The Normalized Euclidean Distance

รูปที่ 15 Sign Recognition Result

3.2 Vehicle Detection from Three Line Scanner Imagery สําหรับอีกอยางของ การทํา Man-made Object Extraction ซึ่งมีความซับซอนกวาตัวอยางแรกโดย การนําหลักการ Image processing ในหลายเรื่องต้ังแตพื้นฐาน เชน Image Enhancement, Image Restore จนความรูขั้นสูง เชน Model-based Detection และ Recognition เปนตน โดยที่กระบวนดังกลาวเปนการบูรณาการ (Integration) หลายเทิคนิคของ Image processing เขาดวยกันโดยประยุกตกับภาพชนิดใหมที่ออกสูตลาดเมื่อไมนานมานี้ที เราเรียกวา Three Line Scanner 3.2.1 ความรูเกี่ยวกับ Three Line Scanner (TLS) เมื่อไมนานมานี้ (ชวงค.ศ. 1999) บริษัท Starlabo จํากัดแหงประเทศญี่ปุน มีการพัฒนาสราง Sensor ในการถายรูปทางอากาศชนิดใหม เรียกวา Three Line Scanner หรือ TLS โดยที Sensor ชนิดนี้สามารถบันทึก (Imaging) ดวยกลอง CCD จํานวน 3 ตัวในเวลาเดียวกัน นอกจากนี้แลวยังสามารถเก็บคาพิกัดและการเอียงของจุดเปดถายในขณะที่บันทึกดวย GPS และ INS ที่ไดรับการปรับแกจากหองทดลอง (Calibration) ตามลําดับ (ดูรูปที่ 16)

76

Page 14: เอกสารภาษาไทย Image Processing 6

รูปที่ 16 ระบบการทํางานของ Three Line Scanner จากคุณลักษณะ Three Line Scanner ที่ไดอธิบายมาแลว เราสามารถแบงคุณประโยชนโดยพิจารณาจากอุปกรณตางๆที่ติดอยูบน Sensor ดังตอไปนี้ 1. Multi-line CCD camera สามารถผลิตรูปถายที่ความละเอียดสูงยิ่ง (Ultra-High Resolution) ในระดับ 3-5 เซนติมิเตอร (few centimeters) และสามารถสรางความสัมพันธทาง 3 มิติจากสวนที่ซอนทับจากรูปทิศทางตาง ๆ (Multi-directional Images) และดวยรูปทิศทางตาง ๆ จะสามารถเก็บรายละเอียดไดมากกวา Sensor ทีเปนการบันทึกเปนทิศทางเดียว นอกจากนีจ้ากภาพสี เราสามารถใชประโยชนจากเนื้อของภาพ (Texture) อีกดวย เชน การ Visualization เปนตน 2. Global Positioning Systems (GPS) ใหคาพิกัด (Coordination) ของจุดเปดถาย (Shutter) ซึ่งสามารถคํานาณหาคาพิกัดบนภูมิ-ประเทศที่ปรากฎอยูบนจุดภาพ (Pixel) ของภาพโดยใชคาพารามิเตอรที่ไดจากการ Calibration หาความสัมพันธเชิงที่ต้ังระหวาง INS, GPS และ จุดเปดถาย (Shutter) จากหองทดลอง 3. Inertia Navigation Systems (INS) ใน Stabilizer นอกจากจะรักษาสมดุลยของกลองในขณะที่ทําการบันทึกภาพ แลวยังสามารถชี้การหมุน (Rotation) ของจุดเปดถาย (Shutter) ซึ่งคาการหมุน (Rotation) จะไดชวยความถูกตองทางตําแหนงดีขึ้น

77

Page 15: เอกสารภาษาไทย Image Processing 6

4. การบันทึกภาพจาก Sensor ที่ติดต้ังบน Helicopter ทําใหสามารถทําการบินบันทึกถายรูปดวยความเร็วและความสูงบินที่ตํ่ากวาเครื่องบิน ซึ่งที่กอใหเกิดประโยชน และสามารถผลิตภาพที่มีลักษณะ Seamless ประโยชนตางที่ไดอธิบายมาแลวในขั้นตน สามารถสรุปและแสดงในรูปที่ 17

รูปที่ 17 ประโยชนของ Three line scanner Image จากอุปกรณตางๆของ

Sensor

จากประโยชนดังกลาวจะเกิดคําถามวา ทําไมภาพชนิดนี้จึงเหมาะสมกับการคนหารถ ดังนั้นจะขออธิบายถึงความเหมาะสมดังกลาวโดยพิจารณาจากคุณสมบัติตางๆ ของ TLS ดังตอไปนี้ 1. เมื่อพิจารณาวา ภาพ TLS สามารถใหความละเอียดของภาพสูงยิ่ง (Ultra-High Resolution) ในระดับ 3-5 เซนติมิเตอร ดังนั้นดังจึงเหมาะกับการคนหาและระบุรถยนตจากภาพดังกลาว เพราะวา ภาพ TLS สามารถใหรายละเอียดหรือขอมูล (Information) ที่มีเพียงพอที่จะสามารถประยุกตรูปจําลองทางคณิตศาสตรของการคนหารถได เนื่องสามารถอธิบายขนาดหรีอรายละเอียดของรถ เชน กระจกหนา ได ในขณะที่ภาพถายทางอากาศชนิดอื่นไมสามารถใหรายละเอียดดังกลาวได 2. เมื่อพิจารณาวา ภาพ TLS ทีมีลักษณะภาพ Seamless หมายถึง ภาพที่ถายตามยาวและตอเนื่อง ทําใหสามารถคนหาวัตถุบนวัตถุที่มีปนเสนตรง

78

Page 16: เอกสารภาษาไทย Image Processing 6

เปนระยะทางยาว (Linear Ground Object) เชน ถนนหรือแนวคลองชลประทาน เปนตน

รูปที่ 18 Ultra-high Resolution และ Seamless Image

3. เมื่อพิจารณา ภาพTLSนั้นเปนภาพที่มีสวนซอนทับจากการถายตางมุมในเวลาเดียวกัน เราทําการรังวัดความสูงของวัตถุที่อยูนิ่ง (Static Object) เชน รถหยุด (Stopping Vehicle) โดยเทคนิคการสราง 3 มิติจากภาพคูซอน (Stereoscopic Measurement)

ZZZZZZ

รูปที่ 19 การสราง 3 มิติจากภาพคูซอน (Stereoscopic Measurement

เพื่อการคนหารถหยุด 4. ถาเราใชการรังวัดหรือสํารวจซ้ํา (Repeated Observation) บนพื้นที่เดียวกันจากภาพถายตางมุม (Multi-line images) ทําใหเราสามารถคนหา

79

Page 17: เอกสารภาษาไทย Image Processing 6

วัตถุที่มีการเคลื่อนที่ (Dynamics Objects) เชน รถที่กําลังเคลื่อนที่ (Moving Objects) ในขณะที่เราทําการบันทึกภาพ

รูปที่ 20 การรังวัดซํ้า (Repeated Observation) จากรูปตางมุมจากชุด

เดียวกันของภาพ TLS จากประโยชนดังกลาวเราสามารถนําภาพ TLS มาใชคนหาและแยกประเภทของรถในบางลักษณะดังที่จะไดแสดงรายละเอียดตอไป รูปที่ 21 Systematic diagram of Vehicle monitoring by using Three

Line Scanner 3.2.2 สมมุติฐานของรถ

80

Page 18: เอกสารภาษาไทย Image Processing 6

สําหรับรถในการศึกษานี้ เราไดต้ังสมมุติฐานของรถชนิดตางๆดังตอไปนี้ 1. รถในการศึกษาของเราคือ รถที่อยูบนถนน และ ทิศทางของรถขนานกับถนน 2. รถหยุดคือรถที่ปรากฏอยูในรูปทั้ง 3 ทิศทาง: ทิศหนา, ทิศทางดิ่งตรง และ ทิศทางหลังในภาพชุดเดียวกัน ในขณะที่รถที่มีการเคลื่อนที่จะปรากฏเพียงรูปใดรูปหนึ่งของภาพชุดเดียวกัน 3. รถหยุดจะประกอบดวยรถที่จอดเปนเวลานานและรถที่หยุดชั่งคราวเพื่อธุระหรือหยุดเพื่อรอสัญณาณไฟเขียว 3.2.3 หลักการทํางานของระบบการคนหารถยนตจากภาพ TLS จะไดประกอบ 5 ขั้นตอนที่จะไดแสดงใหรายละเอียดดังตอไปนี้

รูปที่ 22 Flowchart of Pre-Processing 1. Preprocessing เปนขั้นของการเตรียมขอมูลดังตอไปนี้ การกําหนดพื้นที่สนใจ (Region of Interest (ROI)) ในที่นี้ เรากําหนด ROI คือ ถนนอันเปนที่ต้ังของรถยนตตางๆ ดังนั้น เพื่อจะลดเวลาของการประมวลลง เราไดทําการปด (Masking) พื้นที่นอก ROI ซึ่งสามารถทําโดยวิธีมือหรือวิธี Semi-Automatic Masking ที่กําลังทําการพัฒนาอยู จากกระบวนการนี้ ทําใหเราสามารถทราบถึงพื้นที่ของถนนและทิศทางของถนนในภาพ TLS ที่เปนฐานในการคํานวณ

81

Page 19: เอกสารภาษาไทย Image Processing 6

Road DirectionRoad Boundary

รูปที่ 23 พื้นที่ของถนนและทิศทางของถนนในภาพ หลังจากหลังแลวเราจะไดภาพที่มีเพียงถนน หรือ ROI จากขั้นตอนที่แลว เราจะไดนําภาพที่มีเพียงถนน หรือ ROI มาทําการ Segment โดยวิธีการ Region growing ทําใหเกิด Region ใน ROI ญซ่ึงจะประกอบดวย Regionของรถ, Regionของพื้นผิวถนน ตลองจน Region ของเครื่องหมายตางๆบนพื้นผิว

Raw TLS image

Undersegmentation

Noise

Segmented

imageRegion Growing

Segmentation Noise and

Under-segmented

image

Erosion OperationNearest Interpolation

Cleaned Image

รูปที่ 24 การทํา Segmentation ดวยวิธี Region Growing ในขั้นตอไปคือการรัดรูป Polygon สีเหลี่ยมบลอมรอบ Region ตางๆ หรือ Rectangular Polygon Fitting ใน ROI สําหรับ Polygon Fitting นี้พัฒนา

82

Page 20: เอกสารภาษาไทย Image Processing 6

จากการนําหลักการดพื้นฐานตางๆของ Image Processing มารวมกัน (Integration) เชน Radon Transformation, Scanning เปนตน ในที่สุดเราสามารถวัดพารามิเตอรหลายตัว เชน ความกวาง, ความยาว หรือ การหมุนของ Region ตางๆ

รูปที่ 25 การทํา Rectangular Polygon Fitting เมื่อใชพารามิเตอรเหลานั้นเปรียบเทียบกับขนาดรถยนตจากฐานขอมูลจากInternet ดังนั้น เราจึงสามารถแยก Region ที่ไมใชรถและมีขนาดใหญกวาขนาดรถยนตจากฐานขอมูล ซึ่งเปนขั้นสุดทายของ Pre-processing โดยจะไดผลลัพธดังตอไปนี้คือ Region ตางๆที่คาดวาจะรถและสวนประกอบของมันและเครื่องหมายบนผิวถนน

83

Page 21: เอกสารภาษาไทย Image Processing 6

รูปที่ 26 ผลลัพธของการ Mask บนพื้นที่ไมใชรถ

2. Discrimination of Stopping/Moving Vehicles ผลลัพธจาก Pre-Processing จะประกอบไปดวย Regionที่เปนประกอบของรถเคลื่อนและรถหยุดตลอดจน Region ที่เปนสวนของเครื่องหมายบนถนนตางๆ ดังนั้นในกระบวนการนี้ เราจะทําแยก Region ดังกลาวออกเปน 2 ชนิด คือ Regionทีเปนสวนประกอบของรถหยุดเปนชนิดแรก และ ชนิดหลังคือ Regionทีเปนสวนประกอบของรถเคลื่อนที่และเครื่องหมายบนผิวถนน โดยที่เราไดต้ังสมมุติฐานดังตอไปนี้ “ความสูงของรถหยุดสามารถคํานวณไดจาก Stereo Matching จากภาพ TLS ที่ตางมุม ในขณะที่เราไมสามารถคํานวณหาความสูงของรถที่เคลื่อนที่ได”

รูปที่ 27 เงื่อนไขในการแยกรถเคลื่อนที่และรถหยุด

ดังนั้น เราจึงนําหลักการของ Stereo matching มาประยุกตในการคํานวณหาความสูงของ Region ตางๆบนพื้นผิวถนน นอกจากเราสามารถหาความสูงไดแลวยังสามารถระบุดีกรีความเหมือนกันของวัตถุที่เราทําการเปรียบเทียบความเหมือนของวตัถุที่ทําการจับคู (Matching) เราเรียกวา Correction coefficient หรือ สัมประสิทธิ์ความสัมพันธรวมที่มีคาระหวาง 0 ถึง 1 ซึ่งมีหลักการทํางานเหมือน Template matching ที่ไดอธิบายใน

84

Page 22: เอกสารภาษาไทย Image Processing 6

รูปที่ 28 Stereo Matching for Height Calculation เพื่อทําการแยก Region ตางๆที่เปนประกอบของรถเคลื่อนและรถหยุด เราสามารถทําไดกําหนดคา Thresholding และใชคาดังกลาวในการแยก สําหรับ Thresholding นี้จะประกอบดวยความสูงของรถที่จะตองสูงกวาพื้นถนนและ สัมประสิทธิ์ความสัมพันธรวม (Correction coefficient หรือ CC) ซึ่งโดยทั่วไป CCของวัตถุที่นิ่ง (Static Object) เชน รถหยุด จะมีคาเขาใกล 1 มาก (รูปที่ 29)

Vehicle-Likely Regions Stopping Vehicle-Likely Regions Moving Vehicle-Likely Regions

รูปที่ 29 ผลลัพธของการแยก Region ที่เปนรถหยุดและรถเคลื่อนที่ออก

จากกัน

85

Page 23: เอกสารภาษาไทย Image Processing 6

3. Refinement of Stopping Vehicle ในขั้นตอนนี้ เปนขั้นตอนในการรวม Regionที่เปนประกอบมาเปนตัวรถ (Refinement of Stopping Vehicle) สําหรับในขั้นแรก เราจะไดนํา Regionที่ดังกลาวที่อยูติดกันมาเชื่อมติดกันโดยใชการทํา Clustering ชนิด Nearest Neighborhood ทําใหเกิด Stopping Vehicle Candidate และในขั้นตอมา Stopping Vehicle Candidate จะทําถูกทดสอบตามคุณสมบัติของรถตามรูปจําลองทางคณิตศาสตรของรถ (Vehicle model) เฉพาะ Stopping Vehicle Candidate ที่สอดคลองกับรูปจําลองนัน้ จะถูกนิยามเปนรถหยุด

Stopping Vehicle-Likely Regions Stopping Vehicle Candidate

รูปที่ 30 การ Clustering ชนิด Nearest Neighborhood เพื่อสราง

Stopping Vehicle Candidate

86

Page 24: เอกสารภาษาไทย Image Processing 6

Detected Stopping Vehicle ( As Stopping Vehicle Candidate Agrees with stopping vehicle model)

Non Stopping Vehicle (As Stopping Vehicle Candidate does not Agree with stopping vehicle model)

รูปที่ 31 ผลลัพธของรถหยุดในกระบวนการ Refinement of Stopping Vehicle

4. Discrimination of Parking/Signal-Waiting Vehicles ดวยการใชผลลัพธของรถหยุด ในขั้นนี้เราสามารถแยกประเภทของรถหยุดเปน 2 ประเภทคือ รถที่จอดเปนเวลาและรถที่หยุดเพื่อรอ โดยที่ไดใชเงื่อน-ไขที่ไดรับการพัฒนาจากขอมูลที่เราจากการสังเกตุพฤติกรรมของการจอดรถ ณ. ที่ชองจอดรถบนถนนและ การจอดเพื่อรอสัญณาณไฟเขียว ซึ่งเราพบวา “จากการสังเกตุบนถนนสายหลักในกรุงโตเกียว ประเทศญี่ปุน การจอดรถเปนเวลานานในที่จอดรถ ผูขับรถนั้นจะจอดรถชิดขอบถนน ในขณะที่การจอดรถที่รอสัญณาณไฟเขียว” ดังนั้นถาเรากําหนดระยะคงที่เปนคาคาหนึ่งเพ่ือใชในการแยกชนิดของรถหยุด โดยถาเราทําการวัดระยะที่ต้ังฉากจากขอบถนนไปยังpolygonของรถหยุดใดๆ แลวเปรียบเทียบระยะที่ต้ัง-ฉากกับระยะคงที่ ในกรณีที่ระยะที่ต้ังฉากมีนอยกวาหรือเทากับระยะคงที่ เราสามารถนิยามรถหยุดคันดังกลาวเปนรถที่จอดเปนระยะเวลานานในภาพ TLS ชุดกลาว นอกจากนั้นแลวเราจะใหรถหยุดที่มีระยะตั้งฉากที่มีคามากกวาระยะคงที่ เราจะจัดรถหยุดคันดังกลาวอยูในชั้นรถที่หยุดเพื่อรอสัญณาณไฟเขียว โดยที่เงื่อนไขและตัวอยางของการแยกประเภทของรถหยุดจะไดอธิบายในรูปที่ 32 และ 33 ตามลําดับ

87

Page 25: เอกสารภาษาไทย Image Processing 6

Stopped Vehicle is parked vehicleif Dr <= Dt

.

Dt =30 pixel P1

Stop

ped

Veh

icle

Poly

gon

P2Dr

รูปที่ 32 เงือนไขของการแยกประเภทของรถหยุด

Idling Vehicle Parked Vehicle

รูปที่ 33 ผลลัพธ Parked and Idling Vehicle Detection ตามลําดับ

88

Page 26: เอกสารภาษาไทย Image Processing 6

5. Refinement of Moving Vehicle สําหรับกระบวนสุดทายในงานวิจัยนี้ก็คือ การสรางตัวรถที่เคลื่อนที่จาก Region ที่คาดวาจะเปนสวนประกอบของรถที่เคลื่อนที่ในชุดภาพ TLS ใดๆ สําหรับการทํางานของกระบวนนี้จะเริ่มจาก ในแรกตอนแรก การนํา Regionที่คาดวาจะเปนชิ้นประกอบของรถที่เคลื่อนแตอยางก็ตาม Region ดังกลาวยังประกอบดวย Regionที่เปนสวนเล็กๆของเครื่องหมายบนผิวถนน ซึ่งเราสามารถทําการแยก Regionที่เปนสวนเล็กๆของเครื่องหมายบนผิวถนน ไดโดยการใช Thresholding ซึ่งพัฒนาจากคาความสูงและCorrection coefficient (CC) หรือ สัมประสิทธิ์ความสัมพันธรวมโดยปกติ Regionดังกลาวจะมีการความสูงที่ตํ่ากวารถแตให CC สูงเนื่องจากเครื่องหมายตางๆบนผิวถนน เปนวัตถุนิ่ง (Static Object) เมื่อเราแยก Region ที่เปนเครื่องหมายตางๆบนผิวถนนออกแลว Regionที่เหลือเพียงเปนชิ้นประกอบของรถที่เคลื่อน เราจะใช Region เหลานี้เปน Seeding Point หรือ จุดกําหนดในการสรางหรือการประกอบตัวรถที่เคลื่อนที สําหรับในขั้นตอนที่สอง เราเรียกวา Expansion โดยเริ่มจากใช Seeding Point ขยายและรวมกับ Regionของรถเคลื่อนที่อยูติดกับ Seeding Point นั้นโดยใชเงื่อนไขของการขยายและรวมนั้นจะตองไปตามทิศทางของถนน เมื่อ Seeding Point และ Region รวมกันแลวจะเรียกวา Moving Vehicle Candidate ในตอนสุดทาย Moving Vehicle Candidate จะถูกทดสอบกับ Moving Vehicle Model ถา Moving Vehicle Candidate ยอบรับกับ Moving Vehicle Model เราก็นิยาม Moving Vehicle Candidate เปนรถที่เคลื่อนที่ และทําการขยาย Seeding point จาก Region ที่เหลือจน Region ไมเหลือ โดยที่กระบวนการ Refinement of Moving Vehicle และผลลัพธจะแสดงในรูปที 34 และ 35 ตามลําดับ

รูปที่ 34 กระบวนการของการ Refinement of Moving vehicle detection

89

Page 27: เอกสารภาษาไทย Image Processing 6

รูปที่ 35 ผลลัพธ Moving Vehicle Detection ตามลําดับ สรุป จากที่ไดแนะนําความรูพื้นฐานของ Image processing ทั้งหมด ผูแตงหวังวา ผูอานจะไดนําไปเปนแนวทางในการนําไปประยุกตใชวิชาการประมวลผลทางภาพ Image processing ในงานตางๆในสาขาวิชาชีพของทานผูอานอันจะกอใหเกิดประโยชนไมมากก็นอยในโอกาศตอไป อางอิง Definition of Image Classification http://aria.arizona.edu/courses/tutorials/class/html/classwhyp1.html Discrimination Function http://www.biorecipes.com/Classific/code.html Unsupervised Classification http://deathstar.rutgers.edu/courses/remsens/rem_cpe_1/remsensing6/sld015.htm Desheng Liu, Lecture 8:Image Classification, PubHlth 274: GIS and Remote Sensing in Public Health, Dept. of Environmental Science, Policy & Management, University of California, Berkeley, March 1, 2005 Sompoch Puntavungour, Assignment3: Maximum Likelihood Classification, Remote Sensing Course, Department of Civil Engineering, The University of Tokyo, 2002

90

Page 28: เอกสารภาษาไทย Image Processing 6

Sompoch Puntavungkour, Master Thesis: Asian Institute of Technology, August 2000 Sompoch Puntavungkour, Doctoral Dissertation: The University of Tokyo, September 2004 Shuji Murai, Unsupervised Classification: Lecture note on Remote Sensing, CD-ROM, 1999

91