การแยกภาพออกเป็นส่วน (Image Segmentation)
การแยกภาพออกเป็นส่วน (Image Segmentation) การแยกภาพออกเป็นส่วน ๆ จะทำให้สามารถแยกภาพส่วนที่ต้องการออกจากส่วนอื่น ๆ วิธีการพื้นฐานสำหรับการแยกภาพออกเป็นส่วน ๆ คือ การพิจารณา Image Amplitude (ได้แก่การพิจารณาความสว่างของภาพสำหรับภาพแบบ Gray Scale และความแตกต่างของสีสำหรับภาพสี) นอกจากนี้ขอบของภาพและลักษณะของ Texture ก็เป็นองค์ประกอบหนึ่งที่จะทำให้สามารถทำการแบ่งแยกภาพได้สะดวกยิ่งขึ้น โดยทั่วไปการแยกภาพออกเป็นส่วน ๆ แบ่งออกเป็น 3 กลุ่ม คือ
– Amplitude Segmentation Method เป็นวิธีการแยกองค์ประกอบของภาพโดยดูจากความเหมือนกันของคุณสมบัติของพิกเซลภายในพื้นที่เพียงอย่างเดียวเช่นวิธีการ Intensity Thresholding เป็นการแยกแยะวัตถุจากฉากหลังโดยดูจาก Intensity ของพิกเซลเป็นหลัก ข้อดีของวิธีการนี้คือมีขั้นตอนในการทำงานที่ง่ายไม่ซับซ้อนทำงานได้รวดเร็ว แต่ข้อเสียคือไม่สามารถใช้กับภาพที่มีสัญญาณรบกวนมากหรือภาพที่มีความสว่างไม่สม่ำเสมอกัน
– Region Segmentation Method เป็นวิธีการแยกองค์ประกอบของภาพ โดยดูจากตำแหน่งของพิกเซลและความเหมือนกันของคุณสมบัติของพิกเซลภายในพื้นที่เป็นหลัก โดยถ้าพิกเซลที่อยู่ติดกันและมีคุณสมบัติเหมือนกันจะถูกจัดให้เข้ากลุ่มเดียวกัน ข้อดีของการทำเช่นนี้จะได้พื้นที่ต่อเนื่องกัน ปัญหาอุปสรรคของวิธีการนี้คือการกำหนดกฎเกณฑ์ที่เหมาะสมที่ใช้ตรวจสอบว่าพิกเซลนั้นที่มีคุณสมบัติเหมือนกันเพื่อใช้ในการรวมกลุ่มเข้าด้วยกันทำได้ยาก วิธีการเหล่านี้อาศัยอัลกอริทึมและโครงสร้างข้อมูลที่ซับซ้อนการประมวลผลใช้เวลานาน
– Edge Segmentation Method เป็นวิธีการแยกองค์ประกอบของภาพโดยอาศัยความไม่ต่อเนื่องของคุณสมบัติของพิกเซลที่บริเวณขอบของวัตถุ ดังนั้น วิธีการนี้จึงมุ่งที่จะตรวจหาขอบของวัตถุเป็นข้อดีของวิธีการนี้คือ มีความรวดเร็วในการประมวลผลเพราะวิธีการนี้ใช้เฉพาะข้อมูลบริเวณขอบของวัตถุเท่านั้น ส่วนข้อเสียของวิธีการนี้คือผลลัพธ์ที่ได้จะอยู่ในรูปของ “ขอบ” ของวัตถุซึ่งอาจจะต้องผ่านกระบวนการอื่นอีกต่อหนึ่ง จึงจะสามารถใช้งานได้ นอกจานี้ขอบของวัตถุที่ได้อาจไม่ต่อเนื่องถ้าวัตถุมีสีที่ไม่สม่ำเสมอ
Haar-like feature
การแยกภาพออกเป็นส่วน (Image Segmentation) การหาคุณลักษณะของใบหน้า (Feature) ในภาพจะใช้ตัวกรอง (Filter) ตาม ลักษณะพื้นฐานของ Haar wavelet จึงเรียกว่า Haar-like feature และ ตัวกรองจะมีลักษณะเป็นสี่เหลี่ยม และแบ่งเป็น 2 ส่วนคือสีขาวและสีดำ ในการทำงาน ภาพจะถูกกรอง ด้วยตัวกรอง ที่มีขนาดต่าง ๆ กันและรูปร่างของใบหน้าที่ได้จากตัว กรองนี้จะนำไปใช้ในการกำหนดลักษณะของตัวจำแนกอย่างอ่อน (Weak classifier) ดังในสมการที่ (11) และ (12) ต่อไป
ขั้นตอนวิธีการเรียนรู้แบบ AdaBoost (Ada-Boost algorithm) เป็นขั้นตอนวิธีการเรียนรู้เพื่อค้นหาค้าของกลุ่ม พิกเซลที่มีลักษณะใกล้เคียงกับภาพนำเข้า โดยที่ภาพ positive คือ ภาพตัวอย่างวัตถุที่ต้องการตรวจจับส่วนภาพ negative คือ ภาพทั่วๆ ไปที่ไม่ใช่วัตถุที่ต้องการตรวจจับ ซึ่งการจำแนกกลลุ่มของพิกเซล จะทำ ภายในส่วนย่อย (sub window) ของภาพ โดยใช้ตัวจำแนกอย่างอ่อนของ feature ที่ hj (x) ที่หาได้จากสมการที่ 11
เมื่อ f(x) คือค่าความแตกต่างของผลรวมพิกเซลในพื้นที่ขาว และดําของ Haar-like feature มีค่าตามสมการที่ 12
โดยที่ x คือภาพตัวอย่าง และ sum คือผลรวมของ ภาพอินิกรัล ในบริเวณพื้นที่สีขาวและดำ ของ x Ada Boost learning algorithm เป็นวิธีหาค่าตัวจำแนกอย่างอ่อน ที่มี ความผิดพลาดของน้ำหนักน้อยที่สุด ht เพื่อนำไปปรับน้ำหนักใน รอบถัดไป (t +1) โดยเลือกส่งเสริม (boosting) น้ำหนักตัวที่ไม่ผ่านการจำแนก แต่ลดน้ำหนักตัวที่ผ่าน การจำแนกตามขั้นตอนวิธี
การหาวงกลมในภาพถ่าย (circle Hough transform)
การสร้าง accumulator cell ในกรณีวงกลมจะเป็น A(i,j) 3 มิติ ซึ่งพารามิเตอร์จะประกอบด้วย Cx, Cy และ r สำหรับวิธีการคำนวณหาพิกัด x และ y ที่อยู่บนวงกลมหรือส่วนโค้งอันเดียวกันจะใช้วิธีการเช่นเดียวกันกับกรณีของเส้นตรง ในทำนองเดียวกันการหาส่วนโค้งและวงกลมด้วย Circle Hough transform จะใช้สมการที่ 13
โดยที่ cx,cy คือ จุดศูนย์กลางของวงกลมในแนวแกน x และ y
r คือ รัศมีของวงกลมหรือส่วนโค้ง
การสร้าง accumulator cell ในกรณีวงกลมจะเป็น A(i,j) 3 มิติ ซึ่งพารามิเตอร์จะประกอบด้วย cx,cy และ r สำหรับวิธีการคำนวณหาพิกัด x และ y ที่อยู่บนวงกลมหรือส่วนโค้งอันเดียวกัน จะใช้วิธีการเช่นเดียวกันกับกรณีของเส้นตรง