ทฤษฎีพื้นฐานของ Hidden Markov Models
Basic theory for Hidden Markov Models
3.1 บทนำ [8]
ผลที่ได้จากโปรเซสทั่วไปจะมีลักษณะเฉพาะเหมือนสัญญาณต่าง ๆ ซึ่งสัญญาณเหล่านี้จะเป็น Discrete continuous หรือจะเป็นสัญญาณที่ปราศจากการรบกวนต่าง ๆ (pure signal) หรือจะเป็นสัญญาณที่ถูกรบกวนโดยแหล่งกำเนิดอื่น ๆ หรือผลจากการบิดเบือนของการส่ง (transmission distortion) หรือเกิดการสะท้อนกลับ ฯลฯ สัญญาณต่าง ๆ เหล่านี้ก็จะมีลักษณะเฉพาะเป็นของตัวเองเสมอ
หนึ่งปัญหาที่น่าสนใจก็คือลักษณะเฉพาะของสัญญาณในเทอมของโครงสร้างสัญญาณ (signal model) ซึ่งมีอยู่หลายเหตุผลที่อธิบายว่าทำไมจึงมีคนสนใจในการประยุกต์โครงสร้างสัญญาณ หนึ่งในเหตุผลทั้งหมดก็คือโครงสร้างสัญญาณนั้นสามารถบอกรากฐานสำคัญเพื่อใช้สมมติรูปร่างของระบบ ตัวอย่างเช่น ถ้าหากเราต้องการปรับปรุงสัญญาณเสียงพูดที่ถูกรบกวนจาก noise และการบิดเบือนของการส่ง เราสามารถใช้โครงสร้างสัญญาณในการออกแบบระบบเพื่อกำจัด noise และลบล้างการบิดเบือนของการส่ง เหตุผลข้อที่สองได้อธิบายว่าทำไมโครงสร้างสัญญาณจึงมีความสำคัญ นั่นคือโครงสร้างสัญญาณทำให้เราได้เรียนรู้ถึงแหล่งกำเนิดสัญญาณมากมาย คุณสมบัตินี้มีความสำคัญอย่างมากเพราะต้นทุนของการสร้างสัญญาณจากแหล่งกำเนิดจริงนั้นมีค่าสูง ในกรณีของโครงสร้างสัญญาณที่ดี เราสามารถจำลองแหล่งกำเนิดและเรียนรู้จากมันได้มากเท่าที่จะเป็นไปได้จากการจำลองแหล่งกำเนิด สุดท้ายนี้เหตุผลสำคัญทั้งหมดที่ว่าทำไมโครงสร้างสัญญาณจึงสำคัญ นั่นคือมันให้ผลการทดลองที่ดีมากและสามารถทำให้เราเข้าใจระบบที่ทดลอง เช่น ระบบการคาดเดา (prediction system) ระบบการรู้จำ (recognition system) ระบบการหาเอกลักษณ์ (identification system) เป็นต้น
เหล่านี้เป็นทางเลือกที่เป็นไปได้หลายทาง ที่นำมาใช้สำหรับเลือกชนิดของโครงสร้างสัญญาณเพื่อใช้หาลักษณะเฉพาะในคุณสมบัติของสัญญาณ เราสามารถแบ่งชนิดของโครงสร้างสัญญาณได้เป็น 2 ชนิดคือ ประเภทของ Deterministic model และประเภทของ Statistical model ประโยชน์ทั่วไปที่ได้จาก Deterministic model คือคุณสมบัติเฉพาะบางอย่างของสัญญาณ เช่น สัญญาณนั้นเป็น Sine wave หรือเป็นผลรวมของ exponential เป็นต้น ในกรณีนี้เราต้องการทราบรายละเอียดต่าง ๆ ของโครงสร้างสัญญาณ เช่น ค่าแอมพลิจูด (amplitude) ความถี่ เป็นต้น อีกหนึ่งประเภทของโครงสร้างสัญญาณเป็นกลุ่มของ Statistical model ซึ่งหาลักษณะเฉพาะของสัญญาณจากคุณสมบัติของ Statistical เช่น Gaussian process, Poisson process, Markov process และ hidden Markov process เป็นต้น
ในรายงานนี้จะกล่าวถึงพื้นฐานสำคัญของทฤษฎี Hidden Markov Model ปัญหาพื้นฐานของทฤษฎีนี้ วิธีการคำนวณหาค่าพารามิเตอร์ต่าง ๆ การแก้ปัญหาและการปรับปรุงโครงสร้างให้ดีขึ้น รวมถึงความสามารถในการนำไปประยุกต์ใช้
3.2 Markov Process
พิจารณาระบบที่อธิบายถึงช่วงเวลาหนึ่งของกลุ่มสถานะที่แน่นอนจำนวน N สถานะ คือ S1 ถึง SN ที่แสดงให้เห็นดังรูปที่ 1 โดยกำหนดให้ N = 5 และค่า aij เป็นค่าความน่าจะเป็นในการเปลี่ยนสถานะหนึ่งไปยังอีกสถานะหนึ่ง (โดยที่ i เป็นสถานะต้นและ j เป็นสถานะปลาย) [8]
รูปที่ 3.1 A Markov chain with 5 states (labeled S1 to S5) with selected state transitions
เรากำหนดให้