วันอังคารที่ 5 กุมภาพันธ์ พ.ศ. 2556

ความรู้เกี่ยวกับการจดจำเสียง (voice recognition)


การจดจำเสียง (voice recognition) 



Voice recognition คืออะไร
   voice หรือ speech recognition (ระบบจดจำเสียง) คือความสามารถของเครืองจักรหรือโปรแกรมเพื่อรับและแปลถ้อยคำหรือเข้าใจและทำตามคำสั่งที่พูด
    สำหรับการใช้กับคอมพิวเตอร์ เสียงอะนาล๊อกต้องแปลงเป็นสัญญาณดิจิตอล สิ่งนี้ต้องการ analog-to-digital conversion สำหรับคอมพิวเตอร์เพื่อถอดรหัสสัญญาณ จึงต้องการฐานข้อมูลดิจิตอล หรือคำศัพท์ ของคำหรือพยางค์ และความเร็วหมายถึงการเปรียบเทียบข้อมูลกับสัญญาณ รูปแบบการพูดได้รับการเกผ้บลงในฮาร์ดดิสก์และโหลดเข้าสู่หน่วยความจำ เมื่อเรียกใช้โปรแกรม การตรวจสอบเปรียบเทียบรูปแบบจัดเก็บเหล่านี้เทียบกับผลลัพธ์ของตัวแปลง A/D
    ในทางปฏิบัติ ขนาดของคำศัพท์ประสิทธิผลในโปรแกรมจดจำเสียง คือสัมพันธ์ทางตรงกับความจุของหน่วยความจำชั่วคราวของเครือ่งคอมพิวเตอร์ที่ได้รับการติดตั้ง โปรแกรมจดจำเสียง เรียกใช้หลายครั้งเร็วขึ้น ถ้าคำศัพท์ทั้งหมดสามารถได้รับการโหลดเข้าสู่หน่วยความจำชั่วคราว เปรียบเทียบกับการค้นหาบนฮาร์ดไดร์ฟสำหรับการจับคู่บางครั้ง ความเร็วการประมวลผลเป็นสิ่งสำคัญ เพราะมีผลกับความเร็วคอมพิวเตอร์สามารถค้นหาในหน่วยความจำ
    ระบบจดจำเสียง หรือโปรแกรมทั้งหมดทำความผิดพลาด เสียงร้องของเด็ก สุนัขเห่า และการสนทนาภายนอกเสียงดังสามารถทำความผิดพลาดนำเข้า ส่วนใหญ่ของสิ่งนี้สามารถหลีกเลี่ยงได้โดยการใช้ระบบนี้ในห้องเงียบ มีอีกปัญหาที่คำมีเสียงเหมือนกันแต่สะกดต่างกันและความหมายต่างกัน ตัวอย่าง "hear" และ "here" ปัญหานี้อาจจะแก้ไขได้โดยการเก็บสารสนเทศบริบท อย่างไรก็ตาม สิ่งนี้จะต้องการหน่วยความจำชั่วคราวมากขึ้นและโพรเซสเซอร์เร็วขึ้นกว่าเครื่องคอมพิวเตอร์ส่วนบุคคลปัจจุบันมีให้
     ถึงแม้ว่าระบบจดจำเสียงมีให้ในตลาด แต่ผู้นำอุตสาหกรรมนี้คือ IBM และ Dragon Systems


ย้อนกลับ

ไม่มีความคิดเห็น:

แสดงความคิดเห็น