
การจดจำเสียง (voice recognition)
Voice
recognition คืออะไร
voice หรือ
speech recognition (ระบบจดจำเสียง)
คือความสามารถของเครืองจักรหรือโปรแกรมเพื่อรับและแปลถ้อยคำหรือเข้าใจและทำตามคำสั่งที่พูด
สำหรับการใช้กับคอมพิวเตอร์ เสียงอะนาล๊อกต้องแปลงเป็นสัญญาณดิจิตอล
สิ่งนี้ต้องการ analog-to-digital
conversion สำหรับคอมพิวเตอร์เพื่อถอดรหัสสัญญาณ
จึงต้องการฐานข้อมูลดิจิตอล หรือคำศัพท์ ของคำหรือพยางค์
และความเร็วหมายถึงการเปรียบเทียบข้อมูลกับสัญญาณ รูปแบบการพูดได้รับการเกผ้บลงในฮาร์ดดิสก์และโหลดเข้าสู่หน่วยความจำ
เมื่อเรียกใช้โปรแกรม
การตรวจสอบเปรียบเทียบรูปแบบจัดเก็บเหล่านี้เทียบกับผลลัพธ์ของตัวแปลง A/D
ในทางปฏิบัติ ขนาดของคำศัพท์ประสิทธิผลในโปรแกรมจดจำเสียง
คือสัมพันธ์ทางตรงกับความจุของหน่วยความจำชั่วคราวของเครือ่งคอมพิวเตอร์ที่ได้รับการติดตั้ง
โปรแกรมจดจำเสียง เรียกใช้หลายครั้งเร็วขึ้น
ถ้าคำศัพท์ทั้งหมดสามารถได้รับการโหลดเข้าสู่หน่วยความจำชั่วคราว
เปรียบเทียบกับการค้นหาบนฮาร์ดไดร์ฟสำหรับการจับคู่บางครั้ง
ความเร็วการประมวลผลเป็นสิ่งสำคัญ เพราะมีผลกับความเร็วคอมพิวเตอร์สามารถค้นหาในหน่วยความจำ
ระบบจดจำเสียง หรือโปรแกรมทั้งหมดทำความผิดพลาด เสียงร้องของเด็ก สุนัขเห่า
และการสนทนาภายนอกเสียงดังสามารถทำความผิดพลาดนำเข้า
ส่วนใหญ่ของสิ่งนี้สามารถหลีกเลี่ยงได้โดยการใช้ระบบนี้ในห้องเงียบ
มีอีกปัญหาที่คำมีเสียงเหมือนกันแต่สะกดต่างกันและความหมายต่างกัน ตัวอย่าง "hear" และ
"here" ปัญหานี้อาจจะแก้ไขได้โดยการเก็บสารสนเทศบริบท
อย่างไรก็ตาม
สิ่งนี้จะต้องการหน่วยความจำชั่วคราวมากขึ้นและโพรเซสเซอร์เร็วขึ้นกว่าเครื่องคอมพิวเตอร์ส่วนบุคคลปัจจุบันมีให้
ถึงแม้ว่าระบบจดจำเสียงมีให้ในตลาด แต่ผู้นำอุตสาหกรรมนี้คือ IBM และ
Dragon Systems
ไม่มีความคิดเห็น:
แสดงความคิดเห็น