PDA

View Full Version : เทคโนโลยีแปลงเสียงเป็นตัวอักษร



Noah
19-12-2007, 04:44 PM
สำหรับผู้สนใจทางด้านการแปลงเสียงเป็นตัวอักษร หรือรับเสียงแล้วแสดงเป็นคำสั่ง (ซึ่งตอนนี้ผมทำโปรเจคอยู่)
ซึ่งตอนนี้ก็เป็นที่สนใจมากในปัจจุบัน เนื่องจากมีความต้องการทางด้านการประมวลผลทางเสียงเพิ่มมากขึ้น
ผมก็เลยอยากจะนำมาแนะนำ เผื่อจะมีใครสนใจไปทำโปรเจคบ้าง
Speech reognition จะเป็นการแปลงเสียงที่ได้รับมาเข้าไปในระบบคอมพิวเตอร์เพื่อที่จำทำการประมวลผล
โดยผ่านอลกอริทึมต่างๆ แล้วนำแสดงออกมาในรูปแบบตัวอักษร ซึ่งในปัจจุบันก็ได้มีอัลกอลิทึมที่น่าสนใจหลายอย่าง เช่น
API-JAVA หรือโดยเฉพาะอย่างยิ่ง**Hidden Content: Check the thread to see hidden data.** ซึ่งเป็นอัลกอลิทึมที่น่าสนใจและมีประสิทธิภาพมากที่สุดในปัจจุบัน
โดยหลักการทำงานคร่าวๆคือ
-ประมวลผลเสียงในรูปคลื่น
-หาลักษณะเด่นของคลื่นเสียงไปเทียบกับคำ
-ฝึกรู้จำโดยใช้อัลกอลิทึม
-เปรียบเทียบค่าที่รับกับค่าที่ได้ทำการเรียนรู้ แล้วประมวลผลออกมา
เห็นหรือป่าวคับ ว่าเป็นเทคโนโลยีใหม่ที่น่าสนใจ
ใครอยากศึกษาต่อก็ลองเข้าไปดาวโหลดมาทดลองจาก link นี้เลยคับ
**Hidden Content: Check the thread to see hidden data.**
B)

susupd
09-03-2009, 03:04 PM
กำลังมองหาอยู่ครับ ไม่ทราบว่าสนับสนุนภาษาไทยหรือเปล่าครับ

khitsada
02-01-2010, 12:37 PM
ผมต้องการทราบว่าใน **Hidden Content: Check the thread to see hidden data.**

khitsada
02-01-2010, 12:37 PM
ผมต้องการทราบว่าใน **Hidden Content: Check the thread to see hidden data.**

Thanwa
03-01-2010, 08:07 PM
ผมต้องการทราบว่าใน <{HIDE1}> 1 posts
[/b]

ที่ผมรู้ มีแต่ ที่พิมภาษาอังกฤษ แล้วให้มันอ่านออกเสียง แต่ถ้าแปลงเสียงเป็นอักษร ผมไม่เคยเห็นคับ (ใน windows) :(

ปัจจุบันมือถือก็มีเทคโนโลยีนี้เหมือนกัน พูดแล้วก็ออกมาเป็นตัวอักษร (ถ้าจำไม่ผิดของ Samsung) แล้วก็พูดสั่งให้มือถือทำอะไรเช่น

พูดว่าฟัังเพลง ก็จะเปิดโปรแกรมฟังเพลงให้ (์์Nokia)

แล้วก็ โปรเจคที่กำลังทำ ผมจะเป็นกำลังใจให้นะครับ :)

HimeHima
19-01-2010, 10:40 PM
เราทำ Speech Recognition อยู่ค่า ทำตามของ nectec เลย LVCSR ด้วย (large vocab continuous speech recog) แล้วก็ไปอ่าน voxforge ค่า มีทุก step
ใช้ module เสียงของฝรั่งเค้าเอา (เราทำภาษาอังกฤษนะ)

7Up
05-02-2010, 01:23 PM
ผมทำเรื่องพวกนี้อยู่พอดีน่ะ ตัวของมหาลัยแคมฯ ผมใช้แล้วยังไง งงอยู่เลย

ลักษณะการใช้งานอ่านค่าเสียงแล้วเปรียบเทียบค่าออกมาเป็น บิต แล้วหารด้วยค่า ค่านึง


เรื่องด้านภาษาไทย เห็น NECtec เค้านำาใช้แล้ว แต่ผม เอามาใช้ยังติดด้านเสียง เอก โทตรี


ยังแก้ไขปัญหาไม่ได้เลย >,<