Următorul pas pare simplu, dar este de fapt cel mai dificil de realiza și este punctul central este de cele mai multe cercetări de recunoaștere a vorbirii. Programul analizează foneme în contextul celorlalte fonemelor din jurul lor. Se ruleaza complot fonem contextuală printr-un model statistic complex și le compară cu o bibliotecă mare de cunoscute cuvinte, fraze si propozitii. Programul determină apoi ceea ce utilizatorul a fost, probabil, a spune și fie ieșiri IT ca text sau probleme o comandă calculator.
Vom arunca o privire mai atentă la exact cum face acest lucru în continuare.
Recunoaștere vorbire și statistice Modelarea
sisteme de recunoaștere a vorbirii timpurie a încercat să aplice un set de reguli gramaticale și sintactice în vorbire. În cazul în care cuvintele rostite se potrivesc într-un anumit set de reguli, programul ar putea determina ce au fost cuvintele. Cu toate acestea, limbajul uman are numeroase excepții de la propriile sale reguli, chiar și atunci când a vorbit în mod constant. Accente, dialecte și manierisme poate schimba foarte mult modul în care anumite cuvinte sau fraze sunt vorbite. Imaginați-vă pe cineva de la Boston spune cuvântul ". Hambar " El n-ar pronunța " r " la toate, iar cuvântul vine din rimă cu ". John " Sau să ia în considerare sentința, " Mă duc să văd oceanul "., Majoritatea oamenilor nu enunțe cuvintele lor foarte atent. Rezultatul ar putea veni ca " Mă duc da vezi tha ocean "., Se execută mai multe dintre cuvintele, împreună cu nici o pauză vizibile, cum ar fi " Mă duc " și ". ocean " Sisteme bazate pe reguli, nu au avut succes, deoarece nu a putut face aceste variații. Acest lucru explică, de asemenea, de ce sistemele de mai devreme nu a putut face vorbire continuă -. A trebuit să vorbească fiecare cuvânt separat, cu o scurtă pauză între ele
sisteme de astăzi de recunoaștere vocală utilizează sisteme de modelare statistice puternice și complicate. Aceste sisteme folosesc probabilitate și funcții matematice pentru a determina rezultatul cel mai probabil. Potrivit lui John Garofolo, Director Discurs Group la tehnologiei de laborator de Informare al Institutului Național de Standarde și Tehnologie, cele două modele care domină câmpul de astăzi su