Hidden Markov Modelul este cea mai comuna, asa ca vom lua o privire mai atentă la acest proces. În acest model, fiecare fonem este ca o legătură într-un lanț, și lanțul completat este un cuvânt. Cu toate acestea, ramurile lanț off în direcții diferite ca programul încearcă să se potrivi cu sunet digital cu fonemul care este cel mai probabil să vină următoare. În timpul acestui proces, programul atribuie un scor de probabilitate a fiecărui fonem, pe baza încorporat în dicționar și de utilizare de formare
Acest proces este chiar mai complicat pentru expresii și fraze -. Sistemul trebuie să dau seama unde fiecare cuvânt se oprește și începe. Exemplul clasic este expresia " recunoaște vorbirea, " care sună foarte mult ca " epavă o plajă frumoasă " când o spun foarte repede. Programul trebuie să analizeze fonemele folosind fraza care a venit înainte de a în scopul de a obține o corect. Iată o defalcare a două fraze:
r eh k ao g n ay z s p iy ch
" recunoaște vorbirea "
r eh k ay ay n s b iy ch
" distruge o plajă frumoasă "
De ce este acest lucru atât de complicat? În cazul în care un program are un vocabular de 60.000 de cuvinte (comun în programele de astăzi), o secvență de trei cuvinte ar putea fi oricare dintre 216 de miliarde de posibilitati. În mod evident, chiar și cel mai puternic calculator nu se poate căuta prin toate acestea fără un ajutor.
Acest ajutor vine sub forma de formare programului. Potrivit lui John Garofolo:
Aceste sisteme statistice nevoie de o mulțime de date de formare exemplare pentru a ajunge la performanțe optime a acestora - uneori de ordinul a mii de ore ale vorbirii umane, transcrise și sute de megabytes de text. Aceste date de instruire sunt folosite pentru a crea modele acustice de cuvinte, liste de cuvinte, și [...] rețelele probabilitate mai multe cuvinte. Există unele artă în modul în care o selectează, compilează și se pregătește aceste date de formare pentru " digestia " de sistem și modul în care modelele de sistem sunt " reglat " la o anumită aplicație. Aceste detalii pot face diferenta dintre un sistem performant și un sistem de performanțe slabe--. Chiar atunci câ