Descoperirea cunoştinţelor
/ Knowledge Discovery >> Descoperirea cunoştinţelor >> tech >> calculator >> Internet >> Web Design Development >>

Expert Stuff: Googles Mike Cohen

ea, un fel de, constrângerile gramaticale ale limbii, o face într-un mod statistic bazat pe alimentandu-l o mulțime de date. Deci, de exemplu, s-ar putea afla că modelul pe care, dacă recunoaștere crede că doar recunoscut " câinele " iar acum încearcă să dau seama ce următorul cuvânt este, se poate ști că " a fugit " este mult mai probabil decât " pan " sau " poate " ca următorul cuvânt doar pentru că din ceea ce stim despre utilizarea limbii în limba engleză

Câini rula mai mult decât o fac lucruri cu bucătărie, și acest lucru prin alimentarea o multime de date pentru a acestui model -. Am apelul model de limbă. Este modelul statistic de secvențe de cuvinte, cât de probabil să apară sunt având în vedere ce recente cuvinte au fost diferite cuvinte. Prin alimentarea modelului o mulțime de date, doar calculeaza toate aceste statistici despre ceea ce este probabil să apară următoare, și asta e modelul de limbă. Deci, acum, aceste trei modele, modelul acustic, sau modelul cu toate acele sunete fundamentale, lexiconul, sau model de cum toate cuvintele primi pronunțată, și în cele din urmă model de limbă, sau modul în care toate aceste cuvinte se insirate se compilat împreună.

Deci, modelele lexicale sunt construite de înșirare modele împreună acustice, modelul de limbă este construit de înșirare împreună modele de cuvinte, și totul se compilate într-o reprezentare enorm a limbii engleze vorbite, să zicem, și care devine modelul care devine învățat de la datele, și care recunoaște sau căutările când unele acustică vin în și de care are nevoie pentru a afla ce e cel mai bun la ceea ce cred meu tocmai a fost spus.
Cum să luați în considerare accente și dialecte când proiectarea recognizere vorbire ?

Unul dintre lucrurile fundamentale, având în vedere tipul de abordare bazate pe date care luăm, este să încercăm să avem seturi foarte mari, de formare larg. Avem cantități mari de date provenind de la toate tipurile de oameni cu tot felul de accente, spunând tot felul de lucruri, și așa mai departe și așa mai departe, și cel mai important lucru este de a avea o acoperire bună set de antrenament, indiferent de vine . în Avem destule cazuri de accente Brooklyn - și nu doar datorită mine - dar avem oameni din Brooklyn, care au vorbit la sistemele noastre de astfel de faptul că facem o treabă bună atunci când oamenii cu accente Brooklyn vorbesc cu sistemul nostru

Pe de altă parte, în

Page [1] [2] [3] [4] [5] [6] [7] [8] [9]