Descoperirea cunoştinţelor
/ Knowledge Discovery >> Descoperirea cunoştinţelor >> tech >> calculator >> Internet >> Web Design Development >>

Expert Stuff: Googles Mike Cohen

ererii au fost destul de previzibile

Dar au existat limbi prin care oamenii ar putea specifica ". aici sunt regulile sau set de siruri de caractere, care s-ar putea spune oamenii, în acest context particular. " Asta ar fi un caz în care a fost de recunoaștere foarte limitată. Aceasta ar recunoaște doar un anumit număr de variante în modul în care s-ar putea spune lucruri. Să spunem, " vrei soldul contului sau pentru a face un transfer " Nu e ca oamenii vor imita exact aceste cuvinte, dar e destul de previzibil, astfel încât cineva cu experiență, și după ce a ascultat o parte din date, ar putea avea o șansă rezonabilă de a scrie o gramatică explicit care a spus, " Aici sunt 50 de variații în modul în care oamenii s-ar putea face această alegere cu două sensuri ".

întrucât, după ce ați primit cereri pentru mai dificile cum ar fi, de exemplu, căutare de voce, e mult mai dificil de prezis toate aceste diferite siruri de cuvinte pe care oamenii s-ar putea rosti. Deci, în loc, gramatica devine ceea ce se numește o gramatica statistic, sau ceea ce noi numim adesea un model de limbă statistic. Asta ar fi ceva mai mult sub formă de, având în vedere ultimele două cuvinte au fost A, B, aici sunt probabilitățile din toate cuvintele din limba mea de ceea ce ar putea întâmpla în continuare.
Câte cuvinte sunt în căutare de voce Google baza de date?

A gazillion.

Deci, lasă-mă să-l pună în acest fel. Pentru limba engleză, partea de vocabular, numărul de cuvinte diferite în vocabularul nostru este de aproximativ un milion, și în timp, care evoluează pentru că, în mod evident, cuvinte noi introduceți limba, nume noi vin de-a lungul, așa mai departe și așa mai departe, astfel încât se redescoperit din timp în timp și devine adăugat, de asemenea. Apoi, aceste cuvinte pot fi puse împreună în orice ordine imaginabil, și pentru orice șir de lungime cuvânt. Deci s-ar putea veni cu o interogare de 10 cuvânt, cules la intamplare de la aceste milion de cuvinte, așa că se dovedește a fi un număr astronomic de mare. Cu toate acestea, prin utilizarea acestui tip de model de limbaj statistic am menționat, și de formare-o pe o mulțime de întrebări, sute de miliarde de interogări, vom ajunge cu putere rezonabilă predictivă despre ce e probabil.
Cât putere de calcul face o Sistemul de recunoaștere a vorbirii necesita?

Depinde când vrei să spui. Când facem de fapt recunoașterea, în acel moment de funcț

Page [1] [2] [3] [4] [5] [6] [7] [8] [9]