Microsoft api vorbire

recunoașterea vorbirii

Recunoașterea vocală - procesul de conversie a cuvintelor pronunțate în text tastat. Recunoaștere vorbire include:

capta și digitiza sunetul rostit în microfon;
conversia sunetului digitalizată fonem;
construcția de foneme de cuvinte;
analiza contextului în care a fost rostit cuvântul, și, dacă este necesar, înlocuirea cuvintelor pe care sună similar.

Software-ul de recunoaștere (motor OCR) compară iterativ textul recunoscut la aplicarea regulilor gramaticale și coincidența textului cu o serie de reguli generează flux de ieșire XML folosind limbaj de marcare semantic (Ing. Semantic Markup Language. SML). Fluxul de ieșire include textul recunoscut, valorile corecte de probabilitate de recunoaștere și poate cuprinde valori semantice atribuite folosind interpretarea semantica markup. textul recunoscut este utilizat în mod obișnuit pentru introducerea datelor folosind aplicațiile pentru dictare și control folosind comenzi vocale.

text-to-speech

Sinteza Speech - procesul de conversie a textului în cuvinte vorbite. Sinteza vorbirii include:

separarea cuvintelor în foneme;
găsirea unui text, care necesită conversia de caractere, cum ar fi numere, cantitatea de monedă și de punctuație;
generarea de audio digital pentru redare.

Motoare transformă textul în vorbire poate utiliza una din cele două metode de sinteză vocală:

genera sunete astfel EMIT corzile vocale și utilizate o varietate de filtre pentru modelarea lungimii gâtului, forma gurii, buzelor și dispunerea limbii;
colecta de la mai multe piese de vorbire, crainic înregistrate.

Scrie un comentariu despre articolul „Microsoft Speech API“

notițe

Pasajul care descrie Microsoft Speech API

unelte personale