Recomandați programul pentru construirea spectrogramului de vorbire aproape de software-ul științific

Astăzi am întrebat un specialist. El spune că programele nu pot distinge bine fonemele. omg!

Fonemele depind, de asemenea, de limbă.


În opinia mea, nu chiar. Limba depinde de ce foneme sunt prezente în ea - în toate limbile seturi diferite de foneme.
În același timp, fonemele sunt adesea repetate, adică în diferite limbi, se pot întâlni adesea aceleași foneme. Există un alfabet internațional fonetic. Are un număr finit (mic) de foneme, toate putând fi găsite numai în limbi naturale. Prin urmare, dacă spectrograma ar putea distinge fonemele în principiu, atunci nu ar exista o problemă cu limbile specifice.

Iar opiniile asupra invertoarelor fonice ale limbii oficiale pot diferi: de exemplu. pentru 5 phoneme rusești de la MFSh și 6 pentru LFSh.


Ce este "MFSH" și "LFSH"?

O curbă verde este similară cu o oscilogramă, pe orizontală semnalul de timp vertical al unui microfon (presiunea acustică).

Mai jos este probabil spectrograma, orizontală în timp, frecvența verticală fiind prezentă în sunet la un moment dat în timp.


Și ce culoare indică exact? Se pare că intensitatea, dar nu înțeleg ce înseamnă exact și de ce este necesar să distingem fonemele (și dacă este necesar).

arseniiv. Sfătuiți un manual cu privire la fonetică.

Astăzi am întrebat un specialist. El spune că programele nu pot distinge bine fonemele. omg!


Și de ce, sub formă de spectrograme, este imposibil să se determine fonemele? Spui că trebuie să ai informații suplimentare despre limbă. Dar, în măsura în care am înțeles răspunsul specialistului care a cerut, nu există niciun program care să distingă fonemul suficient de bine pentru anumite limbi.

Google. Sa dovedit că este imposibil să se reproducă spectrogramul în mod neechivoc (adică să se reconstituie sunetul conform acestei spectrograme). Omg, este de ce?

Și nu aveți nevoie de un fonem, cel mai probabil.

Nu e nevoie. Eram doar curios. Am citit manualul Reformatsky, m-am intalnit, am vrut sa vad programe moderne relevante (manuale de 50 de ani).

aceste simboluri nu ar trebui să fie înțelese mai mult decât o abstractizare - se utilizează pentru a înregistra variante de foneme - aloftone și același alophone poate fi implementarea de foneme diferite


Adică nu există foneme în sine în limbaj, este acesta un concept abstract? Doar opțiunile lor, implementări diferite direct?

arseniiv, recomandă un manual de fonetică.

Și de ce, sub formă de spectrograme, este imposibil să se determine fonemele? Spui că trebuie să ai informații suplimentare despre limbă. Dar, în măsura în care am înțeles răspunsul specialistului care a cerut, nu există niciun program care să distingă fonemul suficient de bine pentru anumite limbi.

Pentru a selecta un fonem dacă alofon marcate, unul trebuie să cunoască locurile unde alofon date care pot fi realizate și ceea ce nu este (în funcție de limba), precum și pentru a determina alofon trebuie să știe ce sunete în limba sunt luate în considerare pentru diferite alofon, și care unul . De exemplu, nu un englez care a studiat limba rusă va accepta aproape sigur punerea în aplicare a [l] și [l „] ca fiind echivalent, deși o notificare, desigur, o diferență - dar nu este important. Dacă puteți împărți suficient de bine pentru înregistrări vocale în sunete distincte (organe de vorbire să ia o poziție nouă într-un timp finit - deci ceva timp între două sunete adiacente pronunțat undeva), mi se pare, un rezultat bun pentru separarea alofon ar trebui să dea algoritmi de recunoaștere a imaginilor.

Google. Sa dovedit că este imposibil să se reproducă spectrogramul în mod neechivoc (adică să se reconstituie sunetul conform acestei spectrograme). Omg, este de ce?

E ciudat. Acest lucru ar trebui să fie posibil.

Adică nu există foneme în sine în limbaj, este acesta un concept abstract? Doar opțiunile lor, implementări diferite direct?

Depinde de unde. În fluxul de vorbire există doar un sunet. Și ceea ce este în cap ... (și în limba - nu este un lucru material) În general, acest model cu foneme și aloftone este destul de bine aplicabil.

Detalierea intervalului de frecvență - probabil în primul rând. Și restul: detalii de timp și de zgomot - dar aici, probabil, oamenii de obicei au destul.


Volumul în vorbire nu joacă un rol important.
Care este detaliul timpului? Acolo, conform uneia dintre scale, timpul este doar amânat, iar spectrograful este reprezentat clasic cu semnături de valori de-a lungul axei timpului și de-a lungul axei de frecvență. Deci, există timp.
Care este detaliul frecvenței? Frecvențele pot fi determinate din spectrogram. Spectromograma însăși poate fi întinsă orizontal-vertical, primind detalii. Ie este spectrograma care este dată (cred eu) și nu imaginea spectrogramului.

Ei bine, ne-foarte-ceva-și-confort de a prezenta informații în această formă, de asemenea, influențează faptul că pentru muncă este necesar să se compare frecvențe cu un ajutor. Omul nu o va face repede.


Calculator pentru a compara frecvențele cu referință - fără probleme. Vorbim despre programe de calculator.