Gros Lorrie. Două săptămâni eu picură Google, Yandex. Au existat câteva exemple, dar practic este doar un program pentru redare sau înregistrare. Mai ales pe qt.
Și da, am o întrebare respectabilă pentru tine despre cum să găsești ceva despre Google despre care nu știi. Pentru că aveți nevoie de o construcție clară a întrebării dvs. în Google sau Yandex. dar din cauza faptului că nu știu ce sunet, nu pot să mă descurc.
La cererile din C ++, lucrul cu sunet oferă forumuri goale fără răspunsuri. la cerere qt lucrează cu sunet dă întunericul jucătorilor pentru a asculta muzică.
Dacă sunteți un astfel de Expert Google, ajută-mă să fac o interogare, în care o introduc personal.
Gros Lorrie. Și da, nu știți cum funcționează roboții de căutare Google, ce este căutarea și de unde se fac site-urile și informațiile sau nu mi-ați citit cu atenție întrebarea. Cu toate aceste "butoane" care sunt scrise în întrebarea mea nu este posibilă obținerea informațiilor necesare din căutare.
Dacă nu vă deranjează să scrieți un program de câteva linii nu mai mult!
fișierul ifstream ("C: \\ ok.wav", ios :: beg | ios :: in | ios :: binary); // de exemplu.
Deschiderea fișierului de sunet (nu știu ce format este mai bun pentru începutul imaginilor, acesta este bmp-ul cu care este mai ușor de lucrat) la alegere. Conectați conținutul la consola și salvați-l. Nu este nevoie să procesați erorile pe fișier.
Poți să mă trimită să înțeleg acest impudent =)
"dar ceea ce este sunet ca"
În sensul "matematic"? O funcție a amplitudinii formei (t) = f (t) :-)
Afișare "standard"?
- Luați segmentul acestui t (de exemplu - 1 minut)
- împărțiți-vă cu un număr finit de momente. t_i = (1 / f) * i, unde t_i este timpul i, i este numărul, f este rata de eșantionare
- stocăm valorile amplitudinii la aceste momente (amplitude_i = amplitudine (t_i))
- și desigur - reprezentăm aceste valori ca un număr de n-biți (pe exemplul de 24 de biți).
"Transformați o coloană sonoră într-un program"
Și în funcție de ce. Dacă vorbim despre o oscilogramă, pur și simplu folosim valorile amplitudinilor (bine, poate că le putem aplica o funcție simplă pentru ele.) De la liniare la logaritmice, de exemplu, să mergem). Cel puțin, puteți să-l imaginați în continuare ca pe o spectrogramă (care este adesea folosită). Dacă pe scurt - împărțită în intervale, fiecare dintre acestea - este descrisă printr-o funcție separată și o prezentăm, de exemplu, ca sumă a sinusoidului (transformarea Fourier a omului).
"curăță-l"
Din nou - EMNIP, lucrând în principal cu amplitudini (shareware - vychiaem semnalului zgomotos amplitudine (t) + zgomot (t) componenta de zgomot (t)) sau intervalul (Da convențional - frecvențe parțiale interval considerate, apoi subestimarea / supraestimate (adică .e. factorul în sinusoida sootvetsvujushchih)) și sunetul generat din nou. Dar - este atrasă întreaga zonă subiect, așa că am stăpânit mai întâi prima parte a mesajului.
"încercați să învățați rețeaua neurală să recunoască câteva cuvinte"
Din nou - o zonă separată. Nu știu ce abordări se utilizează în prezent - dar fără o căutare preliminară aș fi făcut-o (cu toate acestea, o astfel de rețea va necesita în mod evident o dohere de date pentru instruire, aproape că nu folosesc cunoștințe specifice despre această problemă):
- a prezentat înregistrarea ca un set de spectrograme
- împărțit în sunete individuale corespunzătoare
- alimentată cu grilă cu date marcate
"RGB"
Nu întotdeauna, apropo. Există tot felul de CMYK și alte chestii. Dar, din câte știu, valorile dintr-o schemă pot fi aduse la cealaltă, da.