Interviu cu șeful managementului calității produselor de căutare - Yandex - Andreej Shamskin

"Ne îndreptăm spre conectarea lumilor virtuale și reale"

Ca cabbies Moscova pentru a ajuta la îmbunătățirea căutarea vocală, în cazul în care utilizatorii de Internet sunt în căutarea pentru Erotica de ce „Yandex“ nu se teme de chinezi, și modul în care aceasta este diferită de Google - „Times“ a vorbit cu Andrew Styskinym, șeful unității responsabile pentru calitatea căutării în „Yandex“ .

Căutarea pe mobil diferă și de cea clasică prin dorința utilizatorului de a obține o reprezentare diferită și mai utilă a rezultatelor interogării de căutare. Aceasta este ceea ce lucrează creatorii de site-uri web și de motoare de căutare.

De asemenea, suntem implicați în acest lucru, de exemplu, suntem investiți activ în introducerea vocii. Aceasta este, în general, o experiență interesantă. Anterior, a fost o temă din filme fantastice - eroul cere ceva, iar robotul sau inteligența artificială îi răspund ceva. Dar există deja scenarii în viața reală, unde este implementat convenabil. Diferiți asistenți vocali, există centre de apel complet robotice care înțeleg cererea de voce a utilizatorului și îi răspund și cu voce. De exemplu, pe aceleași televizoare "inteligente" este imposibil să imprimați nimic cu o telecomandă și este foarte ușor să dați o comandă vocală.

Interviu cu șeful managementului calității produselor de căutare - Yandex - Andreej Shamskin

- Proporția de intrare vocală crește?

- Da, am întâlnit cumva cum a încercat un șofer de taxi din Asia Centrală să pronunțe pentru navigatorul "Strada Graivoronovskaya" ...

"Acestea sunt cele mai bune exemple pentru noi!" Suntem într-un astfel de flux de cereri și suntem pregătiți. Înregistrăm astfel de piste, pentru că dacă o persoană nu reușește să introducă o solicitare cu voce, o va tipări oricum și știm cu siguranță că acest fragment de voce corespunde acestui text, iar data viitoare vom recunoaște mai bine discursul. Avem un eșantion mare de formare și, cu ajutorul tehnologiilor de rețele neuronale, putem pregăti un motor de căutare.
Avem multe exemple de melodii vocale de la utilizatori complet diferiți. Cineva vorbește cu un accent și, prin urmare, recunoașterea "mașinilor" trebuie făcută în prealabil.

- Întrebarea cu privire la fragmentele extinse (fragmentul - un fragment de informații de pe site, reflectat în problema de căutare - "Gazeta.Ru") în emiterea de dispozitive mobile. Site-urile nu te supără? La urma urmei, au încercat să le facă un clic.

- Adevărul este că obținerea de informații despre dispozitivele mobile este adesea complicată de Internetul mobil slab și încet. O persoană în același timp dorește să primească un răspuns la cererea lor cât mai curând posibil, fără a cheltui câteva minute pentru a merge la link și a descărca pagina. Scopul nostru ca motor de căutare este de a face acest lucru, astfel încât utilizatorii care caută informații sunt confortabile.

Interviu cu șeful managementului calității produselor de căutare - Yandex - Andreej Shamskin

- Căutarea vocală funcționează exact cu aceeași interfață text pentru interacțiunea cu căutarea. Tocmai au învățat să recunoască și să traducă o solicitare de voce într-una textuală. Cu imagini, totul este fundamental mai dificil, pentru că de mult timp nimeni nu știa cum să le traducă într-un limbaj de mașină ușor de înțeles, să codifice ceea ce este reprezentat în imagine. Dar, recent, știința sa dezvoltat foarte puternic în această direcție și este legată de dezvoltarea inteligenței artificiale sau, mai degrabă, de rețelele neuronale, care ne-au permis să distingem "cuvinte" universale care descriu imagini.

Este mai ușor să fotografiați, de exemplu, un buchet de flori, să trimiteți o fotografie unui serviciu de căutare care să răspundă la ce fel de flori sau chiar să spună unde pot fi comandate.

- Odată ce am început să vorbim despre inteligența artificială, în știința de ficțiune AI atacă adesea oamenii. Amintiți-vă aceleași "Matrice" și "Terminator". Dar pare mult mai periculos că mașinile inteligente nu vor ataca nu oamenii, ci portofelele lor. Există servicii recomandate, servicii de plată cu auto-finalizare. Va pierde consumatorul controlul asupra finanțelor și alegerii sale, mașinilor care se încrede din ce în ce mai mult?

- Desigur, noile oportunități cu dezvoltarea de tehnologii poartă noi amenințări, în general, în orice industrie. Invenția privind cardurile bancare și serviciile online a provocat fraude cu bani pe Internet, există zeci de moduri de a fura parolele unei persoane sau de a le semna pentru servicii cu plată fără să știe.

Este important ca oamenii să înțeleagă pericolele și să-i poată evita.

Când mergem de-a lungul străzii, înțelegem că este periculos să treci drumul spre lumină roșie, iar dacă altcineva ți-ar cere să suni de pe telefonul tău mobil - poate avea ceva rău în mintea ta. Este același lucru pe Internet.

Interviu cu șeful managementului calității produselor de căutare - Yandex - Andreej Shamskin

Modelul centrului de date al companiei "Yandex"

Odată cu dezvoltarea tehnologiilor, se dezvoltă alfabetizarea tehnologică a oamenilor, apare un minim igienic de bază, atunci când o persoană realizează posibile scheme de fraudă în rețea și știe cum să identifice resursele periculoase.

- Nu a venit timpul să introducem anumite criterii etice în mecanismul activității lui Yandex? Astfel de "trei legi ale roboticii" pentru a controla atât acțiunile inteligenței artificiale, cât și ale utilizatorilor?

- De mult timp, am fost implicați în personalizarea răspunsurilor de căutare în funcție de interesele utilizatorilor, iar beneficiile acestei tehnologii sunt tangibile. De exemplu, o persoană care cumpără un apartament întreabă mai întâi întrebări despre clădiri noi și apoi începe să cumpere materiale pentru reparații pe Internet. Folosind aceste informații, se pot înțelege motivele lui și se pot recomanda câteva propuneri benefice pentru el, contextuale cu interesele actuale. Subliniez - nu avem nevoie să știm datele personale ale unei persoane pentru acest lucru, nu vorbim în mod specific despre el, ci despre un grup de persoane cu interese similare de căutare.

- Există o opinie pe scară largă că "Yandex" este mai bine căutat în limba rusă, Google - în limba engleză, Baidu - în limba chineză. În general, există diferențe în algoritmii de căutare în diferite limbi?

"Este greu să vorbesc despre chinezi, pentru că nu măsuram calitatea căutării în China. Dar în Rusia, în majoritatea subiecților, noi, conform măsurătorilor noastre, suntem cei mai buni în rusă. Apropo, investigăm nu numai fluxul de cereri, dar și fluxul de cereri pentru concurentul nostru. De asemenea, remarcă faptul că utilizatorii înșiși diferă ușor. De exemplu, utilizatorii Google cunosc în medie mai bine limba engleză, iar Google are mai multe interogări în limba engleză din Rusia. Sunt doar specificul publicului.

Contribuția acum mult mai mare la dezvoltarea tehnologiilor de căutare, și concurența face capacitatea de a obține o cantitate mare de date privind interogări de utilizator, izolate de la ei relație utilă, care arată interesul în rețea și de tren cu aceste interconexiuni un motor de căutare, care învață în cele din urmă să înțeleagă cu exactitate întrebarea utilizator sau să-și rezolve sarcina. Adică, capacitatea de a lucra cu date mari joacă un rol dominant astăzi și nu cunoașterea lingvisticii sau morfologia unei anumite limbi.

Putem realiza în câteva luni o căutare complet calitativă în aproape orice limbă și apoi o îmbunătățim, obținând noi date despre comportamentul utilizatorilor dintr-o anumită regiune. Poate pentru moment, cu excepția scrisului hieroglific, deoarece există dificultăți în împărțirea interogării în cuvinte individuale.

- Și totuși te-ai oprit la Turcia. De ce?

- Inițial, sarcina a fost de a dezvolta un astfel de algoritm de căutare, care pe o cantitate relativ mică de date de utilizator, în comparație cu ceea ce concurentul are acolo, ar putea răspunde calitativ la cele mai multe căutări. Nu am rezolvat această problemă de la prima dată - după doi ani de activitate activă am deconectat întreaga activitate legată de promovare, iar într-un an am redenumit și reconstruit algoritmul. După aceasta, cota de piață în Turcia sa mutat în sus - acum, la "Yandex", face aproximativ 7% pe desktop-uri.

Nuanțele asociate specificităților regionale și preferințelor utilizatorilor, de fapt, foarte mult. Chiar și interfața turc „Yandex“ este diferită de limba rusă - am constatat că site-urile care apar pe design ca yandex.ru, adică, conține o mulțime de informații diferite - vreme, trafic, ratele de schimb, - Turks destul de greu să ia, și a trebuit să se schimbe interfață, dimensiune font și tip în SERP.

Dar, în general, succesul principal în Turcia este Yandex.Navigator. Pe toate acestea, Istanbul călătorește și, înainte de aceasta, locuitorii orașului nu aveau un instrument gratuit care să facă trasee luând în considerare blocajele de trafic. Mulți din Turcia știu "Yandex" în primul rând ca dezvoltator de servicii de navigație.

- Baidu a încercat odată să meargă în Brazilia. Am fost foarte interesați de experiența lor, pentru că am făcut primii pași în paralel în Turcia. Am măsurat calitatea Baidu și am realizat rapid că compania chineză din Brazilia nu a obținut nimic.

- Motorul de căutare Bing (Microsoft) pe piața rusă, de asemenea, cumva "nu a mers". De ce crezi?

- Do Bing este o tehnologie foarte bună, iar succesul motorului de căutare, în opinia mea personală, nu a fost realizat numai datorită faptului că veniturile din căutare pe care le-ar putea ajunge aici, sa dovedit a fi prea mică pe scara Microsoft Corporation și toate produsele sale. Este doar o chestiune de prioritate a resurselor. Poate că, de altfel, pentru obiectivul principal Baidu nu este de a câștiga un pic mai mulți bani în Brazilia și în Rusia, și să își mențină poziția pe piața chineză.

- Aici poziția noastră a fost formată de mult timp și nu sa schimbat de atunci. Suntem pentru a face informația accesibilă și deschisă - numai atunci putem face o căutare care să ofere utilizatorilor mari oportunități. O căutare completă a Internetului într-o singură platformă sau sistem nu poate fi făcută numai pe baza informațiilor generate și stocate în interiorul acesteia. Această căutare este doar un exemplu al interesului utilizatorilor de Internet. Prin urmare, este foarte important ca accesul la toate cunoștințele despre omenire să fie deschis. Cred că serviciile care funcționează pe toate platformele și căutarea întregii cantități de date stocate în rețea vor fi mereu în cerere.