Principiile indexării site-ului

Sarcina oricărui site este să transmită cât mai multe informații oamenilor pe care îi conține. Promovarea site-ului în motoarele de căutare (PS) este cel mai eficient mod de a face acest lucru. Una dintre etapele avansării este indexarea site-ului, adică citirea tuturor datelor de pe site, procesarea ulterioară a acestora de către algoritmi ai motoarelor de căutare și introducerea rezultatelor în baza de date.

Necunoscând bucătăria acestui proces, este imposibil să promovați în mod eficient site-ul. În acest articol vom descrie ce se întâmplă cu informațiile colectate de la resursă în adâncimile PS și cum să-l împachetezi pentru o mai bună asimilare. Asta este, vom vorbi despre procesul de indexare și îmbunătățirea acestuia.

Principiile indexării site-ului

Indexarea site-ului - ceea ce este la început

Dacă teatrul pornește cu un cuier, apoi indexarea de la faptul că robotul motorului de căutare trebuie să fie informat că o nouă resursă a apărut pe Internet. Există două moduri de a face acest lucru:

  1. Înregistrează-site-ul dvs. în motorul de căutare Yandex manual (webmaster.yandex.ru/addurl.xml), Google (www.google.com/webmasters/tools/submit-url?hl=ru) și alte motoare de căutare, dacă sunteți interesat.
  1. Acordați o legătură către site-ul de la o resursă terță de Internet (desigur, acesta trebuie deja înregistrat).

Prima metodă este preferabilă, deoarece în acest caz este mai probabil ca prima indexare să apară mai devreme.

De ce depinde frecvența de indexare și cum se accelerează aceasta?

Principiile indexării site-ului

Ce influențează această eficiență?

  1. Volumul de lucru al serverului în care este localizat site-ul. Dacă este încărcat cu o mulțime de site-uri și caracteristicile sale tehnice nu permit transferul operativ de informații către robotul de căutare, acesta din urmă o va vizita mai rar. Prin urmare, recomandarea - doriți indexarea rapidă, plasați-vă resursele de Internet pe hosting de înaltă calitate.
  2. Frecvența actualizării paginilor web și a întregului site în ansamblu. Cu cât apar actualizările frecvente, cu atât mai des va ajunge un robot la o astfel de resursă. Totul este destul de logic. Sensul este adesea să meargă acolo unde nu se întâmplă nimic? Numai este necesar să cunoști o nuanță. Robotul va veni exact la acele pagini, care sunt adesea actualizate. Adică dacă doriți să evaluați rapid informațiile de pe pagina principală a site-ului dvs. și să le actualizați în mod regulat. Cea mai ușoară cale este de a plasa un bloc de știri pe el.
  3. Participarea pe site și factorii comportamentali ai vizitatorilor săi. Asta este, dacă participarea este ridicată și oamenii din resursă rămân îndelung, fac tranziții interne, atunci intervalul dintre indexări va scădea cu siguranță.

După cum puteți vedea, toți acești trei factori pot fi influențați de o parte favorabilă pentru proprietarul site-ului.

Cum să aflați ce pagină din index

Principiile indexării site-ului

Acest lucru este departe de o întrebare incomodă și nu dintr-o serie: "Mai bine orice informație decât incertitudinea". La urma urmei, dacă știți sigur că indexarea a trecut și pozițiile site-ului dvs. nu s-au schimbat în problemă, înseamnă că faceți ceva greșit.

Puteți verifica indexarea unui site în mai multe moduri:

  1. Pe serviciul Yandeks.Vebmaster ("Verificați adresa URL"). Aici puteți afla:
    • când a avut loc ultima indexare;
    • ce document este afișat vizitatorului ca urmare a căutării;
    • recomandări pentru accelerarea indexării;
    • dacă pagina nu este în căutare, atunci din ce motive.
  2. Efectuați o căutare folosind următoarea expresie: url: adresa URL de interes, de exemplu, url: moi sairu / contacts
  3. Căutați utilizând operatorul site-ului. De exemplu, scriind pe site-ul liniei de căutare: moi site.ru veți obține o listă a tuturor paginilor site-ului dvs. care au fost indexate.
  4. Verificați indexarea listei de adrese URL în Clasamentul SE.

Clasamentul SE oferă, de asemenea, un instrument pentru urmărirea emiterii unei adrese URL în căutare. Deci, veți ști întotdeauna dacă pagina pe care o interesați nu a scăzut din index și dacă pagina pe care o căutați este dată pentru o anumită interogare de căutare.

Cum să gestionați robotul de căutare

Motorul de căutare descarcă informații de pe site în conformitate cu un plan strict definit. Nu există loc pentru improvizație. Și unde ia planul ăsta? Da pe resursele de internet! Asta este, puteți spune PC ce să descărcați sau să nu descărcați.

Robots.txt fișier

Principiile indexării site-ului

Erori obișnuite în fișierul robots.txt

  1. Interzicerea eronată a indexării anumitor pagini ale site-ului.
  2. cod HTTP-răspuns decât 200. De exemplu, dacă solicitați o pagină folosind un crawler fișier robots.txt va primi un HTTP-răspuns egal cu 403 ( „Forbidden“), el ignoră complet conținutul fișierului robots.txt, inclusiv interzicerea indexare anumite pagini.
  3. Prezența simbolurilor chirilice în fișier. În special, această eroare a început să apară atunci când a devenit posibilă scrierea de adrese URL în litere chirilice. De exemplu, dacă directiva Host (puncte către oglinda principală a site-ului) scrie lyutik.vetochki.rf, atunci o astfel de intrare va fi ignorată. În astfel de cazuri, trebuie să transmiteți astfel de adrese URL în Unicode.
  4. Dimensiunea fișierului txt depășește 32 KB.

În final, prin robots.txt, observăm că nu este necesar ca site-ul să o aibă. Pentru resursele de Internet simple de două pagini, de exemplu, creditarea paginării unui astfel de fișier va fi superfluă. Dacă aveți, corectitudinea conținutului său poate fi verificată pe pagina Yandex. Webmaster - webmaster.yandex.ru/robots.xml. Încărcați fișierul într-un formular special și vedeți ce erori are.

Fișier Sitemap

Principiile indexării site-ului

Acest fișier specifică ce pagini vor fi indexate. Desigur, puteți să le îndreptați către robotul de căutare în alte moduri. De exemplu, navigare prin meniuri, mâncăruri de paine, legare internă.

Dar, în primul rând, dacă aveți o pagină de destinație care poate fi accesată numai printr-o legătură externă, atunci puteți să o indexați numai cu ajutorul unei sitemap-uri.

În al doilea rând, în sitemap-ul cu ajutorul:

  • etichetă puteți specifica prioritatea indexării;
  • etichetă rata de reîmprospătare a unei anumite pagini.

Această informație nu este directivă pentru robot, dar va fi în mod necesar luată în considerare.

Erori frecvente în fișierul sitemap

  1. Plasarea unei sitemap-uri pe un alt site. Adesea, acest lucru se întâmplă atunci când un serviciu este utilizat pentru a genera un astfel de fișier. În acest caz, serviciul plasează o hartă a site-ului dvs. acasă.
  2. Pe pagina unde este localizată harta site-ului, este instalată o redirecționare.
  3. Erori grave în interiorul fișierului sitemap. De exemplu, nu există niciun șir care să indice codificarea.

Verificați corectitudinea fișierului sitemap de pe pagina Yandex.Webmaster - webmaster.yandex.ru/ sitemaptest.xml.

În a doua parte a articolului: "Principiile indexării site-ului. Partea a doua "vom vorbi despre principiile de lucru cu oglinzi, despre pagini duplicate, despre erori la utilizarea codurilor HTTP. Și încă o dată, subliniem că setarea corectă a indexării site-ului poate contribui semnificativ la promovarea acestuia.

SHARE

Articole similare