În comparație cu extensiile pentru sistemele CMS (de exemplu, plug-in-uri pentru WordPress), utilizarea instrucțiunilor directe în htaccess are o serie de avantaje incontestabile. Vom lista principalele dintre ele:
1. Reduceți sarcina pe MySQL. Suplimentele SEO accesează în mod regulat baza de date, deoarece sunt stocate informații despre configurația curentă. În același timp, redirecționările prin htaccess funcționează la nivel de server - utilizarea lor crește semnificativ performanța generală a proiectului.
2. Lucrul în condiții de acces limitat. Fișierul de configurare suplimentar vă permite să specificați setările pentru directoarele individuale. Datorită acestui lucru, puteți efectua ajustări fine chiar dacă resursa este găzduită pe un gazdă partajată și munca directă cu httpd.conf nu este posibilă.
3. Protecție suplimentară. Spre deosebire de robots.txt, directivele prescrise în htaccess sunt obligatorii pentru Apache. Acest lucru oferă un control eficient al indexării, precum și protecția sistemului împotriva spam-urilor și scanerelor.
Acum, să trecem de la teorie la practică și să începem cu cele mai renumite tehnici de optimizare interne cunoscute de mulți webmasteri.
Notă importantă: înainte de a utiliza metodele descrise mai jos, asigurați-vă că ați făcut copii de siguranță, mai ales dacă nu ați lucrat niciodată anterior cu Apache direct.
Capabilități de bază pentru htaccess
Mai jos sunt soluțiile gata făcute la problemele presante cu care se confruntă practic toți optimizatorii și webmasterii. Cu toate acestea, chiar și specialiștii cu experiență sunt înclinați să neglijeze rețetele de mai sus, ceea ce înseamnă că încă o dată vă amintiți elementele de bază.
1. Pagini de eroare
Dacă există probleme tehnice cu hostingul sau site-ul, se emite unul din codurile standard de stare HTTP. Utilizând directiva ErrorDocument, puteți seta redirecționarea automată a utilizatorilor la documentele html corespunzătoare. Htaccess va arăta astfel:
ErrorDocument error / errors / errors.html
De exemplu:
ErrorDocument 404 /errors/404.html
Deasupra, am refuzat accesul la site-ul pentru booterele de spam condiționate 1 și 2. Când încercați să scanați, va apărea o eroare standard 403.
Notă: tehnica de mai sus, în ciuda tuturor avantajelor, are un dezavantaj - este necesar să cunoașteți utilitatea User-Agent, pe care doriți să o interziceți. Spamatorii încearcă să ocolească o astfel de protecție, lăsând-o goală sau introducând informații aleatorii acolo. Pentru a contracara programele rău intenționate în acest caz, puteți folosi acest cod:
Această intrare vă permite să filtrați utilizatorii agenți goi și suspectați, precum și scanerele care utilizează cele mai populare metode de parsare a site-urilor web.
3. Interzicerea hotlink-urilor
Termenul "hotlink" se referă la conectarea la o pagină web a unui fișier (cel mai adesea imaginile) aflat pe resursele unor terțe părți. Nu numai că, de fapt, furați conținut - în timp ce creați sarcini suplimentare asupra proiectului. Este posibil să se combată acest lucru prin reglarea variabilei HTTP_REFERER în htaccess. Dacă valoarea sa nu corespunde cu numele serverului pe care este plasat originalul, imaginea va fi înlocuită cu un "stub" (de exemplu, o imagine cu drepturile dvs. de autor):
4. Lucrări tehnice
Dacă sunt planificate schimbări globale (reproiectarea sau adăugarea de noi funcționalități), este necesar să instalați un "stub". Mijloacele standard ale majorității motoarelor închid site-ul pentru toată lumea, ceea ce este foarte incomod. Cu toate acestea, o redirecționare personalizată prin intermediul htaccess vă permite să lăsați proiectul accesibil administratorului, în timp ce vizitatorii văd în același timp o pagină cu informații despre activitatea tehnică:
5. Configurarea memoriei cache
Timpul de răspuns al site-ului este, deși un minor, dar este totuși un factor de clasificare. În plus, cu o mare încărcare inevitabil, există probleme cu disponibilitatea, ceea ce înseamnă că botul de căutare nu poate indexa în mod adecvat pagini noi. Descărcarea serverului va ajuta la configurarea corectă a cache-ului în browserele vizitatorilor. Acest lucru se poate face adăugând parametrii necesari în anteturi.
Aici pentru fișierele cu extensiile listate am setat antetul Cache-Control, specificând o perioadă de stocare de 1 an prin variabila de vârstă maximă. Puteți reduce acest interval, dar rețineți - timpul este specificat în câteva secunde. Private specifică faptul că caching-ul trebuie efectuat numai pe partea utilizatorului, ocolind proxy-ul.
Regula pentru scripturi, stiluri, xml este cel mai bine scrisă separat, reducând timpul la câteva zile:
Paginile dinamice sunt cel mai bine excluse din cache în general:
De asemenea, puteți seta o perioadă de 30-60 de secunde (acest lucru nu va cauza practic probleme vizitatorilor, dar va contribui la reducerea sarcinii pe Apache în timp real).
6. Gestionați indexarea
Motoarele de căutare sunt înclinate să renunțe fără să se uite înapoi la instrucțiunile robots.txt. Acest lucru se întâmplă în special în cazul Google, care poate chiar să indice o pagină închisă accesând resursele printr-o legătură externă. O parte a problemei este rezolvată prin meta-tag-ul roboților, dar numai el poate fi specificat numai pentru html-document. Dacă doriți să ascundeți fișierul din ghearele "spider", ar trebui să vă referiți la htaccess, deoarece X-Robots-Tag acceptă toate directivele existente de indexare:
Această intrare indică faptul că conținutul paginii variază în funcție de User-Agent.
Configurarea unei redirecționări permanente
2. Splicarea domeniului cu www și fără www
Puteți spune că acestea sunt elementele de bază ale SEO tehnic, deoarece aceste reguli ajută la eliminarea conținutului dublu dublu și combină greutatea legăturilor primite. Există două soluții diferite, dintre care unul este legat de un domeniu specific, celălalt este universal. Ceea ce trebuie folosit este o chestiune de gust. Sintaxa este: