Abstract
Acest document detaliază modul de pagina – text și la nivel de setări pot fi utilizate pentru a ajusta modul în Googlepresents conținutul dvs. în rezultatele de căutare. Puteți specifica setările la nivel de pagină prin includerea unei pagini HTML meta tagon sau într-un antet HTTP. Puteți specifica setările la nivel de text cu atributul data-nosnippet
pe elementele HTML dintr-o pagină.,
utilizarea etichetei meta roboți
eticheta meta roboți vă permite să utilizați o abordare granulară, specifică paginii pentru a controla modul în care o pagină individuală ar trebui să fie indexată și difuzată utilizatorilor în rezultatele căutării Google. Loc roboți meta tagul <head>
secțiune dintr-o anumită pagină, astfel:
<!DOCTYPE html><html><head><meta name="robots" content="noindex" />(…)</head><body>(…)</body></html>
roboți meta tag-ul în exemplul de mai sus instruiește motoarele de căutare nu pentru a afișa pagina într-searchresults. Valoarea name
atribut (robots
) precizează că thedirective se aplică tuturor crawlerele., Pentru a aborda o anumită șenile, înlocuiți robots
valoarea name
atribut cu numele de crawler-ul care te adresezi.Crawlerele specifice sunt cunoscute și ca agenți utilizator (un crawler își folosește agentul utilizator pentru a solicita o pagină.) Crawlerul web standard Google are numele agentului utilizator Googlebot
. Pentru a preveni onlyGooglebot de indexare pagina dvs., actualizați eticheta după cum urmează:
<meta name="googlebot" content="noindex" />
Acest tag acum sarcina de Google special pentru a arăta această pagină în rezultatele de căutare., Ambelename
și content
atribute sunt non-sensibile la majuscule.motoarele de căutare pot avea crawlere diferite pentru Proprietăți sau scopuri diferite. Consultați lista completă a crawler-urilor Google., De exemplu, pentru a afișa o pagină în Google rezultatele de căutare web, dar nu în Știri Google, utilizați următoarele meta tag-ul:
<meta name="googlebot-news" content="noindex" />
Pentru a specifica mai multe crawlerele individual, de a folosi mai multe meta-tag-uri:
<meta name="googlebot" content="noindex"><meta name="googlebot-news" content="nosnippet">
Utilizarea X-Roboți de Tag-ul header-ului HTTP
X-Robots-Tag
poate fi folosit ca un element de antet HTTP de răspuns pentru un anumit URL. Orice directivă care poate fi utilizată într-o meta tag roboți poate fi, de asemenea, specificat ca un X-Robots-Tag
., Iată un exemplu de răspuns HTTP cu un X-Robots-Tag
instruirea crawlerele nu pentru a indexa o pagina:
HTTP/1.1 200 OKDate: Tue, 25 May 2010 21:42:43 GMT(…)X-Robots-Tag: noindex(…)
mai Multe X-Robots-Tag
antete pot fi combinate în cadrul de răspuns HTTP, sau puteți specifica o listă separată prin virgulă de directive. Aici este un exemplu de header HTTP de răspuns care are un noarchive
X-Robots-Tag
combinat cu un unavailable_after
X-Robots-Tag
.
X-Robots-Tag
poate specifica opțional un agent utilizator înaintea directivelor., De exemplu, următorul set de X-Robots-Tag
HTTP poate fi folosit pentru a permite condiționat arată de o pagină în rezultatele de căutare pentru motoare de căutare diferite:
HTTP/1.1 200 OKDate: Tue, 25 May 2010 21:42:43 GMT(…)X-Robots-Tag: googlebot: nofollowX-Robots-Tag: otherbot: noindex, nofollow(…)
Directivelor specificate fără un agent de utilizare sunt valabile pentru toate crawlerele. Antetul HTTP, numele agentului utilizator și valorile specificate nu sunt sensibile la majuscule.
Valabilă de indexare & servire directivele
următoarele directive pot fi folosite pentru a controla de indexare și de servire a unui fragment cu roboți meta tag și X-Robots-Tag
., În rezultatele căutării, un fragment este un scurt extras de text utilizat pentru a demonstra relevanța unui document pentru interogarea unui utilizator. Următorul tabel prezintă toate directivele pe care Google le onorează și semnificația lor. Fiecare valoare reprezintă o directivă specifică. Mai multe directive pot fi combinate într-o listă separată prin virgulă. Aceste directive sunt insensibile la majuscule și minuscule.
directive | |
---|---|
toate |
nu există restricții pentru indexare sau servire. Prezenta directivă este valoarea implicită și nu are niciun efect dacă este menționată în mod explicit., |
noindex |
nu afișați această pagină în rezultatele căutării. |
nofollow |
nu urmați linkurile de pe această pagină. |
nici unul |
echivalent cunoindex, nofollow . |
noarchive |
nu afișați un link în cache în rezultatele căutării. |
nosnippet |
nu afișați un fragment de text sau o previzualizare video în rezultatele căutării pentru această pagină., O miniatură statică a imaginii (dacă este disponibilă) poate fi încă vizibilă atunci când are ca rezultat o experiență mai bună a utilizatorului. Acest lucru se aplică tuturor formelor de rezultate ale căutării (la Google: Căutare web, imagini Google, descoperire). |
max-fragment: |
utilizați un maxim de valori speciale:
Exemplu: <meta name="robots" content="max-snippet:20"> |
max-imagine-preview: |
Setați dimensiunea maximă a unei imagini de previzualizare pentru această pagină în rezultatele de căutare. acceptat
|
max-video-preview: |
Folositi un maxim de Alte acceptate valori:
|
notranslate |
nu oferiți traducerea acestei pagini în rezultatele căutării. |
noimageindex |
nu indexați imaginile de pe această pagină. |
indisponibil_after: |
nu afișați această pagină în rezultatele căutării după data / ora specificată. Data / ora trebuie să fie specificate într-un format adoptat pe scară largă, inclusiv, dar fără a se limita la RFC 822, RFC 850 și ISO 8601. Directiva este ignorată dacă nu este specificat Exemplu: <meta name="robots" content="unavailable_after: 2020-09-21"> |
de Manipulare combinat de indexare și de servire a directivelor
puteți crea un multi-directiva de instruire prin combinarea roboți meta tag directivele cu virgule., Aici este un exemplu de meta-eticheta care instruiește crawlerele web să nu indexeze pagina și să nu se târască oricare dintre link-urile de pe pagina:
<meta name="robots" content="noindex, nofollow">
Aici este un exemplu care limitează fragment de text la 20 de caractere, și permite o imagine mare de previzualizare:
<meta name="robots" content="max-snippet:20, max-image-preview:large">
Pentru situațiile în care mai multe crawlerele sunt specificate împreună cu diferite directive, motorul de căutare va folosi suma negativă a directivelor., De exemplu:
<meta name="robots" content="nofollow"><meta name="googlebot" content="noindex">
pagina conțin aceste meta tag-uri va fi interpretat ca având un noindex, nofollow
directiva când s-a târât către Googlebot.
folosind atributul HTML data-nosnippet
puteți desemna părți textuale ale unei pagini HTML care să nu fie utilizate ca fragment. Acest lucru poate fi realizat pe aHTML-un element de nivel cu data-nosnippet
atribut HTML pe span
,div
și section
elemente., data-nosnippet
este considerat aboolean atribut, este valabil cu sau fără o valoare. Pentru a asigura lizibilitatea mașinii, secțiunea HTML trebuie să fie HTML valid și toate etichetele corespunzătoare trebuie închise în mod corespunzător.
Exemple:
Google redă de obicei pagini pentru a le indexa, însă randarea nu este garantată.Din acest motiv, extragerea data-nosnippet
se poate întâmpla atât înainte, cât și dupărendering. Pentru a evita incertitudinea De redare, nu adăugați sau eliminați atributul data-nosnippet
al nodurilor existente prin JavaScript., Când adăugați elemente DOM prin JavaScript, includețitributul data-nosnippet
după cum este necesar atunci când adăugați inițial elementul la DOM-ul paginii. Dacă elemente personalizate sunt utilizate, folie sau le face cu div
,span
sau section
elemente dacă aveți nevoie să utilizați data-nosnippet
.
folosind date structurate
roboții meta tag-urile guvernează cantitatea de conținut pe care Google o extrage automat din paginile web pentru afișare ca rezultate de căutare. Dar mulți editori folosesc, de asemenea, schema.,org date structurate pentru a faceinformații specifice disponibile pentru prezentarea căutării. Roboți meta tag limitări nu afectează utilizarea acelei date structurate, cu excepția article.description
șidescription
valori pentru date structurate specificate pentru alte lucrări de creație.Pentru a specifica lungimea maximă a unui anunț bazat pe aceste description
valori,utilizați max-snippet
roboți meta tag., De exemplu, recipe
structurate privind num-o pagină este eligibilă pentru includerea în rețeta carusel, chiar dacă textul de previzualizare wouldotherwise fi limitat. Puteți limita lungimea unui text preview cu max-snippet
,dar asta roboți meta tag nu se aplică atunci când informațiile sunt furnizate utilizând structurate cadrul bogat rezultate.pentru a gestiona utilizarea datelor structurate pentru paginile dvs. web, modificațitipurile de date structurate și valorile în sine, adăugând sau eliminând informații pentru a furniza numai datele pe care doriți să le puneți la dispoziție., De asemenea, rețineți că datele structurate rămân utilizabile pentru searchresults atunci când sunt declarate într-un element data-nosnippet
.
punerea în Practică a X-Roboți-Tag-ul
puteți adăuga X-Robots-Tag
de la un site HTTP răspunsuri prin configurationfiles a site-ului web server software. De exemplu, pe serverele web bazate pe Apache puteți utiliza.htaccess și httpd.fișiere conf. Beneficiul de a folosi un X-Robots-Tag
cu HTTPresponses este că puteți specifica plin de directive, care sunt aplicate la nivel global pe un site., Suportul expresiilor regulate permite un nivel ridicat de flexibilitate.
De exemplu, pentru a adăuga un noindex, nofollow
X-Robots-Tag
la HTTPresponse pentru toate .Fișiere PDF pe un întreg site, adăugați următorul fragment la rădăcina site-ului.fișier htaccess sau httpd.conf fișier pe Apache, sau a site-ului .conf fișier de pe NGINX
Apache:
<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow"</Files>
NGINX:
location ~* \.pdf$ { add_header X-Robots-Tag "noindex, nofollow";}
puteți folosi X-Robots-Tag
pentru non-HTML fișiere, cum ar fi fișiere de imagine în cazul în care utilizarea ofrobots meta tag-uri în HTML nu este posibil., Iată un exemplu de adăugare a unei directive noindex
X-Robots-Tag
pentru fișierele de imagini (.png, .jpeg, .jpg, .gif) peste un entiresite:
Apache:
<Files ~ "\.(png|jpe?g|gif)$"> Header set X-Robots-Tag "noindex"</Files>
NGINX:
location ~* \.(png|jpe?g|gif)$ { add_header X-Robots-Tag "noindex";}
Combinarea plin cu indexare / portie directivele
Roboți meta tag-uri și X-Robots-Tag
HTTP anteturile sunt descoperite atunci când un URL-ul este indexat.Dacă o pagină nu este permisă să se târască prin roboți.fișier txt, atunci orice informații despreindexarea sau servirea directivelor nu vor fi găsite și, prin urmare, vor fi ignorate., Dacă trebuie respectate directivele de indexare sau de administrare, URL-urile care conțin aceste directive nu pot fi refuzate de la extragere.