Meta tag-ul, date-nosnippet, și X-Roboți de Tag-ul caietul de sarcini

octombrie 3, 2020

Abstract

Acest document detaliază modul de pagina – text și la nivel de setări pot fi utilizate pentru a ajusta modul în Googlepresents conținutul dvs. în rezultatele de căutare. Puteți specifica setările la nivel de pagină prin includerea unei pagini HTML meta tagon sau într-un antet HTTP. Puteți specifica setările la nivel de text cu atributul data-nosnippet pe elementele HTML dintr-o pagină.,

utilizarea etichetei meta roboți

eticheta meta roboți vă permite să utilizați o abordare granulară, specifică paginii pentru a controla modul în care o pagină individuală ar trebui să fie indexată și difuzată utilizatorilor în rezultatele căutării Google. Loc roboți meta tagul <head> secțiune dintr-o anumită pagină, astfel:

<!DOCTYPE html><html><head><meta name="robots" content="noindex" />(…)</head><body>(…)</body></html>

roboți meta tag-ul în exemplul de mai sus instruiește motoarele de căutare nu pentru a afișa pagina într-searchresults. Valoarea name atribut (robots) precizează că thedirective se aplică tuturor crawlerele., Pentru a aborda o anumită șenile, înlocuiți robotsvaloarea name atribut cu numele de crawler-ul care te adresezi.Crawlerele specifice sunt cunoscute și ca agenți utilizator (un crawler își folosește agentul utilizator pentru a solicita o pagină.) Crawlerul web standard Google are numele agentului utilizator Googlebot. Pentru a preveni onlyGooglebot de indexare pagina dvs., actualizați eticheta după cum urmează:

<meta name="googlebot" content="noindex" />

Acest tag acum sarcina de Google special pentru a arăta această pagină în rezultatele de căutare., Ambelename și content atribute sunt non-sensibile la majuscule.motoarele de căutare pot avea crawlere diferite pentru Proprietăți sau scopuri diferite. Consultați lista completă a crawler-urilor Google., De exemplu, pentru a afișa o pagină în Google rezultatele de căutare web, dar nu în Știri Google, utilizați următoarele meta tag-ul:

<meta name="googlebot-news" content="noindex" />

Pentru a specifica mai multe crawlerele individual, de a folosi mai multe meta-tag-uri:

<meta name="googlebot" content="noindex"><meta name="googlebot-news" content="nosnippet">

Utilizarea X-Roboți de Tag-ul header-ului HTTP

X-Robots-Tag poate fi folosit ca un element de antet HTTP de răspuns pentru un anumit URL. Orice directivă care poate fi utilizată într-o meta tag roboți poate fi, de asemenea, specificat ca un X-Robots-Tag., Iată un exemplu de răspuns HTTP cu un X-Robots-Tag instruirea crawlerele nu pentru a indexa o pagina:

HTTP/1.1 200 OKDate: Tue, 25 May 2010 21:42:43 GMT(…)X-Robots-Tag: noindex(…)

mai Multe X-Robots-Tag antete pot fi combinate în cadrul de răspuns HTTP, sau puteți specifica o listă separată prin virgulă de directive. Aici este un exemplu de header HTTP de răspuns care are un noarchive X-Robots-Tag combinat cu un unavailable_after X-Robots-Tag.

X-Robots-Tag poate specifica opțional un agent utilizator înaintea directivelor., De exemplu, următorul set de X-Robots-Tag HTTP poate fi folosit pentru a permite condiționat arată de o pagină în rezultatele de căutare pentru motoare de căutare diferite:

HTTP/1.1 200 OKDate: Tue, 25 May 2010 21:42:43 GMT(…)X-Robots-Tag: googlebot: nofollowX-Robots-Tag: otherbot: noindex, nofollow(…)

Directivelor specificate fără un agent de utilizare sunt valabile pentru toate crawlerele. Antetul HTTP, numele agentului utilizator și valorile specificate nu sunt sensibile la majuscule.

Valabilă de indexare & servire directivele

următoarele directive pot fi folosite pentru a controla de indexare și de servire a unui fragment cu roboți meta tag și X-Robots-Tag., În rezultatele căutării, un fragment este un scurt extras de text utilizat pentru a demonstra relevanța unui document pentru interogarea unui utilizator. Următorul tabel prezintă toate directivele pe care Google le onorează și semnificația lor. Fiecare valoare reprezintă o directivă specifică. Mai multe directive pot fi combinate într-o listă separată prin virgulă. Aceste directive sunt insensibile la majuscule și minuscule.

directive
toate	nu există restricții pentru indexare sau servire. Prezenta directivă este valoarea implicită și nu are niciun efect dacă este menționată în mod explicit.,
noindex	nu afișați această pagină în rezultatele căutării.
nofollow	nu urmați linkurile de pe această pagină.
nici unul	echivalent cu`noindex, nofollow`.
noarchive	nu afișați un link în cache în rezultatele căutării.
nosnippet	nu afișați un fragment de text sau o previzualizare video în rezultatele căutării pentru această pagină., O miniatură statică a imaginii (dacă este disponibilă) poate fi încă vizibilă atunci când are ca rezultat o experiență mai bună a utilizatorului. Acest lucru se aplică tuturor formelor de rezultate ale căutării (la Google: Căutare web, imagini Google, descoperire).
max-fragment:	utilizați un maxim de caractere ca un fragment textual pentru acest rezultat de căutare. (Rețineți că o adresă URL poate apărea ca mai multe rezultate de căutare într-o pagină cu rezultate de căutare.) Acest lucru nu afectează previzualizările imaginilor sau videoclipurilor. Acest lucru se aplică tuturor formelor de rezultate ale căutării (cum ar fi Google Web search, google Images, Discover, Assistant)., Cu toate acestea, această limită nu se aplică în cazurile în care un editor a acordat separat permisiunea de utilizare a conținutului. De exemplu, dacă editorul furnizează conținut sub formă de date structurate în pagină sau are un acord de licență cu Google, această setare nu întrerupe acele utilizări permise mai specifice. Această directivă este ignorată dacă nu este specificat . valori speciale: `0`: nu trebuie afișat niciun fragment. Echivalent cu `nosnippet`., `-1`: Google va alege lungimea fragmentului care consideră că este cea mai eficientă pentru a ajuta utilizatorii să descopere conținutul dvs. și să direcționeze utilizatorii către site-ul dvs. Exemplu: <meta name="robots" content="max-snippet:20">
max-imagine-preview:	Setați dimensiunea maximă a unei imagini de previzualizare pentru această pagină în rezultatele de căutare. acceptat `setting` valori: `none`: nu trebuie afișată nicio previzualizare a imaginii. `standard`: poate fi afișată o previzualizare implicită a imaginii., `large`: poate fi afișată o previzualizare mai mare a imaginii, până la lățimea portului de vizualizare.acest lucru se aplică tuturor formelor de rezultate ale căutării (cum ar fi Google Web search, google Images, Discover, Assistant). Cu toate acestea, această limită nu se aplică în cazurile în care un editor a acordat separat permisiunea de utilizare a conținutului. De exemplu, dacă editorul furnizează conținut sub formă de date structurate în pagină (cum ar fi AMP și versiuni canonice ale unui articol) sau are un acord de licență cu Google, această setare nu va întrerupe acele utilizări permise mai specifice., Editorii care nu doriți ca Google să utilizeze mai mari de imagini în miniatură atunci când AMP pagini și versiunea canonică a unui articol sunt prezentate în Căutare sau de a Descoperi trebui să specificați un `max-image-preview` valoarea `standard` sau `none`. Exemplu: <meta name="robots" content="max-image-preview:standard">
max-video-preview:	Folositi un maxim de secunde ca un fragment video pentru videoclipuri de pe această pagină în rezultatele de căutare., Alte acceptate valori: `0`: Cel mult, o imagine statică poate fi utilizată, în conformitate cu `max-image-preview` setare. `-1`: nu există nici o limită.acest lucru se aplică tuturor formelor de rezultate ale căutării (la Google: Căutare web, imagini Google, Videoclipuri Google, descoperire, asistent). Această directivă este ignorată dacă nu este specificat ., exemplu: <meta name="robots" content="max-video-preview:-1">
notranslate	nu oferiți traducerea acestei pagini în rezultatele căutării.
noimageindex	nu indexați imaginile de pe această pagină.
indisponibil_after:	nu afișați această pagină în rezultatele căutării după data / ora specificată. Data / ora trebuie să fie specificate într-un format adoptat pe scară largă, inclusiv, dar fără a se limita la RFC 822, RFC 850 și ISO 8601. Directiva este ignorată dacă nu este specificat valid., În mod implicit, nu există o dată de expirare pentru conținut. Exemplu: <meta name="robots" content="unavailable_after: 2020-09-21">

de Manipulare combinat de indexare și de servire a directivelor

puteți crea un multi-directiva de instruire prin combinarea roboți meta tag directivele cu virgule., Aici este un exemplu de meta-eticheta care instruiește crawlerele web să nu indexeze pagina și să nu se târască oricare dintre link-urile de pe pagina:

<meta name="robots" content="noindex, nofollow">

Aici este un exemplu care limitează fragment de text la 20 de caractere, și permite o imagine mare de previzualizare:

<meta name="robots" content="max-snippet:20, max-image-preview:large">

Pentru situațiile în care mai multe crawlerele sunt specificate împreună cu diferite directive, motorul de căutare va folosi suma negativă a directivelor., De exemplu:

<meta name="robots" content="nofollow"><meta name="googlebot" content="noindex">

pagina conțin aceste meta tag-uri va fi interpretat ca având un noindex, nofollow directiva când s-a târât către Googlebot.

folosind atributul HTML data-nosnippet

puteți desemna părți textuale ale unei pagini HTML care să nu fie utilizate ca fragment. Acest lucru poate fi realizat pe aHTML-un element de nivel cu data-nosnippet atribut HTML pe span,div și section elemente., data-nosnippet este considerat aboolean atribut, este valabil cu sau fără o valoare. Pentru a asigura lizibilitatea mașinii, secțiunea HTML trebuie să fie HTML valid și toate etichetele corespunzătoare trebuie închise în mod corespunzător.

Exemple:

Google redă de obicei pagini pentru a le indexa, însă randarea nu este garantată.Din acest motiv, extragerea data-nosnippet se poate întâmpla atât înainte, cât și dupărendering. Pentru a evita incertitudinea De redare, nu adăugați sau eliminați atributul data-nosnippetal nodurilor existente prin JavaScript., Când adăugați elemente DOM prin JavaScript, includețitributul data-nosnippet după cum este necesar atunci când adăugați inițial elementul la DOM-ul paginii. Dacă elemente personalizate sunt utilizate, folie sau le face cu div,span sau section elemente dacă aveți nevoie să utilizați data-nosnippet.

folosind date structurate

roboții meta tag-urile guvernează cantitatea de conținut pe care Google o extrage automat din paginile web pentru afișare ca rezultate de căutare. Dar mulți editori folosesc, de asemenea, schema.,org date structurate pentru a faceinformații specifice disponibile pentru prezentarea căutării. Roboți meta tag limitări nu afectează utilizarea acelei date structurate, cu excepția article.description șidescription valori pentru date structurate specificate pentru alte lucrări de creație.Pentru a specifica lungimea maximă a unui anunț bazat pe aceste description valori,utilizați max-snippet roboți meta tag., De exemplu, recipe structurate privind num-o pagină este eligibilă pentru includerea în rețeta carusel, chiar dacă textul de previzualizare wouldotherwise fi limitat. Puteți limita lungimea unui text preview cu max-snippet,dar asta roboți meta tag nu se aplică atunci când informațiile sunt furnizate utilizând structurate cadrul bogat rezultate.pentru a gestiona utilizarea datelor structurate pentru paginile dvs. web, modificațitipurile de date structurate și valorile în sine, adăugând sau eliminând informații pentru a furniza numai datele pe care doriți să le puneți la dispoziție., De asemenea, rețineți că datele structurate rămân utilizabile pentru searchresults atunci când sunt declarate într-un element data-nosnippet.

punerea în Practică a X-Roboți-Tag-ul

puteți adăuga X-Robots-Tag de la un site HTTP răspunsuri prin configurationfiles a site-ului web server software. De exemplu, pe serverele web bazate pe Apache puteți utiliza.htaccess și httpd.fișiere conf. Beneficiul de a folosi un X-Robots-Tag cu HTTPresponses este că puteți specifica plin de directive, care sunt aplicate la nivel global pe un site., Suportul expresiilor regulate permite un nivel ridicat de flexibilitate.

De exemplu, pentru a adăuga un noindex, nofollow X-Robots-Tag la HTTPresponse pentru toate .Fișiere PDF pe un întreg site, adăugați următorul fragment la rădăcina site-ului.fișier htaccess sau httpd.conf fișier pe Apache, sau a site-ului .conf fișier de pe NGINX

Apache:

<Files ~ "\.pdf$"> Header set X-Robots-Tag "noindex, nofollow"</Files>

NGINX:

location ~* \.pdf$ { add_header X-Robots-Tag "noindex, nofollow";}

puteți folosi X-Robots-Tag pentru non-HTML fișiere, cum ar fi fișiere de imagine în cazul în care utilizarea ofrobots meta tag-uri în HTML nu este posibil., Iată un exemplu de adăugare a unei directive noindexX-Robots-Tag pentru fișierele de imagini (.png, .jpeg, .jpg, .gif) peste un entiresite:

Apache:

<Files ~ "\.(png|jpe?g|gif)$"> Header set X-Robots-Tag "noindex"</Files>

NGINX:

location ~* \.(png|jpe?g|gif)$ { add_header X-Robots-Tag "noindex";}

Combinarea plin cu indexare / portie directivele

Roboți meta tag-uri și X-Robots-Tag HTTP anteturile sunt descoperite atunci când un URL-ul este indexat.Dacă o pagină nu este permisă să se târască prin roboți.fișier txt, atunci orice informații despreindexarea sau servirea directivelor nu vor fi găsite și, prin urmare, vor fi ignorate., Dacă trebuie respectate directivele de indexare sau de administrare, URL-urile care conțin aceste directive nu pot fi refuzate de la extragere.

Lima

Meta tag-ul, date-nosnippet, și X-Roboți de Tag-ul caietul de sarcini

Abstract

utilizarea etichetei meta roboți

Utilizarea X-Roboți de Tag-ul header-ului HTTP

Valabilă de indexare & servire directivele

toate

noindex

nofollow

nici unul

noarchive

nosnippet

max-fragment:

max-imagine-preview:

max-video-preview:

notranslate

noimageindex

indisponibil_after:

de Manipulare combinat de indexare și de servire a directivelor

folosind atributul HTML data-nosnippet

folosind date structurate

punerea în Practică a X-Roboți-Tag-ul

Combinarea plin cu indexare / portie directivele

Leave A Comment Anulează răspunsul