Cum să utilizați Sitemap-uri XML pentru a stimula SEO

04

august 2020

Cum să utilizați Sitemap-uri XML pentru a stimula SEO

De: Tree Web Solutions | Etichete: site xml, format site xml, tipuri de site, sitemap xml pentru imagini, sitemap video, sitemap mobil, sitemap html

Pe măsură ce web-ul evoluează, la fel și Google și SEO. Aceasta înseamnă că ceea ce este considerat cea mai bună practică este adesea în flux. Ceea ce ar fi putut fi un sfat bun ieri, nu este chiar azi.

Acest lucru este valabil mai ales pentru sitemap-uri, care sunt aproape la fel de vechi ca SEO în sine.

Problema este că, atunci când fiecare om și câinele lor au postat răspunsuri pe forumuri, au publicat recomandări pe bloguri și au amplificat opinii cu social media, este nevoie de timp pentru a sorta sfaturi valoroase în urma dezinformării.

Așadar, deși majoritatea dintre noi împărtășim o înțelegere generală a faptului că trimiterea unui sitemap la Google Search Console este importantă, este posibil să nu cunoașteți complexitatea modului de implementare a acestora într-un mod care conduce indicatorii de performanță SEO (KPIs).

Să clarificăm astăzi confuzia din jurul celor mai bune practici pentru sitemaps.

În acest articol acoperim:

  • Ce este un sitemap XML
  • Formatul de sitemap XML
  • Tipuri de planuri de sit
  • Optimizare indexare sitemap XML
  • Lista de verificare a celor mai bune practici pentru sitemap XML

Ce este un Sitemap XML

În termeni simpli, un sitemap XML este o listă a adreselor URL a site-ului dvs. web.

Acționează ca o foaie de parcurs pentru a spune motoarelor de căutare ce conținut este disponibil și cum se poate ajunge la acesta.

 

sitemap vs crawling site-ul web

În exemplul de mai sus, un motor de căutare va găsi toate cele nouă pagini dintr-un sitemap cu o vizită la fișierul sitemap XML.

Pe site-ul web, va trebui să sari prin cinci link-uri interne pentru a găsi pagina nouă.

Această abilitate a unui sitemap XML de a ajuta crawler-urile în indexarea mai rapidă este deosebit de importantă pentru site-urile web care:

  • Au mii de pagini și / sau arhitectură de site web profundă.
  • Adăugați frecvent pagini noi.
  • Schimbați frecvent conținutul paginilor existente.
  • Suferă de legături interne slabe și de pagini orfane.
  • Lipsește un profil de legătură externă puternic.

Notă: Trimiterea unui sitemap cu URL-uri noindex poate grăbi deindexarea. Acest lucru poate fi mai eficient decât eliminarea adreselor URL din Google Search Console dacă aveți multe de deindexat. Însă folosiți acest lucru cu grijă și asigurați-vă că adăugați temporar astfel de adrese URL doar pe planurile de sit.

Concluzii cheie

Chiar dacă motoarele de căutare pot găsi din punct de vedere tehnic adresele dvs. URL fără el, incluzând paginile dintr-un sitemap XML, indicați că le considerați ca pagini de destinație de calitate.

Deși nu există nicio garanție că un sitemap XML vă va aduce paginile înghesuite, cu atât mai puțin indexate sau clasate, trimitând una sigur vă crește șansele.

Format XML Sitemap

Un site de o pagină care folosește toate etichetele disponibile ar avea acest sitemap XML:

formatul etichetei sit-ului xml și etichetele

Dar cum ar trebui un SEO să folosească fiecare dintre aceste etichete? Toate valorile metadatelor sunt valoroase?

Loc (aka Locație) Etichetă

Această etichetă obligatorie conține versiunea absolută, canonică a locației URL. Ar trebui să reflecte cu exactitate protocolul site-ului dvs. (http sau https) și dacă ați ales să includeți sau să excludeți www.

Pentru site-urile internaționale, acesta este, de asemenea, unde puteți implementa manipularea hreflang.

Folosind atributul xhtml: link pentru a indica variantele de limbă și regiune pentru fiecare URL, reduceți timpul de încărcare a paginii, pe care celelalte implementări ale elementelor de legătură din anteturile <head> sau HTTP nu le pot oferi.

Yoast are o postare epică pe hreflang pentru cei care doresc să învețe mai multe.

Eticheta Lastmod (numită Last Modified)

O etichetă opțională, dar foarte recomandată, utilizată pentru a comunica ultima dată și ora modificată a fișierului.

John Mueller a recunoscut că Google folosește ultimele metadate pentru a înțelege când s-a schimbat ultima pagină și dacă ar trebui să fie accesată cu crawlere. Contradicând sfatul Illyes  în 2015.

Ultima dată modificată este deosebit de critică pentru site-urile de conținut, deoarece ajută Google să înțeleagă că sunteți editorul original.

Este, de asemenea, puternic pentru a comunica prospețimea, dar asigurați-vă că actualizați data modificării numai atunci când ați făcut modificări semnificative. Încercarea de a păcăli motoarele de căutare că conținutul dvs. este proaspăt , atunci când nu, poate duce la o penalizare Google.

Changefreq (numit Change Frecvență) Etichetă

A fost odată, această etichetă opțională a indicat cât de des se aștepta să se schimbe conținutul de pe URL la motoarele de căutare.

Dar Mueller a afirmat  că „frecvența schimbării nu joacă într-adevăr atât de mult rolul cu sitemap-uri” și că „este mult mai bine să specifici doar timbrul de timp direct”.

Etichetă prioritară

Această etichetă opțională care spune în mod evident motoarelor de căutare cât de importantă este o pagină în raport cu celelalte URL-uri pe o scară cuprinsă între 0,0 și 1,0. În cel mai bun caz, a fost doar un indiciu pentru motoarele de căutare și atât Mueller cât și Illyes au declarat clar că îl ignoră.

Concluzii cheie

Site-ul dvs. web are nevoie de un sitemap XML, dar nu neapărat prioritatea și schimbarea metadatelor de frecvență.

Utilizați cu precizie etichetele lastmod și concentrați-vă atenția asupra asigurării adresării adreselor URL potrivite.

Tipuri de site-uri

Există multe tipuri diferite de sitemap-uri. Să ne uităm la cele de care ai nevoie de fapt.

XML Sitemap Index

Sitemap-urile XML au câteva limite:

  • Cel mult 50.000 de adrese URL.
  • Limită de dimensiune a fișierului necomprimată de 50 MB.

Sitemap-urile pot fi comprimate folosind gzip (numele fișierului ar deveni ceva similar cu sitemap.xml.gz) pentru a economisi lățimea de bandă pentru serverul dvs. Dar, odată decupate, sitemap-ul încă nu poate depăși niciuna dintre limite.

Ori de câte ori depășiți oricare dintre limite, va trebui să împărțiți adresele URL în mai multe sitemap-uri XML.

Aceste sitemap-uri pot fi apoi combinate într-un singur fișier XML sitemap index, adesea numit sitemap-index.xml. În esență, o hartă pentru sitemap-uri.

Pentru site-urile web excepțional de mari care doresc să adopte o abordare mai granulară, puteți crea, de asemenea, mai multe fișiere index sitemap. De exemplu:

  • sitemap index-articles.xml
  • sitemap index-products.xml
  • sitemap index-categories.xml

Dar fiți conștienți că nu puteți cuibă fișiere index sitemap.

Pentru ca motoarele de căutare să găsească cu ușurință fiecare dintre fișierele dvs. sitemap simultan, veți dori:

  • Trimiteți indexul dvs. de sitemap la Google Search Console și Bing Webmaster Tools.
  • Specificați adresa URL (indexurile) sitemap-ului dvs. în fișierul dvs. robots.txt. Îndreptați motoarele de căutare direct pe site-ul dvs. în timp ce le primiți pe crawlere.

 

sitemap xml în roboți.txt

Puteți, de asemenea, să trimiteți sitemap-urile făcând clic pe Google.

Atenție: Google nu mai acordă atenție înregistrărilor hreflang din „sitemap-uri neverificate”, care consideră că Tom Anthony înseamnă cele trimise prin URL-ul ping.

Sitemap pentru imagini XML

Sitemap-urile de imagini au fost concepute pentru a îmbunătăți indexarea conținutului imaginii.

Cu toate acestea, în SEO, în zilele noastre, imaginile sunt încorporate în conținutul paginii, astfel încât vor fi accesate cu crawlere împreună cu adresa URL a paginii.

Mai mult, este cea mai bună practică să utilizați marcajul JSON-LD schema.org/ImageObject pentru a apela proprietățile imaginii motoarelor de căutare, deoarece oferă mai multe atribute decât o sitemap XML a imaginii.

Din această cauză, o sitemap de imagine XML nu este necesară pentru majoritatea site-urilor web. Includerea unei hărți sitemap ar risipi doar bugetul de accesare.

Excepție de la acest lucru este dacă imaginile vă ajută să vă conduceți afacerea, cum ar fi un site web de fotografii sau un site de comerț electronic care obține sesiuni de pagini de produse din căutarea Google Image.

Știți că imaginile nu trebuie să fie pe același domeniu ca site-ul dvs. web pentru a fi trimise într-un sitemap. Puteți utiliza un CDN atât timp cât este verificat în Search Console.

Sitemap video XML

Similar cu imaginile, dacă videoclipurile sunt esențiale pentru afacerea dvs., trimiteți un sitemap video XML. Dacă nu, o sitemap video este inutilă.

Salvați bugetul de accesare pentru pagina în care este încorporat videoclipul, asigurându-vă că marcați toate videoclipurile cu JSON-LD ca schema.org/VideoObject .

Sitemap Google News

Doar site-urile înregistrate cu Google News ar trebui să utilizeze această hartă.

Dacă sunteți, includeți articole publicate în ultimele două zile, până la o limită de 1.000 de adrese URL pe hartă de sit și actualizați cu articole noi imediat ce sunt publicate.

Spre deosebire de unele sfaturi online, sit-urile Google News nu acceptă adresa URL a imaginii.

Google recomandă utilizarea schemei.org image sau og: imagine pentru a specifica miniatura articolului dvs. pentru Google News.

Sitemap mobil

Acest lucru nu este necesar pentru majoritatea site-urilor web.

De ce? Deoarece Mueller sit-urile mobile confirmate sunt destinate doar paginilor de telefon. Nu pentru compatibilitate cu smartphone-uri.

Deci, dacă nu aveți adrese URL unice special concepute pentru telefoanele prezentate, un sitemap mobil nu va avea niciun beneficiu.

Sitemap HTML

Sitemap-urile XML au grijă de nevoile motoarelor de căutare. Sitemap-urile HTML au fost concepute pentru a ajuta utilizatorii umani să găsească conținut.

Întrebarea devine: dacă aveți o experiență bună a utilizatorului și legături interne bine elaborate, aveți nevoie de o hartă HTML?

Verificați afișările de pagini ale sitemap-ului dvs. HTML în Google Analytics. Șansele sunt, este foarte scăzut. Dacă nu, este un bun indiciu că trebuie să îmbunătățiți navigarea pe site.

Sitemap-urile HTML sunt în general legate în subsolurile site-ului web. Preluarea legăturilor de capital de la fiecare pagină a site-ului dvs.

Intreaba-te pe tine insuti. Este cea mai bună utilizare a capitalului respectiv? Sau includeți o hartă a site-ului HTML ca un nod pentru bunele practici ale site-ului web?

Dacă puțini oameni o folosesc. Iar motoarele de căutare nu au nevoie de el, deoarece aveți o legătură internă puternică și un sitemap XML. Are acea sitemap HTML având un motiv să existe? Aș argumenta nu.

Sitemap dinamic XML

Sitemap-uri statice sunt simple pentru a crea utilizând un instrument precum Screaming Frog.

Problema este că, imediat ce creați sau eliminați o pagină, site-ul dvs. este învechit. Dacă modificați conținutul unei pagini, sitemap-ul nu va actualiza automat eticheta de ultimmod.

Deci, dacă nu vă place să creați manual și să încărcați sitemap-uri pentru fiecare modificare, este mai bine să evitați sitemap-uri statice.

Sitemap-urile dinamice XML, pe de altă parte, sunt actualizate automat de server pentru a reflecta modificările relevante ale site-ului pe internet.

Pentru a crea o sitemap XML dinamică:

  • Cereți dezvoltatorului să codifice un script personalizat, asigurându-vă că furnizează specificații clare
  • Utilizați un instrument generator de sitemap dinamic
  • Instalați un plugin pentru CMS-ul dvs., de exemplu pluginul Yoast SEO pentru WordPress

Concluzii cheie

Sitemap-uri dinamice XML și un index de sitemap sunt cele mai bune practici moderne. Sitemap-urile mobile și HTML nu sunt.

Utilizați sit-uri de imagine, video și Google News doar dacă indexarea îmbunătățită a acestor tipuri de conținut conduce IP-ul dvs.

XML Sitemap Optimizare indexare

Acum pentru partea distractivă. Cum utilizați sitemap-uri XML pentru a conduce API-urile SEO.

Includeți numai pagini relevante pentru SEO în hărți sit XML

O sitemap XML este o listă de pagini pe care recomandați să fie accesate cu crawlere, care nu este neapărat în fiecare pagină a site-ului dvs. web.

Un păianjen de căutare ajunge pe site-ul dvs. web cu o „alocație” pentru câte pagini se va înghesui.

Sitemap-ul XML indică faptul că considerați adresele URL incluse ca fiind mai importante decât cele care nu sunt blocate, dar nu sunt în sitemap.

O folosești pentru a spune motoarelor de căutare „Aș aprecia cu adevărat dacă te-ai concentra mai ales pe aceste adrese URL.”

În esență, vă ajută să utilizați eficient bugetul de accesare.

Prin includerea doar a paginilor relevante pentru SEO, vă ajutați motoarele de căutare să-și înghesuie mai inteligent site-ul pentru a beneficia de o mai bună indexare.

Ar trebui să excludeți:

  • Pagini ne-canonice.
  • Pagini duplicate.
  • Pagini paginate.
  • Adrese URL bazate pe parametri sau sesiuni.
  • Pagini de rezultate ale căutării pe site.
  • Răspundeți la adresele URL de comentarii.
  • Partajează prin adresele URL de e-mail.
  • Adrese URL create prin filtrare care nu sunt necesare pentru SEO.
  • Arhiva pagini.
  • Orice redirecții (3xx), pagini lipsă (4xx) sau pagini de eroare a serverului (5xx).
  • Pagini blocate de roboți.txt.
  • Pagini cu noindex.
  • Pagini de resurse accesibile printr-o formă de gen principal (de exemplu, documente PDF de hârtie albă).
  • Pagini de utilitate utile pentru utilizatori, dar care nu sunt destinate să fie pagini de destinație (pagina de conectare, contactează-ne, politica de confidențialitate, paginile contului etc.).

Vreau să împărtășesc un exemplu de la Michael Cottam despre prioritizarea paginilor:

Spuneți că site-ul dvs. web are 1.000 de pagini. 475 din aceste 1.000 de pagini sunt conținut relevant SEO. Puneți în evidență acele 475 de pagini dintr-un sitemap XML, solicitând în mod esențial Google privarea indexării restului.

Acum, să zicem că Google parcurge aceste 475 de pagini și că, în mod algoritmic, se decide că 175 sunt „A”, 200 sunt „B +” și 100 „B” sau „B-”. Aceasta este o notă medie puternică și indică probabil un site web de calitate către care să trimită utilizatorii.

Contrastă-l împotriva trimiterii tuturor celor 1.000 de pagini prin sitemap-ul XML. Acum, Google se uită la cele 1.000 de pagini pe care le spui că sunt conținut SEO relevant și vede că peste 50 la sută sunt pagini „D” sau „F”. Nota medie nu mai arată atât de bine și asta îți poate dăuna sesiunile organice.

Amintiți-vă, însă, Google va folosi sitemap-ul dvs. XML doar ca indiciu asupra a ceea ce este important pe site-ul dvs.

Doar pentru că nu este în sitemap-ul dvs. XML nu înseamnă neapărat că Google nu va indexa acele pagini.

Când vine vorba de SEO, calitatea generală a site-ului este un factor esențial.

Pentru a evalua calitatea site-ului dvs., accesați raportarea referitoare la sitemap în Google Search Console (GSC).

Concluzii cheie

Gestionați bugetul de accesare prin limitarea adreselor URL de sitemap XML doar la paginile relevante SEO și investiți timp pentru a reduce numărul de pagini de calitate scăzută de pe site-ul dvs. web.

Efectuați complet raportarea site-urilor

 

GSC-sitemap-raport nou-vechi

Secțiunea sitemaps din noua Google Search Console nu este la fel de bogată în date decât cele oferite anterior.

Utilizarea principală este acum pentru a confirma că indexul dvs. sitemap a fost trimis cu succes.

 

sitemap-denumire

Dacă ați ales să utilizați convenții de denumire descriptive, mai degrabă decât numerice, puteți obține o idee pentru numărul de tipuri diferite de pagini SEO care au fost „descoperite” - de asemenea toate adresele URL găsite de Google prin sitemap-uri, precum și alte metode precum ca urmare a linkurilor.

În noul GSC, zona mai valoroasă pentru SEO în ceea ce privește sitemap-urile este raportul privind acoperirea indexului.

 

Cum să utilizați Sitemap-uri XML pentru a stimula SEO

Raportul va fi implicit la „Toate paginile cunoscute”. Aici poti:

  • Abordați orice problemă „Eroare” sau „Validă cu avertismente”. Acestea provin adesea din directivele roboților în conflict . Una rezolvată, asigurați-vă că vă confirmați remedierea prin raportul de acoperire.
  • Uită-te la tendințele de indexare. Majoritatea site-urilor adaugă continuu conținut valoros, astfel încât paginile „valide” (precum cele indexate de Google) ar trebui să crească constant. Înțelegeți cauza oricărei schimbări dramatice.
  • Selectați „Valid” și căutați detalii pentru tipul „Indexat, neprezentat în sitemap”. Acestea sunt pagini în care dvs. și Google nu sunteți de acord cu valoarea lor. De exemplu, este posibil să nu fi trimis adresa URL a politicii de confidențialitate, dar Google a indexat pagina. În astfel de cazuri, nu se întreprind acțiuni. Ceea ce trebuie să căutați sunt URL-urile indexate care decurg din manipularea necorespunzătoare a paginării , gestionarea deficitară a parametrilor , conținutul duplicat sau paginile rămase în mod accidental din sitemap-uri.

După aceea, limitați raportul la adresele URL relevante SEO pe care le-ați inclus în harta dvs. de hartă, schimbând meniul vertical în „Toate paginile trimise”. Apoi verificați detaliile tuturor paginilor „excluse”.

Motivele pentru excluderea adreselor URL a sitemap-ului pot fi puse în patru grupuri de acțiune:

  1. Câștiguri rapide : pentru conținut duplicat, canoncial, directive roboți, coduri de stare HTTP 40X, redirecționări sau excluderi de legalitate pun la dispoziție soluția corespunzătoare.
  2. Pagina de investigare : atât pentru excluderile „URL-ul trimis”, cât și pentru „anomalia crawl” investighează mai departe utilizând instrumentul Fetch ca Google.
  3. Îmbunătățirea paginii : Pentru paginile „Crawled - momentan nu sunt indexate”, consultați pagina (sau tipul de pagină, deoarece în general vor fi multe adrese URL ale unei rase similare) și link-uri interne. Șansele sunt, suferă de conținut subțire, conținut neiginal sau este orfan.
  4. Îmbunătățirea domeniului : pentru paginile „Descoperite - momentan nu sunt indexate”, Google notează motivul tipic de excludere, întrucât „au încercat să târască URL-ul, dar site-ul era supraîncărcat”. Nu te lăsa păcălit. Este mai probabil ca Google să fi decis „ nu merită efortul ” să se târască din cauza legăturii interne slabe sau a calității scăzute a conținutului văzută din domeniu. Dacă vedeți un număr mai mare dintre aceste excluderi, consultați valoarea SEO a paginii (sau tipurile de pagini) pe care le-ați trimis prin sitemap-uri, concentrați-vă pe optimizarea bugetului de accesare, precum și revizuiți arhitectura informațională, inclusiv parametrii, atât de la un link, cât și de la conținut perspectivă.

Indiferent de planul dvs. de acțiune, asigurați-vă că notați indicatorii de referință.

Cea mai utilă măsură pentru a evalua impactul eforturilor de optimizare a sitemap-urilor este rata de indexare „Toate paginile trimise” - calculată luând procentul de pagini valide din totalul adreselor URL descoperite.

Lucrați pentru a obține acest nivel peste 80%.

De ce nu 100%? Deoarece dacă v-ați concentrat toată energia pe asigurarea că fiecare URL relevantă SEO pe care o aveți în prezent este indexată, probabil că ați ratat oportunitățile de a vă extinde acoperirea de conținut.

Notă: Dacă sunteți un site web mai mare care a ales să descompună site-ul lor în mai mulți indici de sitemap, veți putea filtra după acei indici. Acest lucru nu vă va permite doar să:

  1. Vezi graficul de ansamblu la un nivel mai granular.
  2. Consultați un număr mai mare de exemple relevante atunci când investigați un tip de excludere.
  3. Abordează secțiunea de optimizare a vitezei de indexare.

Concluzii cheie

Pe lângă identificarea avertismentelor și a erorilor, puteți utiliza raportul de acoperire a indexului ca instrument de menținere a sitemap-ului XML pentru a izola problemele de indexare.

Lista de verificare a celor mai bune practici pentru sitemap XML

Investiți timp pentru:

✓ Includeți etichete hreflang în hărți sit XML

✓ Includeți etichetele <loc> și <lastmod>

✓ Compresează fișiere sitemap folosind gzip

✓ Utilizați un fișier index sitemap

✓ Utilizați sitemap-uri de imagini, videoclipuri și știri Google numai dacă indexarea conduce KPI-urile dvs.

✓ Generați dinamic sitemap-uri XML

✓ Asigurați-vă că adresele URL sunt incluse doar într-un singur sitemap

✓ Referințe URL sitemap index în robots.txt

✓ Trimiteți indexul sitemap-ului atât la Google Search Console, cât și la Bing Webmaster Tools

✓ Includeți doar pagini relevante pentru SEO în hărți sit XML

✓ Remediați toate erorile și avertismentele

✓ Analizați tendințele și tipurile de pagini valabile

✓ Calculați ratele de indexare a paginilor trimise

✓ Adresa cauzelor de excludere pentru paginile trimise

Acum, accesați propria hartă și asigurați-vă că o faceți corect.

Sursă: www.searchenginejournal.com

Distribuie această postare