Skip to content
Cum creezi și optimizezi un sitemap XML pentru Google

Cum creezi și optimizezi un sitemap XML pentru Google

Sitemap-ul XML este unul dintre cele mai simple și mai eficiente instrumente SEO tehnice disponibile proprietarilor de site-uri. El comunică direct cu Googlebot, indicând ce pagini există pe site-ul dvs. și oferind informații suplimentare despre prioritatea și frecvența de actualizare a acestora.

Fără un sitemap XML, Google trebuie să descopere paginile site-ului dvs. exclusiv prin crawling organic, urmând link-urile interne de la o pagină la alta. Pe site-urile mari sau pe cele cu arhitecturi mai complexe, această metodă poate lăsa pagini importante neindexate săptămâni sau luni.

Un sitemap bine structurat accelerează indexarea conținutului nou, ajută la redescoperirea paginilor actualizate și oferă Google o hartă completă a site-ului dvs. Beneficiile sunt cu atât mai mari pentru site-urile noi, cu puține link-uri externe, care depind de sitemap pentru descoperirea conținutului.

Această prezentare completă vă ghidează prin crearea, optimizarea și trimiterea sitemap-ului XML, cu accent pe bunele practici actuale recomandate de Google.

Cum creezi și optimizezi un sitemap XML pentru Google

Un sitemap XML valid respectă formatul standard definit de protocolul sitemaps.org. Structura de bază constă dintr-un element root urlset cu declararea namespace-ului, urmat de elemente url pentru fiecare pagină inclusă în sitemap.

Fiecare element url trebuie să conțină cel puțin tag-ul loc cu URL-ul complet al paginii, inclusiv protocolul (https://). Tag-urile opționale includ lastmod (data ultimei modificări), changefreq (frecvența de modificare estimată) și priority (prioritatea relativă a paginii față de celelalte pagini din site).

Google a declarat că folosește în principal tag-ul lastmod din sitemap, dacă acesta este consistent și corect. Tag-urile changefreq și priority sunt parțial ignorate, deoarece mulți proprietari de site le setează incorect sau arbitrar. Concentrați-vă pe acuratețea datelor lastmod.

Limitele tehnice ale unui sitemap XML standard sunt 50.000 de URL-uri și 50MB per fișier. Site-urile mari care depășesc aceste limite trebuie să folosească un sitemap index, care este un fișier XML ce listează multiple fișiere sitemap individuale.

Generarea sitemap-ului în WordPress

WordPress generează automat un sitemap XML de bază începând cu versiunea 5.5. Sitemap-ul standard WordPress include paginile statice, postările, categoriile și tagurile. Accesați sitemap-ul la adresa site.ro/wp-sitemap.xml.

Pentru mai mult control și funcționalități avansate, pluginuri SEO precum Yoast SEO sau Rank Math generează sitemap-uri optimizate cu mai multe opțiuni de configurare. Aceste pluginuri permit includerea sau excluderea tipurilor specifice de conținut, setarea priorităților și gestionarea sitemap-urilor pentru imagini și videoclipuri.

Configurați sitemap-ul pentru a exclude paginile fără valoare SEO: paginile de login, de administrare, de căutare internă, paginile de paginare sau paginile cu tag-uri noindex. Includerea paginilor irelevante în sitemap nu le ajută și poate dilua bugetul de crawlare alocat site-ului dvs.

Sitemap index pentru site-uri mari

Site-urile cu sute de mii de pagini trebuie să organizeze sitemap-urile în structuri ierarhice. Un sitemap index listează URL-urile fișierelor sitemap individuale, fiecare acoperind un tip de conținut sau o secțiune a site-ului.

O structură tipică pentru un site WordPress cu volum mare ar putea include: sitemap-post.xml pentru articole, sitemap-page.xml pentru pagini statice, sitemap-category.xml pentru categorii și sitemap-image.xml pentru imagini. Sitemap index-ul principal de la wp-sitemap.xml include referințe la toate acestea.

Sitemap-uri pentru imagini și videoclipuri

Google suportă extensii speciale ale protocolului sitemap pentru imagini și videoclipuri. Sitemap-ul de imagini permite indexarea imaginilor de pe site-ul dvs., inclusiv a celor care nu sunt linkate explicit în conținut sau care sunt încărcate dinamic prin JavaScript.

Extensia de sitemap pentru videoclipuri este esențială dacă publicați conținut video pe site. Include informații despre titlul videoclipului, descriere, durata, data publicării și URL-ul thumbnail-ului, ajutând Google să indexeze și să afișeze corect conținutul video în SERP.

Trimiterea sitemap-ului în Google Search Console

Generarea sitemap-ului este doar primul pas. Trebuie să îl trimiteți explicit în Google Search Console pentru a accelera procesarea sa de către Google. Accesați Indexare > Sitemaps din Search Console și introduceți URL-ul sitemap-ului.

Search Console afișează statusul sitemap-ului trimis, inclusiv numărul de URL-uri descoperite și numărul celor indexate. Diferența dintre aceste două cifre este importantă: un număr mare de URL-uri descoperite dar neindexate indică probleme de calitate a conținutului sau probleme tehnice care împiedică indexarea.

Actualizați sitemap-ul trimis în Search Console de fiecare dată când schimbați adresa sau structura sitemap-ului. Dacă mutați sitemap-ul la o adresă nouă, trimiteți noul URL în Search Console și lăsați redirecționarea 301 de la adresa veche.

Verificarea erorilor din sitemap

Search Console raportează erorile detectate în sitemap, cum ar fi URL-uri inaccesibile, URL-uri cu redirect, URL-uri noindex incluse în sitemap sau URL-uri care returnează erori. Fiecare tip de eroare necesită o investigare și o remediere specifică.

URL-urile cu redirect în sitemap nu sunt o eroare gravă, dar sunt o ineficiență. Googlebot urmează redirectul, dar consumă resurse suplimentare de crawling. Actualizați sitemap-ul cu URL-urile finale (post-redirect) pentru eficiență maximă.

Declararea sitemap-ului în robots.txt

Declararea locației sitemap-ului în fișierul robots.txt este o bună practică care permite oricărui motor de căutare să găsească automat sitemap-ul, nu doar Google. Adăugați pe o linie separată: Sitemap: https://www.site.ro/wp-sitemap.xml.

Această declarație este utilă în special pentru motoarele de căutare noi sau mai mici care nu verifică Search Console, dar urmăresc instrucțiunile din robots.txt. Un sitemap bine declarat crește vizibilitatea site-ului pe toate motoarele, nu doar pe Google.

Optimizarea conținutului sitemap-ului

Nu toate paginile merită să fie în sitemap. Includeți doar paginile cu conținut unic și de calitate, care adaugă valoare utilizatorilor. Excludeți paginile de utilitate internă, paginile generate dinamic cu conținut duplicat și paginile cu parametri URL de filtrare sau sortare.

Prioritizați includerea paginilor care nu sunt ușor de descoperit prin crawling organic din cauza adâncimii prea mari în arhitectura site-ului. O pagină la 5+ click-uri distanță de pagina principală poate să nu fie crawlată frecvent fără includerea ei în sitemap.

Mențineți sitemap-ul actualizat. Un sitemap cu URL-uri care returnează 404 sau cu date lastmod incorecte reduce credibilitatea sitemap-ului și implicit eficiența sa. Automatizați generarea și actualizarea sitemap-ului pentru a menține acuratețea datelor.

Frecvența de actualizare a sitemap-ului

Sitemap-ul trebuie actualizat de fiecare dată când adăugați sau modificați conținut semnificativ pe site. Pluginurile SEO din WordPress actualizează automat sitemap-ul la publicarea sau modificarea unui articol, asigurând că Google descoperă rapid conținutul nou.

Pentru site-urile cu publicare frecventă, setați un interval de regenerare a sitemap-ului de maxim câteva ore. Pentru site-urile cu publicare mai rară, regenerarea zilnică sau săptămânală este suficientă.

Sitemap-ul și calitatea indexării

Un sitemap nu garantează indexarea paginilor incluse. Google va indexa din sitemap doar paginile pe care le consideră de calitate suficientă. Dacă observați că un număr mare de URL-uri din sitemap nu sunt indexate, investigați calitatea conținutului de pe acele pagini.

Paginile cu conținut subțire, duplicat sau de slabă calitate nu vor fi indexate indiferent de câte ori le includeți în sitemap. Îmbunătățiți calitatea conținutului înainte de a reincluda paginile în sitemap și de a le retrimite în Search Console.

Sitemap-ul este un instrument de comunicare cu Google, nu o garanție de indexare. Tratați-l ca pe o hartă pe care o oferiți Googlebot, ținând cont că tot Google decide ce vizitează și ce indexează în final pe baza calității conținutului.

Sitemap-ul și bugetul de crawlare

Bugetul de crawlare reprezintă numărul de pagini pe care Googlebot le crawlează pe site-ul dvs. într-o perioadă dată. Un sitemap optimizat, care include doar paginile valoroase, ajută Googlebot să aloce eficient bugetul de crawlare disponibil.

Site-urile mari cu mii de pagini trebuie să acorde atenție deosebită bugetului de crawlare. Auditul tehnic SEO regulat al sitemap-ului asigură că bugetul de crawlare este cheltuit pe paginile cu cea mai mare valoare SEO, nu pe pagini duplicate sau irelevante.

Comments (0)

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Back To Top