Bepaal hoe Google uw inhoud indexeert met metatags

Er zijn veel zoekmachines, maar site-eigenaren geven er vooral om hun site geïndexeerd te krijgen op de almachtige Google. Een manier om beter te presteren op de zoekmachine is om gebruik meta robot-tags.

De meta robot tag is een consensus metatag tussen zoekmachines zoals Google, Yahoo en Bing. Het gebruik van de metatag is om webontwikkelaars toegangscontrole voor webpagina's te laten hebben, tegen crawlers van zoekmachines. Bijvoorbeeld, zoiets noindex zal voorkomen dat alle robots van de zoekmachines uw webpagina in hun index plaatsen.

De eigen robot van Google heet Googlebot. In deze post zullen we zien hoe we Googlebot uitsluitend via aanpakken Meta-tags.

Googlebot adresseren

Geef de meta op om Googlebot te adresseren naam zoals googlebot in plaats van gewoon robots. In dit voorbeeld wordt voorkomen dat Googlebot uw webpagina in hun index plaatst, maar nog steeds toestaan dat bots van Bing en Yahoo de pagina crawlen. Uw webpagina's kunnen dus nog steeds worden weergegeven in de zoekresultaten van Bing en Yahoo.

Google heeft een aantal speciale robots die door verschillende soorten inhoud crawlen, zoals Afbeelding, Nieuws, Video, Advertenties en Mobiel. Met Google kunt u deze robots afzonderlijk blokkeren. Als u bijvoorbeeld niet wilt dat uw website wordt weergegeven in de zoekresultaten van Google Mobile, kunt u de meta-robottag op de volgende manier opgeven:

De volledige lijst met bottypen van Google is te vinden op de pagina Crawlers van Google.

Voorkom beeldindexering

Het is erg irritant als je je auteursrechtelijk beschermde afbeelding gebruikt door iemand anders zonder je voorafgaande toestemming. Als u dit wilt voorkomen, kunt u voorkomen dat Google uw afbeeldingen in hun index plaatst.

Specificeer de meta-robot-tag met de waarde van noimageindex. Hiermee wordt voorkomen dat de robot alle afbeeldingen op de pagina indexeert en worden uw afbeeldingen niet weergegeven in de zoekresultaten van Google Afbeeldingen. Mensen zoeken hier meestal naar afbeeldingen.

Als alternatief kunt u de meta-naam als instellen Googlebot-image om specifiek te voorkomen dat Google-robots uw site voor afbeeldingen crawlen.

Voorkom vertalen

Google Chrome biedt de vertaling van een site in een vreemde taal naar de favoriete of lokale taal van de bezoeker, met behulp van Google Translate. Hoewel de vertaling van Google Vertalingen beter wordt, is deze voor sommige talen verre van perfect. De vertaling output kan soms echt eigenzinnig zijn.

Als u niet wilt dat Google uw webpagina's vertaalt, stelt u de googlebot-meta in op de waarde van notranslate, zoals zo.

Als u wilt voorkomen dat een bepaald gedeelte van de pagina wordt vertaald, kunt u de notranslate klasse binnen het element dat de inhoud omhult:

Google zal dit negeren

helemaal.

Voorkom indexering na een gespecificeerde tijd

U kunt ook voorkomen dat Google uw webpagina's na bepaalde tijd indexeert. Dit is met name handig voor webpagina's die alleen relevant zijn binnen een tijdsbestek, bijvoorbeeld een evenementregistratiepagina.

In dit geval wilt u waarschijnlijk de robot laten weten dat deze pagina niet moet worden gecrawld en geïndexeerd nadat het evenement is beëindigd, waardoor deze niet kan worden weergegeven in de zoekresultaten van Google..

Hiertoe geeft u de metatag op met de waarde van unavailable_after gevolgd door de tijdinfo. Het tijdformaat moet voldoen aan het RFC-850-formaat, bijvoorbeeld: donderdag 26-sep-14 10:00:00 UTC

Met het bovenstaande voorbeeld zal de Google-robot de pagina niet na 29 september overschrijden. De pagina zal uiteindelijk uit de index verdwijnen, maar u kunt nog steeds de pagina bewaren voor archivering in uw website.