Google houdt niet van dubbele websites
Wanneer u wilt dat anderen uw website vinden, kunt u bijna niet om Google heen. Deze zoekmachine bekijkt miljoenen websites per dag en deelt die in naar relevantie. Iemand die uw site zoekt, typt een aantal zoektermen in. Al naar gelang de 'ranking' die Google aan uw website heeft toegekend, komt u hoger of lager in de lijst met zoekresultaten. Er zijn verschillende manieren om hoger of lager in de lijst te komen. Sommige legaal, sommige illegaal, waarbij alleen Google bepaalt wat mag en wat niet mag.
Zo beschouwt Google sinds kort het bestaan van meer websites met dezelfde inhoud als een - illegale - poging om hoger op de lijst van de zoekmachine te komen. Dit wordt bestraft met een fiks lagere positie in de lijst met zoekresultaten. Dit kan ook ten ontrecht gebeuren als uw website of webserver verkeerd is geconfigureerd; bijvoorbeeld wanneer u meer domeinnamen voor uw website in gebruik heeft. Het is dus van groot belang om te voorkomen dat Google u bijvoorbeeld dertig plaatsen in de ranking laat zakken.
Google bekijkt websites met speciale programma’s, die ‘spiders’ of ‘zoekmachine-bots’ worden genoemd. Om de database van de zoekmachine actueel te houden, bezoeken de spiders op gezette tijden de bij Google aangemelde websites. Deze zien echter niet veel meer dan een gewone menselijke bezoeker. En dat is de reden waarom ze soms de onjuiste conclusie trekken dat een website dubbel is uitgevoerd. Wat is er aan de hand en hoe kunnen die situatie vermijden?
We nemen Masc website – die meerdere domeinnamen heeft - als voorbeeld en laten zien hoe het niet moet en vooral hoe het wél moet.
Als eerste een overzicht van de situatie zoals Google die niet wil hebben:

Op dit plaatje zien we dat elk domein (http://www.masc.nl. http://software.masc.nl, en http://www.masc.eu) zijn eigen bronbestanden heeft. De spider kan alleen het blauwe gedeelte van het diagram zien, en ziet dus drie websites van Masc. Op de webserver staan fysiek ook drie websites met de bijbehorende bestanden opgeslagen. Aan iedere website op de server is één URL (webadres) gekoppeld. Als de tekst of een plaatje op één van de websites verandert, is dat niet zichtbaar op de overige sites. Een ander nadeel is dat Google de waardering (de ‘page rank’) over de drie websites verdeelt.
Een spider bekijkt alle drie de websites, omdat het voor de spider drie verschillende zijn. Als de inhoud van de drie sites niet gelijk is, is er uiteraard niets aan de hand. Google heeft geen problemen met meerdere bedrijfswebsites, zolang de inhoud maar niet hetzelfde is.
In bovenstaand voorbeeld zet Google conform hun regels de website 30 plaatsen terug bij de zoekresultaten. Er is echter ook een situatie denkbaar waarbij dat onterecht kan gebeuren:

De spider ziet hetzelfde als in de eerste situatie, namelijk drie dezelfde websites op drie verschillende domeinen. Echter, op de webserver is slechts één website gedefinieerd waar alle domeinnamen naartoe wijzen. Fysiek is er dus maar één website. Immers, als je iets aan de website op de server verandert, heeft dit effect op alle drie domeinen.
Een spider ziet geen verschil tussen de situatie waarbij de bron van de drie websites één en dezelfde is en die waarbij de websites kopieën van elkaar zijn. En hoewel er in dit laatste geval geen sprake is van opzet of kwade bedoelingen, kan Google de websites toch bestraffen met een lage ranking.
Om dit te voorkomen, moet de webmaster ervoor zorgen dat de spider wél ziet dat het één en dezelfde website is. De truc is om fysiek één website te maken, net als in bovenstaand voorbeeld, en daar één (hoofd)domeinnaam aan toe te wijzen. Vervolgens dienen de overige domeinnamen door te verwijzen naar het (hoofd)domein:

De spider die op bijvoorbeeld http://www.masc.eu binnenkomt, wordt meteen doorverwezen naar http://www.masc.nl. Als gebruiker kun je dit zien wanneer je in de adresbalk van de browser http:///www.masc.eu intypt. Na een druk op Enter verandert dit vanwege deze verwijzing meteen in http://www.masc.nl. Op deze manier snapt de spider dat masc.eu en masc.nl één en dezelfde website is. De spider bekijkt en beoordeelt alleen masc.nl om de page ranking te bepalen. En dat is de gewenste situatie.
Zoekmachines spelen een steeds belangrijkere rol in de marketing van bedrijven. Een goede vindbaarheid van een website kan het bedrijfsresultaat positief beïnvloeden en de concurrentiepositie verbeteren. Het is daarom van belang de ontwikkelingen op dit gebied nauwlettend in de gaten te houden.