Webbanalys

Hemsidan
 
Spam via hänvisarinformation
 
En plötslig ökning av antalet hänvisningar, från webbplatser du inte ens kände hade länkar till din webbplats, är ofta ett tecken på att din loggfil utsatts för spam via den hänvisarinformation som en webbserver noterar. Fenomenet är ingalunda nytt, utan förekommer sporadiskt i volym och frekvens. Oupptäckt snedvrider hänvisarspam mätvärden i webbstatistiken!
 
Oväntad ökning av hänvisningar
För den webmaster som analyserar sin webbtrafik baserat på loggfiler kan det ibland dyka upp avvikande data i rapporter avseende hänvisad trafik. Det är avvikande ur den aspekten när ett större antal sidvisningar och besök plötsligt verkar komma från hänvisningar från webbplatser som man inte känner till, d.v.s. att dessa webbplatser förefaller ha länkar som pekar mot den egna webbplatsen och att det verkar som om riktiga besökare skulle ha klickat på dessa.
 
Ännu värre blir det av att många som blir nyfikna efter att ha sett dessa hänvisare i sin webbstatistik klickar på länken till bluffhänvisaren, resultatet är ofta att reklamtyngda sidor laddas upp och i värsta fall kan trojaner och virus sändas till den intet ont anande besökaren.
 
Hänvisarspam blåser upp statistiken
Fenomenet heter hänvisarspam (eng. referrer spam) och orsakas av att någon aktiverar ett specialskrivet program som i den enklaste varianten endast anropar startsidan till din webbplats. Detta program anger en webbplats som man vill spamma in i loggfilerna som den hänvisande webbplatsen, och gör så ett antal gånger. Det finns ett antal andra mycket enkla tricks för att få det att se ut som om att en webbplats skickar trafik till din webbplats, t.ex. kan anrop till din hemsida läggas in i en bildtagg på en illvillig webbplats för att detta skall loggas som en hänvisning.
 
De mer avancerade programmen för hänvisarspam söker igenom en webbplats som en sökrobot, och varierar anropade sidor och frekvensen men även vilka webbplatser som anges som hänvisare. Anrop som kommer ifrån ett och samma IP nummer är enkelt att upptäcka, svårare är det med de spamprogram som körs över olika IP nummer.
 
Multipla anrop i tät följd avslöjar spam via hänvisningar

Enkelt är det också att upptäcka de enkla hänvisarspam som är vanligast eftersom anropen sker i klump under en mycket kort tidsrymd, ingen vanlig besökare skulle hinna med att anropa 5 olika sidor på 1 sekund (och då talar vi inte om framesidor). Gemensamt för de flesta liknande spamprogram är att de blockerar cookies vilket gör dem enklare att upptäcka, och försöker maskera sig i agent fältet som någon av de vanligast förekommande webbläsarna.
 
Vid en analys av hänvisarspam blir det ofta uppenbart att de som sysslar med denna typ av aktivitet uppenbarligen inte förstår hur ett webbanalyssystem fungerar, och bra är väl det. Eftersom en majoritet av de program som används vid hänvisarspam gör många anrop i följd med olika hänvisandesidor som källa kommer endast den första att synas i samband med en analys. Anledningen är att det saknas 30 minuters inaktivitet mellan sidanropen från ett givet IP nummer, skulle så vara fallet skulle varje anrop med hänvisarspam dyka upp i rapporterna. Däremot så resulterar ett stort antal anrop av detta slag att loggfilen växer snabbt i storlek.
 
Justering av mätvärden
För att webbstatistiken baserad på loggfiler skall vara rättvisande krävs att man arbetar aktivt med filtrering, och hänvisarspam är ännu ett moment som kräver en aktiv filtrering för att få rätsida på siffrorna. I och med att loggfiler är så enkla att manipulera krävs det mycket kontroller av den som analyserar sin besökstrafik med loggfiler som dataunderlag.
 
I vilken omfattning det förekommer att man utan att ha validerat de siffror som tagits fram med undermålig webbstatistik använder dessa som ett beslutsunderlag är osäkert, men att det förekommer har blivit uppenbart i ett flertal fall. I värsta fall förekommer det att man till och med underlåter att åtgärda felräkningen eftersom besöks- och sidvisningssiffrorna då minskar, rättvisande lägre siffror förefaller ibland vara mindre viktigt än höga siffror.
 
Minska felräkningen
Med en klient-insamlad webbstatistik så elimineras hänvisarspam, och det av den enkla anledningen att javascriptkoden för data- insamling måste köras på klienten (i.e. webbläsaren) för att ett anrop skall loggas. Eftersom hänvisarspam bygger på att med anropen få spammet loggat så sker så inte med denna teknik, och detsamma gäller robotanrop. M.a.o. så minimeras med klientinsamlad besöksdata den arbetsinsats som krävs för att fortlöpande filtrera bort sökrobotar och andra liknande händelser som snedvrider webbstatistiken.
 
Summering
All webbanalys bör utsättas för regelbunden kritisk granskning och validering, i samband med detta kan man finna de automatiserade besök vilka syftat till att enbart skapa avtryck för hänvisarspam och snedvrider sidvisnings- och besökssiffrorna. En stor mängd anrop från ett IP nummer under enstaka dagar med olika hänvisandesidor angivet är en indikation på hänvisarspam, men även vad som förefaller vara besök från inlänkar på okända webbplatser.
 

 
Länk till mer information:
Referer Spam
 
«««