WebbanalysKeymetrics

Till yttermera visso

Google har nyligen valt att dela med sig av mer data i sin Webmaster Tools lösning och det ger onekligen en webmaster mer insikt i vad som händer hos Google. Dessvärre bekräftas att de siffror som Google redovisar är inte överensstämmande med verkligheten, och varje webmatser som litar på Google's siffror bör ta dem med en stor nypa salt. Använd endast egen data, och undvik felaktiga siffror i dina beräkningar.

TL;DR

Rapporter baserade på sampling kommer aldrig visa rätt, de är de facto fel från början eftersom inte hela datamängden analyserats. Varför nöja sig med sampling när man kan se korrekta mätvärden och ta mer välgrundade beslut på dessa? Ta data från Google som inte finns att påträffa någon annanstans men använd om möjligt data som är validerat och pålitligt vid beräkningar.

Mer insikt ger klarhet

Den som registrerar sin sajt hos Google kan ta del av en hel del information om den exponering den egna sajten får i Google's sökresultat. Med Webmaster Tools kan en hel del matnyttigt inhämtas, och nu med en utökning av det data Google delar med sig av har ett nyckeltal äntligen blivit tillgängligt för alla.

Gnissel i maskinerietKlickfrekvensen som nu redovisas gör det enkelt att värdera exponeringsmängden kontra klickfrekvensen, ett mycket intressant mätvärde som kan användas till mycket. Men med risk för att kasta grus i maskineriet är det klart att man inte kan köpa Google's siffror som sanning.

En sak som varje seriös webbanalytiker bör göra med det data som används i analyser är att validera dem, data som inte är korrekt blir ju inte precis mer korrekt efter att ha gått i genom matematiska formler. Detta blir snabbt uppenbart när det gäller siffror från Google.

Oklart kring klickfrekvens

Ett mätvärde som dyker upp i Webmaster Tools under avdelningen Populäraste sökorden är kolumnen klickfrekvens (eng. clickthrough):

Clickthrough is the number of times searchers clicked on that query’s search results to visit a page from your site

Klickfrekvens enligt GoogleHär börjar det bli tämligen uppenbart att något inte stämmer med siffrorna, för de 4 sökfraserna som fick 10 eller fler i klickfrekvens visar det sig att egna mätningar ger:

insticksmoduler 40
insticksmoduler firefox 33
webbanalys 27
webbstatistik 23

Kejsarens nya räknare

På enbart dessa 4 sökfraser så redovisas endast ~62% av de faktiska klicken vilket är inte så lite förvånande, frågan om hur mycket som inte räknas in blir plötsligt uppenbar att fråga sig. Än mer förvånande blir det när en jämförelse med antalet unika besökare från Google's sökresultat över samma tidsperiod.

En betydligt mer korrekt beräkning Det visar sin snarare förefalla vara så att klickfrekvensen är antalet unika besökare som klickat på sökfraserna. Annars är slutsatsen att de mätningar som Google gör är kraftigt drabbade av datablödning, d.v.s. att mätdata som de borde registrera i detta fall helt enkelt inte kommer den tillhanda.

Men till och med när man jämför unika besökare ifrån egen mätning med 1:a parts cookie mot vad Google visar i klickfrekvens så kommer Google enbart upp till 73%. Med en så pass kraftig skillnad på en liten volym av transaktioner känns det definitivt lite osäkert att lita på dessa värden i större sammanhang.

Helt klart är att något inte står rätt till med vad man ser, och fler frågor dyker osökt upp som varför man inte redovisar alla värden utan endast <10 om det varit mindre än 10 (unika?) som klickat på resultatlänkarna. Av 151 sökfraser (frågor enligt Google's namnsättning) så är det på denna lilla sajt endast 4st som lyckas passera den magiska gränsen.

Resten förblir kvar i dimman eftersom dessa värden enstaka siffervärden under 10 tydligen är svårare att redovisa än allt över 10.

En intressant iakttagelse är att vid 3 siffriga tal eller större visar det sig att avrundningssjukan sparkar in, Google tycks ha svårt att redovisa exakta tal. Frågan är osökt hur många av dessa siffror stämmer. Med tanke på att Google Analytics inte mäter webbläsare som inte kör JavaScript, och därmed har en distinkt felkälla i sina mätningar, är det uppenbart att Google mätningar inte är så solida som man skulle önska. Av den anledningen bör man komplettera deras mätningar med egen validerad data innan beräkningar utförs.

Det enda just nu relativt pålitliga mätvärdet i rapporten Populära sökfrågor är mätvärdet fråga (i.e. sökfras), och eftersom detta värde inte finns att hitta någon annanstans så får man lita på vad Google redovisar.

I de blindas rike

För perioden 15 Mars till 15 April 2010 kan (med en kombination av mätvärden från Google och Sitestat) konstateras att 87,42% av alla unika sökfraser klickats på i vilken denna sajt varit synlig i sökresultaten. Märkligt nog så har Google enbart sett 28,44% av dessa klickningar, något som ju talar till Google's nackdel att mäta webbtrafik så bristfälligt!

Man kan tro att klickfrekvens är en felaktig rubrik på mätvärdeskolumnen, men clickthrough heter det även på Engelska. Vad detta värde egentligen står för förblir oklart, men förmodligen handlar det om unika besökare. För när man med analys av loggfiler som 2:a kontrollpunkt dessutom ser mer klickningar från Google är det svårt att annat än tro att deras beräkningar sker på ett bristfälligt dataset.

Det är bra med ökad inblick i det data som Google har på sökresultat som berör en, men det hade varit önskvärt med trovärdiga siffror. Att enbart förlita sig på Google's siffror är mycket vanskligt, dessa visar sig gång efter annan ha alltför mycket avvikelser. Allt talar för att Google i rapporterna från Webmaster Tools använder sig av sampling förutom att Google's data insamling blöder data. Webbanalys baserat på sampling är ett säkert sätt att dra felaktiga slutsatser.

Externa länkar:

Google SERP CTR Data by Search Rank
More data and charts in Top Search Queries
Sampling
New Google Webmaster Tools Keyphrase Data is 70% Useless

---