Schlagwort-Archive: PageRank

Der PageRank und der Sprachraum

Der PageRank fasziniert die Leute, die sich mit Suchmaschinenoptimierung beschäftigen. Er mißt den Grad der Verlinkung einer Website. Je besser eine Seite verlinkt ist, desto höher der PageRank. Und je höher der PageRank einer Seite ist, desto höher ist der Wert eines Links diese Site für eine andere Site.

Der PageRank wächst nicht gleichmäßig, sondern vermutlich um einen Faktor Fünf. Das heißt, man braucht für einen PageRank von 2 ungefähr fünf Mal so viele Links wie für einen PR von 1. Für einen PR 3 braucht man entsprechend 25 Mal mehr als für PR 1 und so weiter.

Das mag ein nettes Maß für die Qualität einer Website sein, hat jedoch einen entscheidenden Haken, den Google meines Wissens nach bisher nicht berücksichtigt hat: die Menschen verlinken bevorzugt auf Websites ihres eigenen Sprachraums.

Die Sprachenwelt des Internet ist natürlich wesentlich anders als die reale Sprachwelt: Die lingua franca des Web ist Englisch. Daneben gibt es nur eine Handvoll Sprachen im Web mit nennenswerten Zahlen an Websites: Spanisch, Französisch, Deutsch, Russisch, Mandarin und vermutlich Hindi, Portugiesisch und Arabisch. Die Afrikaner und viele Inder, die Websites betreiben dürften Englisch oder Französisch als Sprache bevorzugen, um eine größere Gruppe von Menschen zu erreichen. Internet ist in Indien immer noch selten und teuer und es dürfte daher wenige Leute geben, die eigene Websites betreiben. Zumal auch hier Netzwerke wie Facebook an die Stelle privater Websites getreten sind.

Das gilt aber auch für kleine europäische Sprachräume: Die Skandinavier dürften ganz gut mit Internet versorgt sein. Oder Osteuropa mit einer recht brauchbaren Versorgung mit Internet.

Alle diese Sprachräume haben eines gemein: Ihre Websites können noch so gut sein, sie könnten nie quantitativ so viele Links aufbauen wie englisch-sprachige Websites. Angloamerikanische Weblogs wie TechCrunch profitieren überwigend davon, dass sowohl englische als auch anderssprachige Websites auf seine Artikel verlinken. Dass TechCrunch seinerseits auf einen deutschen Blog verlinkt ist vielleicht noch denkbar, aber würde TechCrunch wohl auf einen norwegischen, estnischen oder Suaheli-Blog verlinken? Wahrscheinlich äußerst selten.

Hier stoßen die quantitativen und qualitativen Methoden von Googles PageRank schnell an ihre Grenzen. Es ist aber albern, einer englischen Site einen PR von 10 zu geben, aber einer polnischen Site einen solchen PR zu verweigern, wenn sie eben so gut.

Allerdings sollte man dem PageRank nicht so viel Gewicht beimessen. BWLer lieben Rankings und Zahlen. Aber eine Website mit schlechter On-Site-Optimierung profitiert weniger von einem guten Rank, während eine gut optimierte Site in ihrem Erfolg von einem schlechten Rank nicht allzusehr betroffen ist. Ärgerlich wird es etwa dann, wenn eine Website Geld verdienen will und der Wert von Bannerwerbung nicht an der Menge von qualifiziertem Traffic, sondern am PR gemessen wird.

Die Wahrheit ist irgend wo da drin – oder auch nicht

Suchmaschinen sind ein nützliches Instrument, doch um sie vernünftig verwenden zu können, sollte man wissen, wie sie funktionieren. Suchmaschinen wie Google produzieren ihre eigene Wahrheit, wie Wikipedia ihre eigene Wahrheit hat. Wikipedias Wahrheit basiert auf Belegen. Zu welchen Unfällen das führen kann, hat der Fall von und zu Guttenberg gezeigt. Ein Scherzkeks hat dem Herren mit den vielen Namen noch einen mehr spendiert. Andere Medien wie SpON sprangen auf und übernahmen die lange Liste von Namen inklusive dem überzähligen Vornamen. Ein Wikipedianer löschte zunächst den falschen vornamen im Artikel, sah sich nach weiteren Quellen um, fand sie im Spiegel und setzte den falschen Vornamen wieder ein. So wäre Herr Guttenberg im reifen Alter fast zu einem neuen Vornamen gekommen.

Wir kennen dieses Problem aus der wissenschaftlichen Forschung. Die Geisteswissenschaften greifen überdurchschnittlich stark auf Quellen zurück. Wer kritische Quellenanalyse betreibt, versucht natürlich, für umstrittene Informationen mehrere Quellen zu verwenden, wobei er das Risiko eingeht, dass sämtliche Quellen auch nur voneinander abgeschrieben haben. Wie etwa die vier Evangelisten des Neuen Testaments.

So funktioniert auch der Google PageRank. Der Erfolg der Wikipedia ist zuletzt Google zu verdanken. Bei sehr vielen – auch fachspezifischen – Themen spuckt Google als erstes Suchergebnis Wikipedia aus. Zumindest ist WP sehr oft auf der ersten Suchseite.

Auch wenn die Wikipedia-Artikel überwiegend in Ordnung sind, stellt sich doch die Frage, warumoffenbar alle auf deren Artikel verlinken, statt eine andere Quelle zu wählen, die vielleicht inormativer ist.

DerPageRank führt dazu, dass populäre Meinungen noch weiter gepuscht werden. Es entsteht ein Top-Ten-Effekt:

Nehmen wir an, ich suche Informationen zur Fotosynthese. Ich schaue mir die ersten zwanzig Suchergebnisse von Google an. Ich verlinke vier dieser Artikel auf meiner Website. Damit erhöhe ich die Wahrscheinlichkeit, dass der nächste Pflanzenneugierge genau auf die gleichen Suchergenisse zur Fotosynthese stößt wie ich. Und zwar auch dann, wenn er eben nicht von meiner Seite startet.

Statt also möglicherweise randständigere Aspekte der Fotosynthese erfahren zu können, wird er genau die gleichen Meinungen lesen, die ich gelesen habe. Er wird ebenfalls vier Ergebnisse aus den ersten zwanzig Ergebnissen verlinken. Und immer so fort.

Die Kritik richtet sich allerdings nicht gegen Google. Was imer google über sich selbst sagen oder denken mag: Google ist ein gewinnorientiertes Privatunternehmen. Die Kritik richtet sich gegen die Suchenden, die sich zu stark auf Googles Suchergebnisse verlassen.