In einer Ausgabe des Google SEO-Podcast "Search Off the Record" geht es unter anderem um die Frage, wie Google die Suchanfragen verarbeitet und passende Ergebnisse auswählt. Obwohl Google keine genauen Details dazu nennt, wie Suchergebnissen genau gerankt werden, zeigt die Beschreibung von Gary Illyes im Podcast den Ablauf dennoch recht anschaulich. Wir möchten euch diesen Einblick etwas genauer erklären und haben daher alles wichtige hier zusammengefasst!

Jeder Suchprozess beginnt mit der Eingabe eines Suchbegriffs durch einen Nutzer - soweit aus Nutzersicht noch nichts Spektakuläres. Die Suchanfrage durchläuft dabei Googles Systeme in zwei Richtungen: zuerst nach unten und danach wieder nach oben. Auf ihrem Weg passiert die Suchanfrage diverse Komponenten des Systems in unglaublicher Geschwindigkeit. Eine dieser Komponenten sorgt für das Parsen, also das Aufarbeiten sowie für das Verstehen der Suchanfrage: 

"But going back to the higher level serving system, what we start with is a query from the user. That query is traveling in the serving system two ways: one is going down, and one is going up. When going down, it passes several systems, which I think we can cover, or at least most of them. One would be the query parsing and understanding system."

Danach folgt eine Art Router, der dafür sorgt, dass die Suchanfrage die verschiedenen Indizes erreicht. Gerade für die Universal Searches, also für Suchergebnisseiten mit unterschiedlichen Arten von Ergebnissen, ist dieser Schritt extrem wichtig. So können zum Beispiel passende Bilder, News, Produkte oder Videos herausgesucht werden.

Im Fall der Websuche setzt sich der Weg danach fort zum ausliefernden Index. Dort passieren einige wichtige Dinge, die nicht alle im Detail genannt werden. Ein Bestandteil ist aber eine sogenannte Posting List, auf deren Grundlage die Ergebnisse generiert werden, die zu einer Suchanfrage passen könnten. Es werden entsprechenden Dokumente ausgewählt und im Anschluss schaltet sich das Ranking System ein und sortiert die gefundenen Ergebnisse:

"Then in the case of the web, the parsed query travels down to our serving index. That's where some of the magic happens, some of the magic that we already covered. For example, in a previous episode, we were talking about posting lists. We are going to dedicate more time to this in a future episode. But based on the posting list, we find the results that might satisfy the user's query. We select those documents, and then we start pushing them back up. The ranking system kicks in and starts ranking the results that we've retrieved from our index."

Für das Ranking werden dabei Kriterien wie Relevanz zu einem Thema, die Qualität, der Inhalt und Hunderte von weiteren Rankingfaktoren angewandt - dies ist der Knackpunkt, an welchem sich Informationen und Daten mit gutem SEO vom Rest abheben. Die Ergebnisse setzen ihren Weg danach fort und gelangen wieder an den Router, der die Suchanfragen an die verschiedenen Schichten des Index gesandt hat. Jetzt wird auf Ergebnisse von anderen Indizes gewartet. Kommen Ergebnisse innerhalb der vorgegebenen Zeit, werden diese unter die Suchergebnisse gemischt - fertig ist die Universal Search-Ergebnisseite.

"Here, you can think of topicality, for example-- essentially, relevance-- that plays a huge factor in ranking than the quality of the results, the content, and-- I don't remember how we say it anymore-- but probably hundreds of other signals are taken into account for determining an order for the results that we retrieved from our serving index. Then it goes further up in the stack. Now, we reach that router again that was sending the queries to the different index tiers. Here, we wait a little bit for the other index's responses. If we get anything in the allotted time, then we would try to push the received results among the web results. That is, essentially, what universal search is."

Alle der beschriebenen Schritte finden innerhalb weniger Millisekunden statt, weshalb jedem System nur eine bestimmter Zeitraum zur Antwort eingeräumt wird. Wenn ein Teil des Google Systems ausnahmsweise nicht rechtzeitig antwortet, werden dessen Ergebnisse nicht einbezogen. Im weiteren Schritt werden lediglich Anzeigen hinzugefügt und die Ergebnisse in ein Template eingebracht. Ausnahme bilden dabei kritische Inhalte, wie die regulären Web Ergebnisse - auf diese wird immer gewartet:

"It's blazing fast. Every system has an allotted time for responding. If they don't respond in that time, then we would not wait for them, unless they are critical for the page. For example, for web results, we would always wait because without results, it's kind of weird."

Anders bei Anzeigen oder Ergebnissen aus Google Maps , welche nicht als kritisch gelten. Wenn sie zu spät geliefert werden, erscheinen die Suchergebnisse ohne sie. Das zeigt, wie wichtig die Optimierung der Ladezeiten ist, denn andernfalls können Inhalte, trotz besserer Qualität, erst auf den weiteren Suchergebnisseiten landen. 

Eine wichtige Rolle im gesamten Prozess spielt auch das Caching. Sucht jemand zum Beispiel nach "Kekse in meiner Umgebung", dann wird er vermutlich aufgrund der geographischen Position immer zum selben Rechenzentrum geleitet. Nach der ersten “Kekssuche” würden weitere Ergebnisse in der Regel aus dem Cache ausgespielt werden, so dass nicht der gesamte bisher beschriebene Weg durchlaufen werden muss. Das führt zu einer schnelleren Ausspielung der Ergebnisse:

"Plus, the second thing is that there is lots of caching going on. If people search for "cookies in my area," then they are very likely routed to the same data center because of the geographic area, and it just makes sense to route them to the same data center. There, we would very likely-- after the first 'cookie' query, we would return results from a cache, so we wouldn't even go down the whole stack and find new results for a certain time, which is order of minutes, but still, it helps a lot with giving users speedier results."

Auch wenn im Podcast keine Details zur Anwendung der Rankingfaktoren auf die Suchergebnisse genannt werden, vermittelt die Beschreibung zumindest einen groben Einblick, wie Google die Ergebnisse für Suchanfragen auswählt. Besonders faszinierend dabei ist immer wieder die Geschwindigkeit, in der all das passiert. Tagtäglich über 5.5 Milliarden Mal weltweit.

[Beitrag von 01/22]