Home | Blog | Leistungen | Projekte | Jobs | Kontakt | Impressum | Sitemap

Cuil.com - der Praxistest zur Indexgröße

1 Star2 Stars3 Stars4 Stars5 Stars (9 votes, average: 4.67 out of 5)
Loading ... Loading ...

Selten hat der Start einer Suchmaschine derart viel Aufsehen in der internationalen SEO-Szene hervorgerufen, wie es beim Launch von cuil.com der Fall ist.

Seit Montag stellt sich cuil [cool] dem kritischen Auge des Webnutzers, der aufgrund vollmündiger Ankündigungen (”die weltgrößte Suchmaschine”) besonders genau hinschaut. Wir haben dem Index mal auf den Zahn gefühlt…

Dass cuil den Suchgiganten Google mit diesen Aussagen nicht nur indirekt herausfordert, wird bei folgendem Zitat von der About Us-Seite deutlich:

Cuil searches more pages on the Web than anyone else—three times as many as Google and ten times as many as Microsoft.

Drei mal soviele Webseiten wie Google? Das wollten wir auf die Probe stellen.

Der Index-Test - Methodik:

Die 6000 am häufigsten verwendeten englischen Begriffe wurden bei cuil und Google abgefragt. Aus den jeweils zurückgegebenen Counter (Zähler der gefundenen Dokumente) beider Suchmaschinen wurde der Mittelwert errechnet.

Das Ergebnis:

Google Counter Mittelwert: 259.529.578
Cuil Counter Mittelwert: 67.475.313

And the winner is … Google! Die Differenz der beiden Counter: 192.054.265 Dokumente mehr für die Ergebnisse bei Google.

Ok, cuil wirbt nicht mit der Anzahl der erfassten Dokumente (wie Google), sondern mit der Anzahl an indexierten Webseiten. Aber bei einem dermaßen großen Vorsprung bei erfassten Dokumenten kann es bei der kommunizierten Zahl bei cuil nicht ganz Rund laufen. Auch die Ergebnisse, die wir erhalten haben, sprechen gegen die Ansage der weltgrößten Suchmaschine. So haben zum Beispiel zahlreiche Suchanfragen keine Treffer bei cuil zurückgegeben (diese ergebnislosen Anfragen gingen nicht in die Berechnung beim Index-Test mit ein).

Um das ganze auch etwas greifbarer zu gestalten, hier einmal ein Flächenvergleich der Suchmaschinen:

x-Achse: Alle abgefragten Begriffe von links nach rechts absteigend nach Counter-Ergebnis
y-Achse: Counter (Anzahl der Ergebnisse zu den Begriffen)

Dabei wird die nach wie vor bestehende Dominanz mehr als deutlich. Cuil schlägt Google weder bei den sehr häufig im Web vorkommenden Begriffen noch beim Keyword-Longtail, der insgesamt größeren Anzahl seltener vorkommender Begriffe (sprich dem lang gezogenen Teil der horizontalen X-Achse).

Die Größe des Index sagt natürlich längst nicht alles über die Qualität von Suchergebnissen aus. Stichwort: Relevanz. Die Ergebnisse zu liefern, die vom Nutzer tatsächlich gesucht werden, beschreibt das oberste Ziel der neuen Suchmaschine cuil. Dabei verfolge der Algorithmus im Gegensatz zu Google den vorwiegend semantischen Ansatz, weniger den Popularitätsfaktor (Backlinks). Weg von der Linkpopularität, hin zur inhaltlicher Relevanz gegeben aus dem Kontext.

Das funktioniert bei einigen allgemeinen Begriffen auch ganz gut. Vor allem die Auswahl nach verwandten Kategorien hilft bei der weiteren Einschränkung der Anfrage. Im Web 2.0-Stil schlägt uns cuil vor, in welche Richtung wir bei der Suche noch gehen können. Das ist ganz gut umgesetzt (nennt sich bei Google übrigens “Suggest” oder “verwandte Suchvorgänge”).

Geht es aber um drei oder mehr Begriffe pro Suchanfrage, ist man offenbar an die Grenzen der Fähigkeiten von cuil gestoßen. Die Ergebnisse scheinen sich häufig nicht für zusätzlich hinzugefügte Worte zu interessieren und bleiben stur bei den bereits erzielten Treffern oder geben, was noch sehr oft vorkommt, gar kein Ergebnis zurück.

Alles in allem verfolgt cuil einen guten Ansatz bei treffenden Ergebnissen zu einfachen Suchbegriffen. Da der Start von cuil gerade mal zwei Tage zurückliegt, warten wir mal ab, bevor wir die Ergebnisse im Einzelnen auseinandernehmen (durch fehlende Rechtschreibkorrektur finden Spammer zu tausenden in die ersten Plätze der Ergebnislisten bei Falschschreibweisen - Bsp.: Pizza Tennessie). Zudem bitte nur auf englisch suchen, deutsche Treffer sind momentan noch eine Zumutung.

Zum Schluss noch zwei Zitate der beiden Kontrahenten zur Größe eines Suchindex:

cuil:

Size matters because many people use the Internet to find information that is of interest to them, even if it’s not popular.

Google:

We don’t index every one of those trillion pages — many of them are similar to each other [...] that isn’t very useful to searchers. But we’re proud to have the most comprehensive index of any search engine, and our goal always has been to index all the world’s data.

Neben der frage “Wer hat den größten freien Speicherplatz bei kostenlosen Mail-Accounts?” wird es wohl zukünftig ein recht kindliches Gebalge um den Titel des Index-Königs geben.

p.s. der Bot von cuil heißt Twiceler und beachtet die robots.txt. Der User Agent lautet: Mozilla/5.0 (Twiceler-0.9 http://www.cuill.com/twiceler/robot.html)

Weitere Info’s und Einschätzungen zum Start von cuil bei DRISOL & dem SEOnauten

3 Antworten zu “Cuil.com - der Praxistest zur Indexgröße”

  1. Neue Suchmaschine “Cuil” | atw:blog sagt:

    [...] Im Search-Lab Blog gibt es noch einen sehr guten Vergleich zwischen CULI und [...]

  2. Blogistan Panoptikum KW30 2008 auf datenschmutz.net sagt:

    [...] viel Diskussion sorgte natürlich auch der Launch von cuil, immerhin waren hier einige Ex-Googlisten am Werk. Allerdings bringt nicht nur die Suche [...]

  3. SurferNo Gravatar sagt:

    Auf der Startseite von CUIL.COM kann es jeder seit nunmehr 2 Monaten unverändert nachlesen:

    Search 121,617,892,992 web pages

    Was soll das für eine Suchmaschine sein, die über Monate keine neuen Seiten indiziert? Das Ganze ist ein Flop.

Kommentar schreiben