28 juli 2008
De startende zoekmachine Cuil.com (uitgeproken als 'cool') presenteert zich in de presentatie van de site als de echter Google-killer. Het zegt drie keer zoveel pagina's te indexeren als Google, veel relevantere resultaten te bieden en een betere presentatie te geven van de zoekresultaten. De zoekmachine ging afgelopen nacht online. 'Cuil' betekent kennis of wijsheid in het Keltisch, maar dat zal de doodnormale gebruiker wel ontgaan. Cuil is nog erg klein, maar is opgericht door zoekexperts, die die business hebben geleerd bij Google en IBM. De marketing werkt in ieder geval naar behoren. De zoekmachine is net actief en claimt nu al meer dan 120 miljard webpagina's te hebben geindexeerd, waarvan ze mededelen dat dat in ieder geval drie keer meer is dan Google en tien keer meer dan Microsoft Live Search. Zetten we dit in ieder geval even recht: Google heeft 1 biljoen URL's 'gevonden' (unieke adressen!), maar indexeert daar slechts een breukdeel van: 'We don't index every one of those trillion pages — many of them are similar to each other, or represent auto-generated content similar to the calendar example that isn't very useful to searchers'. Marketing is wat anders dan werkelijkheid, hoewel we hierbij aantekenen dat ook Google's beweringen niet te bewijzen zijn. Maar: kwantiteit is niet zaligmakend. Het web immers is voor een fiks deel opgebouwd uit spamsites, losse tekst, en oude, achterhaalde of gerecyclede content. Daarom dat Cuil ook stelt dat het qua relevantie veel betere prestaties levert. Het doet geen populariteitstest, zo zegt het smalend, maar ordent op basis van inhoud, coherentie en structuur van de webpagina's zelf.
In ieder geval is de interface interessant en nieuw. In plaats van een hierarchiesche lijst worden de resultaten in kolommen naast elkaar geplaatst. Daarnaast zijn er ook een aantal 'relevantie-tools' te vinden om een zoekactie verder uit te breiden of te verfijnen. Testen maken deze marketingpraat nog niet waar. De technologie werkt zeker nog niet foutloos. Er zijn nogal wat zoekopdrachten die (in tegenstelling met Google en LiveSearch) geen resultaten opleveren en ook de meest logische en relevante sites zijn niet altijd in de zoekresultaten aanwezig. Danny Sullivan heeft een nogal kritische recensie van de zoekdienst geschreven. Volgens hem zijn marketing en prestatie twee verschillende dingen. En 'links' blijven een rol spelen: 'Let's go back to the [harry potter] search. When you do that at Cuil, it finds all the pages that it thinks are related to those two words. This means pages that use those words, as well as pages that have other words on them, such as "harry potter books" or "gryffindor." It figures out these relationships by seeing what type of words commonly appear across the entire set of pages it finds. Since "gryffindor" appears often on pages that also say "harry potter," it can tell these two words (well, three words — but two different query terms) are related. Cuil then looks at the entire set to see which pages are linked to from them. Those with many or important links are likely to do better. Since the Harry Potter movie page has a lot of links pointing at it, it comes up higher in the results. Cuil even has a name for this – IdeaRank'. Afzetten tegen Google mag uiteraard, maar eenzelfde soort ranking meenemen en zeggen dat dat niet het geval is, is natuurlijk niet helemaal eerlijk. En Cuil overtreft zichzelf nog niet. Op de momenten dat de site beschikbaar is – de enorme vraag is te groot voor de servers, dus de site ligt er zeer regelmatig uit of kan opdrachten niet uitvoeren – zijn de zoekresultaten zeer beperkt. De zoekresultaten zijn onvolledig, niet juist en vaak niet relevant. Vince Sollitto, Vice-President of Communications, stelt dat 'there were two issues affecting Cuil search quality currently. First, we are trying to give people different results. … We've only been live for twelve hours, and traffic has spiked beyond expectations. In other Web 2.0 launches, a traffic spike would slow down or crash the service, but in Cuil's architecture, the spike affected results, not speed. This is because Cuil isn't set up as a massively parallel search network the way, say, Google is. Each of Cuil's search appliances is specialized to a particular subcategory of results. There are machines that understand and index sports; others are experts on medicine, etc. As these search machines get overloaded, they drop offline for some queries, and the machines left online return less-than-relevant results that then appear at the top of users' pages. Cuil will only improve with time. It's day one. Traffic is massive. We're new. There are bugs to fix, results to improve'. Tja, we geven de site nog wat tijd dan….. Er zijn regelmatig nieuwe 'Google-killers', maar nog niet een heeft het waargemaakt. Europa doet al jaren pogingen om een eigen Google-killer te ontwikkelen. Maar ook Exalead, Quearo of Theseus zijn mislukt of marginaal. Zelfs 'gearriveerde' zoekmachines als Yahoo, Microsoft Live en Ask verliezen nog steeds terrein van zoekmarktleider Google. De kans dus dat Cuil het niet redt is veel groter dan het succes dat het nu denkt te kunnen behalen.