[NEWS] Nutch, un moteur de recherche Open Source
Nous connaissions l'Open Directory, dans le domaine des annuaires. Mais voici Nutch, un projet de moteur de recherche Open Source, conduit par un ancien architecte du moteur Excite. Le maître mot : transparence !
Le projet Nutch vise à développer un moteur de recherche en Open Source. Il est conduit par Doug Cutting, un des pricipaux architectes du moteur Excite. L'idée provient d'un double constat.
Primo, les critères de classification des sites dans les moteurs de recherche actuels manquent de transparence.
Secundo, le marché des moteurs de recherche se trouve en situation d'oligopole et risque de se transformer en monopole.
Supporté par Mitch Kampor (Open Source Application Foundation) et Tim O'Reilly (éditions O'Reilly), le projet Nutch bénéficie du soutien financier d'Overture, spécialisé dans les systèmes de positionnement publicitaires payants. Overture y voit un moyen d'améliorer tous les moteurs à long terme.
Débutté en janvier 2003, Nutch a fait l'objet d'un premier test jugé encourageant sur un index de 100 millions de pages. Il peut exécuter 3 requêtes à la seconde et fonctionne sur trois ordinateurs de base.
Du chemin reste donc à parcourir pour la petite équipe de développement (4 personnes), qui recherche d'autres sponsors.
Source : Courrier S., Nutch : un moteur de recherche open source sponsorisé par... Overture, 01Net, 14 août 2003.
L'ère Google
Google domine sans conteste le marché des moteurs de recherche. Selon Xiti, Google occupait en mai 2003 plus de 60% du trafic en provenance des outils de recherche francophones, loin devant Yahoo! (12,75%) ou Altavista (0,85%) ! Il est avec Alltheweb le moteur indexant le plus de pages web, avec plus de 3 milliards de références. Par ailleurs, Google est d'ores et déjà rentable.
Ce succès, Google le doit à sa modération financière (peu de campagnes publicitaires coûteuses), au nombre de pages indexées (plus de 3 milliards), à la publicité discrète, à la rapidité de son moteur (réponse en moins de 1 seconde) et surtout à la pertinence des résultats fournis. Ces derniers sont dus au PageRank, un outil permettant une classification des résultats en fonction de la popularité. Ce procédé présente néanmoins un défaut : il ne favorise pas l'émergence de nouveaux sites.
Les hostilités sur le marché des moteurs de recherche portent davantage aujourd'hui sur la sous-traitance auprès des portails et les annonces publicitaires en ligne. Fast s'est ainsi spécialisé dans les offres de motorisation en marque blanche et équipe aujourd'hui Terra Lycos, eBay ou Tiscali en plus de son propre moteur, Alltheweb. Pour la publicité, Google oppose son offre (premium sponsorships et adwords) à Overture, spécialiste des systèmes de positionement publicitaires payants.
L'innovation occupe une place importante dans ce domaine. Fast est ainsi issu de l'Université des Sciences et des Technologies de Norvège, tandis que Google a été créé par deux doctorants de l'université de Stanford. Google présente aujourd'hui plusieurs de ses dernières innovations en ligne dans ses Google Labs. Les innovations possibles sont nombreuses : élimination plus rapide des liens morts, indexation des 6 milliards de pages que compte la Toile, etc.
Mais à côté de l'innovation, les aspects financiers ramènent à la réalité. Que l'on pense que Google se base sur des fermes de plusieurs milliers d'ordinateurs : un investissement considérable.
Sources : Desautez L., Trois moteurs pour déloger Google de chez Yahoo, JDNet, 13 juin 2002 / Xiti, mai 2003 / Google, moteur à chercher ; L'Express Multimédia, 21 novembre 2002.
|
Posté le 21 août 2003.
|