mercredi 14 février 2007

Web 2.0: Mort du Web Sémantique?

Vous connaissez déjà sans doute les propriétés du Web 2.0 : Interaction collective, Collection d’API pour les objets Web, blog, RSS et technologie de Call Back Ajax…Justement, cette dernière, de plus en plus présente sur les pages Web et les grands portail représente peut-être une mort précoce pour les agents du Web Sémantique.

Essentiellement orienté vers les agents de moissonnage, le Web sémantique est entre autre l’idée que l’information contenue dans les pages Web est structurée, balisée par des langages de méta donnés tel RDF, OWL, et surtout accessible en mode simple http pour pouvoir être lues automatiquement par des agents. Or voila, la technologie AJAX de plus en plus présente qui consiste à appeler des morceau de page via des requêtes XML manipulées en Javascript est en train de changer cette donne. Elle rend l’information disponible seulement via les click des usagers et donc cachée des agents et autres automates du Web Sémantique en train de se développer tranquillement à l’ombres des institutions universitaires.

À moins d’un protocole ou de standards bien précis, ces agents ne pourront plus lire l’information contenue dans les pages Web. Et voila pour le Web Sémantique.

mercredi 7 février 2007

Adsense + Wikipedia = Mauvais mélange

Est-ce que la licence Creative Common de wikipedia nuit à Internet? À priori on serait tenté de croire que non, mais avec du recul et des centaines de pages visitées plus tard on se rend bien compte que le contenu de l'encyclopédie est multiplier à l'infini par des Webmaster qui ne pensent qu'à l'argent. Il y a de plus en plus de faux sites réunissant ces deux éléments, plus précisément des annonces Adsense et du contenu glané sur Wikipedia. Une façon pas trop forcante de faire de l'argent.

Pour faire un test bien rapide, allez sur une page de wikipedia très visiter, disons celle sur le ville de New York, prenez une phrase au hasard et cherchez la en prenant soin de placer les ""
Résultat plus de 700 sites reprenant la phrase mot pour mot...

Si l'on considère que l'encyclopédie Wikipedia est un des plus gros site internet en matière de contenue, cela provoque énormément de redondance sur le web... Est-ce que Adsense devrait resserrer ses critères ou Wikipédia ne plus permettre que l'on copie indûment son contenu?