La syndication de contenu est le procédé permettant à l'éditeur d'un site Web de proposer tout ou partie de son contenu pour la publication (généralement automatisée) sur un autre site Web.
Plusieurs formats ont émergé pour assurer cette syndication. Ces formats sont généralement regroupés sous le vocable RDF (pour Resource Distribution Framework) ou RSS (RDF Site Summary ou Rich Site Summary).
Pour illustrer concrètement ce concept, nous citerons l'annuaire de weblogs francophone Weblogues.com, qui propose la liste des dernières mises à jour de chaque weblog référencé. Ainsi, il est possible d'avoir un aperçu des derniers textes publiés sur Planetes, sans qu'aucune intervention manuelle ne soit nécessaire :
Petite histoire de la syndication et du format RSS
RSS est le format XML de syndication le plus utilisé actuellement sur Internet. Il constitue un moyen de décrire le contenu d'un site à l'aide de balises spécifiques.
C'est en 1999, sous l'impulsion de Netscape, que ce format a fait son apparition (il était alors dans sa version 0.90). Netscape l'avait alors présenté comme une méthode de description de canaux pour son portail My Netscape Network (MNN) : en fournissant ce résumé de leur contenu, les sites Web gagnaient de l'audience grâce à leur présence sur le portail, tandis que, pour Netscape, c'était un moyen simple et automatique de mettre à jour les informations de MNN.
La société a toutefois abandonné ce format après la sortie de la version 0.91, en juillet 1999. Dès lors, les développements autour de RSS ont été menés dans deux directions différentes. D'une part, la société UserLand Software a proposé plusieurs versions : 0.92, 0.93, 0.94 et enfin 2.0.
D'autre part, le groupe de travail RSS-DEV a défini RSS 1.0 en se basant sur la norme de description RDF destinée à normaliser la syntaxe d'un document électronique.
A l'heure actuelle, ces multiples versions coexistent, sans qu'aucune n'ait été privilégiée par le World Wide Web Consortium. Le principal inconvénient de RSS est justement de ne pas être une norme : plusieurs standards continuent de lutter pour s'imposer. Il semblerait néanmoins que la logique conduise à utiliser RSS 2.0, compatible avec les versions 0.9x et privilégiée par Yahoo, Microsoft, etc.
Structure d'un fichier RSS
Mais avant d'approfondir les enjeux liés au développement de ce format, arrêtons-nous sur la structure-type d'un fichier RSS. Pour les besoins de l'exemple, nous allons privilégier la version 0.92 qui est encore la plus répandue actuellement. Un fichier RSS se présente de la manière suivante :
<?xml version="1.0"?>
<rss version="0.92">
<channel>
<title>Titre du site Web/du flux syndiqué</title>
<link>Adresse du site</link>
<description>Description du site/flux</description>
<lastBuildDate>Dernière date de publication du flux</lastBuildDate>
<language>fr-fr</language>
<webMaster>Le nom du webmaster</webMaster>
<item>
<title>Titre de l'article 1</title>
<description>Description rapide du contenu de l'article 1</description>
<link>Adresse absolue (lien permanent) de l'article 1</link>
</item>
<item>
<title>Titre de l'article 2</title>
<description>Description rapide du contenu de l'article 2</description>
<link>Adresse absolue (lien permanent) de l'article 2</link>
</item>
</channel>
</rss>
Dans cet exemple, nous n'avons utilisé que des balises basiques du format RSS. Il en existe d'autres qui permettent de décrire au mieux le contenu du site Web. Nous pouvons constater que, dans la version 0.92, la date de publication et l'auteur ne sont générés que globalement, pour tout le flux. La version 2.0 pallie à cette limitation et spécifie auteur et date de publication propres à chaque article.
Dans le code présenté ci-dessus, nous n'avons syndiqué que deux articles. Il est bien sûr possible d'en syndiquer plus : pour cela, il suffit d'empiler des blocs <item>...</item>, avec une limite supérieure de quinze blocs par fichier. En effet, certaines des applications qui analysent les fichiers RSS ont été conçues pour ne lire que les 15 premiers blocs. En outre, certaines versions (telle RSS 0.92) exigent que la description des articles ne dépassent pas 500 caractères.
Les fichiers RSS d'un site Web peuvent être gérés de deux manières différentes : d'une part, "artisanalement", en créant et mettant à jour ces fichiers par l'intermédiaire d'un éditeur de texte ; d'autre part, automatiquement, étant donné que beaucoup de logiciels de gestion de contenu d'un site Web (à l'instar de SPIP et des outils de création de weblogs comme b2, Movable Type ou Nucleus) génèrent de nouveaux fichiers RSS à chaque mise à jour du site.
Il va de soi que la méthode dite "artisanale" n'est viable que pour la gestion de petits sites Web. Et, même dans ces conditions, il est possible d'avoir recours à des sites externes (tel RSSify) : ceux-ci créent automatiquement le fichier RSS, pourvu que certaines balises spécifiques soient ajoutées dans le code HTML du site que l'on désire syndiquer.
Pour savoir si un site Web propose un flux RSS, il suffit généralement de repérer s'il comporte une petite icône orange avec les sigles à trois lettres "RSS", "XML" ou "RDF". Celle-ci se présente sous la forme suivante :
Usages des fichiers RSS
Les fichiers RSS peuvent avoir deux utilités : la première, que nous avons déjà évoquée plus haut, est l'affichage automatique, sur un site Internet donné, d'informations provenant d'un autre site. Des petits scripts existent afin de "traduire" les fichier RSS (écrits en XML) en HTML, de manière à les rendre exploitables.
Le second usage des fichiers RSS est leur lecture dans un logiciel dédié, appelé "agrégateur" ou "lecteur RSS". Un agrégateur est simple d'emploi ; son fonctionnement rappelle les programmes de consultation de groupes de discussions (ou newsgroups).
L'utilisateur entre dans l'agrégateur l'URL des flux RSS qu'il souhaite consulter (ces adresses s'obtiennent en cliquant sur la petite icône XML ou RSS présente sur les sites syndiqués). Dès lors, l'agrégateur ira régulièrement charger la version la plus récente des fichiers RSS et fera ainsi apparaître la liste des derniers articles publiés sur les sites sélectionnés.
Il existe deux principales familles d'agrégateurs : d'une part, les agrégateurs en lignes (comme l'incontournable NewsIsFree) et, d'autre part, les lecteurs RSS à installer sur son PC (tels NewsGator ou Feedreader). Ces derniers fonctionnent en tâche de fond et préviennent l'utilisateur dès qu'ils ont détecté qu'un des flux auquel il est abonné a été mis à jour.
Voici, par exemple, la manière dont Feedreader signale qu'un nouvel article a été publié sur un weblog ; en bas à gauche de l'écran apparaît une fenêtre spécifiant le nom du weblog mis à jour et le titre du nouvel article :
Quand l'utilisateur consulte ensuite Feedreader, il repère facilement les nouveaux articles car ceux-ci sont signalés en gras.
Enjeux de la syndication, tant pour les éditeurs de sites Web que pour les Internautes
L'essor des flux RSS doit beaucoup aux webloggers qui, les premiers, ont massivement syndiqué leur contenu. Comme l'expliquait Jean-Yves Stervinou dans Transfert, au mois de septembre 2003, "un weblog qui n'a pas de fil RSS s'isole réellement. On ira le voir seulement de temps en temps, et c'est bien dommage quand il est intéressant."
De nombreux sites d'information anglophones ont suivi cette évolution et proposent un fichier RSS de leur contenu : c'est le cas de la page "Actualités" de Yahoo, du New York Times ... Les médias français, quant à eux, peinent à faire le grand saut. Seul L'Humanité propose un flux RSS standard. Et eTF1 fait de la syndication avec certains partenaires privilégiés, mais dans un format qui leur est propre. Dans Transfert, Stéphane Allaire, responsable technique d'eTF1, justifiait la décision de ne pas proposer de flux RSS dans l'immédiat de la manière suivante : "on ne veut pas que tout le monde récupère nos informations, même si certains bricoleurs peuvent l'aspirer de notre site."
Certains analystes pensent toutefois que l'avènement du RSS est inéluctable. Il serait notamment appelé à remplacer les lettres de diffusion (newsletter). Les flux RSS permettent en effet à l'utilisateur de reprendre la main : c'est lui-même qui choisit de s'abonner à un canal. Ensuite, il va consulter les informations du-dit canal à la demande, sans sollicitation quelconque (contrairement aux lettes de diffusion qui sont envoyées à la fréquence qu'a adoptée le webmaster du site auquel le visiteur s'est abonné). Le format RSS est un mécanisme sûr qui permet d'éviter le spam publicitaire et la propagation de virus informatiques par email.
Toutefois les éditeurs de site Web restent frileux à l'idée de la syndication : que vont devenir les publicités présentes sur les sites Web si les Internautes ne consultent le contenu qu'à travers un agrégateur ? Certains semblent contourner le problème et des publicités commencent à être diffusées dans des fils RSS, sous la forme de liens sur lesquels il faut cliquer. Peut-être sera-ce là le prix à payer pour que la syndication soit adoptée par tous les plus grands médias.
C'est grâce au développement récent de technologies web dynamiques (tel le langage PHP) que la syndication de contenu a pris son envol. Toutefois, si ses avantages sont évidents, elle se heurte encore à plusieurs obtacles : d'une part, aucune norme n'a encore été mise en place autour de la syndication. D'autre part, beaucoup de médias sont encore méfiants, car ils craignent de voir disparaître les recettes rapportées par les publicités diffusées via Internet. De plus, la syndication ouvre le débat sur des questions encore plus vastes, tel le respect des droits d'auteur (dans quelle mesure peut-on reproduire le contenu d'un site Web sur un autre site ?).
Mais qu'on ne s'y trompe pas : la syndication est un concept particulièrement enthousiasmant, amené à prendre de plus en plus d'ampleur dans les années à venir. Le développement de moteurs de recherche de flux RSS, à la manière de Feedster, prouve l'extraordinaire vitalité de ce format.
Bibliographie
- L'ABC du blog de Pointblog
- La syndication de contenu change peu à peu la face du web, article paru dans Transfert en septembre 2003, traitant de la syndication dans les "grands médias".
- RSS : la syndication de contenu à la portée de tous, une bonne introduction à la syndication, publiée sur Le Journal du Net.
- Une collection de liens sur la syndication RSS, à consulter pour comprendre ce qu'est la syndication, comment créer des fichiers RSS, comment les lire, où trouver des contenus au format RSS.
- La traduction française de la spécification RSS 2.0
Commentaires :
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Seul L'Humanité propose un flux RSS standard
Le feed RSS de l'HUmmanité proposé dans le site ne marche pas !
Peut-on leur demander le rectifié?
AL
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Lien croisé
Exploitation, affichage facile de fils RSS.
XCMS : Nouvel outil pour la syndication
En effet, XCMS est un CMS dans lequel tout contenu ajouté est directement accessible via un fil RSS.
De plus, un projet de lecture de fil RSS est à suivre ce qui permettra un très bon développement de ce type d'application d'internet.
Si vous souhaitez participer à ce projet, vous pouvez me contacter à ptitsatan chez aol.com.
Lien croisé