RSS (Really Simple Syndication)

  1. Startseite
  2. Programmierung
  3. RSS (Really Simple Syndication)

RSS (Really Simple Syndication) ist eine seit dem Anfang des Jahres 2000 kontinuierlich weiterentwickelte Familie von Formaten für die einfache und strukturierte Veröffentlichung von Änderungen auf Websites (z. B. News-Seiten, Blogs, Audio-/Video-Logs etc.) in einem standardisierten Format (XML).

RSS-Dienste werden in der Regel in Form spezieller Service-Websites (sogenannter RSS-Channels) angeboten. Ein RSS-Channel versorgt den Adressaten oft, ähnlich einem Nachrichtenticker, mit kurzen Informationsblöcken, die aus einer Schlagzeile mit kurzem Textanriss und einem Link zur Originalseite bestehen.

Zunehmend werden aber auch komplette Inhalte klassischer Webangebote ergänzend als Volltext-RSS bereitgestellt. Die Bereitstellung von Daten im RSS-Format bezeichnet man auch als RSS-Feed (englisch to feed – im Sinne von füttern, einspeisen, zuführen). Wenn ein Benutzer einen RSS-Channel abonniert hat, so sucht der Client in regelmäßigen Abständen beim Server nach Aktualisierungen im RSS-Feed.

Funktionsweise

Nachdem der RSS-Feed abonniert wurde, kann der Abonnent die Nachrichten im Feedreader einlesen. Der Abonnent des RSS-Feeds kann dann direkt den angebotenen Links folgen und dort die vollständige Meldung lesen. Die Adresse eines RSS-Feeds sieht der einer „normalen“ Webseite sehr ähnlich.

Zum Lesen eines RSS-Feeds dienen herkömmliche Webbrowser oder spezielle Programme, die auf die Ähnlichkeit zum Nachrichtenticker angepasst sind. Letztere nennt man (synonym) RSS-Aggregatoren, RSS-Reader oder Feedreader. Auch einige aktuelle E-Mail-Programme bieten bereits RSS-Lesefunktionen, ältere können durch Plugins erweitert werden. Daneben gibt es auch Anwendungen wie Bildschirmschoner.

Im Unterschied zur Benachrichtigung per E-Mail geht die Initiative bei RSS vom Empfänger aus, der den Feed abonniert hat. Das bedeutet, dass der Anbieter die Leser nicht auswählen kann, sich im Gegenzug aber auch nicht um eine Verwaltung des Leserstammes (zum Beispiel mit einer Mailinglisten-Software) kümmern muss. Der Leser muss nicht offenlegen, dass er die Quelle beobachtet und kann Quellen wesentlich leichter abonnieren bzw. das Abonnement widerrufen, indem er einfach die Einstellung in seinem RSS-Aggregator vornimmt.

RSS vereinfacht insbesondere die Beobachtung einer großen Menge von Quellen wie z. B. Blogs, in denen es eher selten zu Änderungen kommt, deren Aktualisierung der Leser aber ggfs. nicht verpassen möchte.

Syndikation

Weil die Inhalte via RSS in einem standardisierten Format vorliegen, eignen sie sich auch für die maschinelle Weiterverarbeitung. So lassen sich mittels RSS beispielsweise Texte einer Webseite automatisch mit Hilfe eines RSS-Parsers in eine andere Webseite integrieren oder sehr einfach auf verschiedenen Endgeräten speziell aufbereitet darstellen.

Das Aufbereiten von Informationen in ein standardisiertes Austauschformat/-objekt nennt man auch Aggregation, das Veröffentlichen auf anderen Seiten Content-Syndication. Webseiten können damit automatisch mit neuesten Nachrichten aktualisiert werden, ohne dass der Seitenbetreiber jeweils eine Aktualisierung vornehmen muss. Eine Reihe von Content-Management-Systemen unterstützen diese Funktionalität.

Verwendung

RSS wird verwendet, um Artikel einer Website oder deren Kurzbeschreibungen (insbesondere Nachrichtenmeldungen) zu speichern und in maschinenlesbarer Form bereitzustellen. Ein sogenannter RSS-Feed oder Newsfeed (engl. etwa Nachrichteneinspeisung) besteht aus einer XML-Datei, die den reinen strukturierten Inhalt – beispielsweise einer Nachrichtenseite – bereithält, aber keinerlei Layout, keine Navigation oder sonstige Zusatzinformationen beinhaltet. Zahlreiche Webangebote, die regelmäßig Artikel publizieren, stellen eine automatisch generierte RSS-Datei mit den neuesten Artikeln zur Verfügung.

Ursprünglich wurden RSS-Feeds von Nachrichtenseiten (zu Beginn auf dem Netscape.com-Portal) zur Content-Syndication verwendet. Das Format erlangte seine heutige Popularität vor allem durch den Einsatz in Blogs. Mittlerweile haben auch MP3-Portale begonnen, RSS-Feeds zusammen mit Podcasting-Funktionalität einzusetzen.

Ein Benutzer kann nun ein sogenanntes Aggregatorprogramm bzw. einen sogenannten Feedreader benutzen, um die für ihn wichtigsten Schlagzeilen und Kurzbeschreibungen automatisch herunterzuladen und die gesammelten Artikel geordnet anzeigen zu lassen. Hierfür benötigt der Aggregator lediglich einen Link auf den RSS-Feed.

RSS-Feeds eignen sich auch zur Verarbeitung durch spezialisierte Suchmaschinen und Alert-Dienste. Beispielsweise können die Artikel innerhalb eines RSS-Feeds durch einschlägige Dienste nach Quellen oder Stichworten gefiltert und zu einem neuen RSS-Feed zusammengesetzt werden.

RSS zählt zu den ersten Anwendungsgebieten des semantischen Webs.

Zunehmend werden RSS-Feeds auch zur Bekanntmachung von Links zu Dateien (z. B. Torrent-Dateien) verwendet. Diverse Torrent-Programme besitzen die Möglichkeit zum Abonnement von RSS-Feeds mit entsprechenden Filtereinstellungen zum automatisierten Herunterladen.

Entwicklung

RSS hat sich vor allem durch Weblogs durchgesetzt, da die meisten Autoren sehr früh RSS-Feeds für ihre Artikel anboten und viele Weblog-Systeme diese automatisch generieren und in die Webseite einbinden.

Ursprünglich ging es dabei vor allem um Text. Dies hat sich inzwischen geändert: Podcasts etwa zeigen, dass man auch Audio- oder Video-Inhalte gut via RSS verbreiten kann, die dann z. B. auf tragbare Abspielgeräte ladbar sind.

Technisch gesehen ist RSS eine Familie von XML-basierten Dateiformaten. Die Abkürzung RSS hat in den verschiedenen technischen Spezifikationen eine unterschiedliche Bedeutung:

  • Rich Site Summary in den RSS-Versionen 0.9x
  • RDF Site Summary in den RSS-Versionen 0.9 und 1.0
  • Really Simple Syndication in RSS 2.0

Historie der Versionen, Alternativen und Ergänzungen
Derzeit gibt es mehrere Versionen von RSS, deren Versionsnummern zwar aufeinander Bezug nehmen, die aber von verschiedenen Firmen bzw. Entwicklergruppen zum Teil unabhängig voneinander herausgegeben wurden und auch zueinander jeweils inkompatibel sind.

  • 1999: RSS 0.90 ist das älteste dieser Formate und stammt von dem My Netscape Network, einer individualisierbaren Nachrichtenseite von Netscape, aus dem Jahr 1999. Es basiert auf RDF, wurde aber schnell durch RSS 0.91 abgelöst, welches nicht mehr auf RDF, sondern auf einer einfachen XML-Dokumenttypdefinition basiert.
  • 2000: RSS 0.91 und die weitere Versionslinie 0.9x wurde von UserLand Software inoffiziell weiterentwickelt und Mitte 2000 erstmals mit RSS 0.91 veröffentlicht. Später wurden noch 0.92 sowie Entwürfe zu 0.93 und 0.94 herausgegeben.
  • 2000: RSS 1.0 wurde parallel von einer unabhängigen Entwicklergruppe im Jahr 2000 entwickelt und veröffentlicht. RSS steht hier für RDF Site Summary, basiert also wieder auf RDF.
  • 2002: RSS 2.0 war die von UserLand bekannt gemachte Weiterentwicklung. Es erweitert die älteren RSS-0.9x-Spezifikationen, macht aber keinen Gebrauch von RDF. RSS 2.0 ist umstritten, da es entgegen den Aussagen von UserLand nicht vollständig abwärtskompatibel zu den 0.9x-Versionen ist, setzt sich als Quasi-Standard gleichwohl immer mehr durch. Diese Version wird auch als Really Simple Syndication übersetzt.

In Konkurrenz dazu steht das ebenfalls auf XML basierende Format Atom. RSS und Atom sind nicht miteinander kompatibel, die beiden Formate können jedoch ineinander umgewandelt werden.

Technik

Aufbau einer RSS-Datei (Version RSS 2.0)

Das folgende Beispiel zeigt den Quelltext eines einfachen RSS-Feeds, welcher dem Dokumenttyp RSS 2.0 entspricht. Der Feed enthält einen Channel mit zwei Beispieleinträgen (item).

<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
 <title>Titel des Feeds</title>
 <link>URL der Webpräsenz</link>
 <description>Kurze Beschreibung des Feeds</description>
 <language>Sprache des Feeds (z. B. "de-de")</language>
 <copyright>Autor des Feeds</copyright>
 <pubDate>Erstellungsdatum("Tue, 8 Jul 2008 2:43:19")</pubDate>
 <image>
 <url>URL einer einzubindenden Grafik</url>
 <title>Bildtitel</title>
 <link>URL, mit der das Bild verknüpft ist</link>
 </image>

 <item>
 <title>Titel des Eintrags</title>
 <description>Kurze Zusammenfassung des Eintrags</description>
 <link>Link zum vollständigen Eintrag</link>
 <author>Autor des Artikels, E-Mail-Adresse</author>
 <guid>Eindeutige Identifikation des Eintrages</guid>
 <pubDate>Datum des Items</pubDate>
 </item>

 <item>
 ...
 </item>
 </channel>
 </rss>

Der Autor des Eintrags sollte in der Form „Vollständiger Name, E-Mail-Adresse“ eingegeben werden. Dies entspricht einer nach RFC 822 (Sektion 6 ADDRESS SPECIFICATION) geformten Adresse, die mit SGML-Entitäten codiert wurde. Das Datum entspricht auch der RFC 822 (Beispiel: Sat, 15 Nov 2003 09:59:01 +0200). Das Datum der RFC 2822 wird aber von den meisten RSS-Readern auch verstanden.

Verlinkung einer RSS-Datei
Man kann eine RSS-Datei in der HTML-Seite, deren Inhalte sie maschinenlesbar enthält, verlinken. Dieses Verfahren wurde für RSS nie spezifiziert, allerdings können fast alle Aggregatorprogramme dadurch selbständig die Adresse des RSS-Feeds eines Webangebots herausfinden (genannt auto-discovery). Moderne Browser ermöglichen es dem Seitenbesucher, den so verlinkten RSS-Feed zu abonnieren. Beispielsweise wird in der Adress- oder Statusleiste des Browser-Fensters eine RSS-Schaltfläche angezeigt.

Dazu wird im head-Bereich ein link-Element eingefügt:

<link rel="alternate" type="application/rss+xml"
 title="RSS" href="http://www.example.net/feed.rss" />

Es ist ebenfalls möglich, mehrere dieser Links zu verwenden.

Quelle: Wikipedia (http://de.wikipedia.org/wiki/Rss)

error: Content is protected !!