Skip to content. Skip to navigation

Portal Sichart.org

Sections
Personal tools
You are here: Home Das CMS der Zeit
Document Actions

Das CMS der Zeit

by Maximilian Sichart last modified 2006-08-10 19:07

Die Technik hinter www.zeit.de basiert seit 2002 vollständig auf OpenSource-Komponenten. Für den technisch Interessierten folgt hier ein Überblick über das Gesamtsystem.

Der Document Store

Kernstück des neuen Systems ist der Document Store (Content Management Server) der den gesamten Content des Dienstes www.zeit.de verwaltet. Bei diesem Server handelt es sich um einen Apache-2 Webserver (s.a. Linkliste) mit speziellen Erweiterungen des WebDAV-Moduls zur Verwaltung der Metainformationen (wie z.B.: Autor, Datum) in einer SQL-Datenbank. So sind effiziente Suchanfragen über den Gesamtbestand des CMS möglich.

Graphik des Systems

Das Gesamtsystem

Der Anwender kann über das WebDAV-Protokoll, einer Erweiterung des HTTP-Standards, Dokumente auf dem Server speichern, bearbeiten sowie Metainformationen zu den Dokumenten verwalten. Der Server selbst verwaltet diese Metainformationen in einer Postgres SQL Datenbank die Suchanfragen performant abarbeitet. Durch die Verwendung des offenen DAV-Standards besteht die Möglichkeit, auf Dokumente nicht nur über das im Folgenden näher beschriebene Redaktionssystem zuzugreifen, sondern auch mit anderen Client-Programmen direkt den Content zu bearbeiten, etwa mit Text- oder XML-Editoren. Moderne Betriebssysteme können WebDAV-Resourcen auch als Netwerklaufwerke darstellen - der Anwender "bemerkt" in diesem Fall den Content Management Server nicht mehr.

Der Print-Inhalte

Die für die gedruckte Ausgabe der Wochenzeitung 'Die ZEIT' im Quark-XPress -Format ® erstellten Artikel werden in regelmässigen Abständen in das XPressTag-Format (einem Textformat mit Steuerzeichen) exportiert. Mithilfe eines Quark2XML-Konverters werden sie anschliessend dem Document Store zugeführt, wobei die Metainformationen zu den Dokumenten aus dem Print-System in die DAV-Properties übernommen werden.

Das Redaktionssystem

Anzeige

Versuchen Sie es doch mal!<a href="http://ad.doubleclick.net/jump/www.zeit.de/zeit/artikel;tile=5;sz=300x250;ord=123456789?" target="_blank"><img src="http://ad.doubleclick.net/ad/www.zeit.de/zeit/artikel;tile=5;sz=300x250;ord=123456789?" width="300" height="250" border="0" alt=""></a>

Für die Aufarbeitung des Print-Contents sowie das Neuerstellen von Online-Content wurde ein ZOPE-basiertes Redaktionssystem entwickelt. Es ermöglicht die Bearbeitung der im Document Store enthaltenen Daten über einen Webbrowser. Ein DAV/CMS-Client stellt den Zugriff auf den Content Management Server als Python-Bibliothek zur Verfügung. Diese Funktionen werden durch eine Zope-Applikation benutzt, um CMS-Objekte als Zope-Objekte zu repräsentieren. Über die Suche in den Metadaten der Dokumente können die XML-Dateien aufgefunden und dann bearbeitet werden. Eine einfache Volltextsuche wurde auf der Basis von Xapian umgesetzt. Für die Bearbeitung wurde das Grundgerüst eines Zope-XMLEditors entwickelt, der die gezielte Darstellung und Manipulation einzelner XML-Knoten über den Webbrowser erlaubt.

Das Layout

Das Layout wird in XML-Sytlesheets definiert, die ähnlich den anderen XML-Objekten über das CMS verwaltet werden.

Der Webserver

"Last, but not least" in der Kette der beteiligten Software. Jede Anfrage an eine URL wird dynamisch über eine Sitemap im XML-Format auf ein oder mehrere Content-Objekte im CMS abgebildet. Diese Objekte werden dann vom Server geladen, anhand von Styleinformationen im Dokument oder in der Sitemap mittels XSL-Transformation nach HTML konvertiert und ausgeliefert. Je nach XSLT-Stylesheet kann so der gleiche Content in den unterschiedlichsten Formaten bereitgestellt werden - die Gefahr dass sich der Inhalt eines Dokuments in den verschiedenen Versionen (HTML/Print etc.) nach eventuellen Änderungen unbeabsichtigt unterscheidet besteht nicht mehr.

Die XSL-Transformation im Apache Server ist Aufgabe eines eigens hierfür entwickelten Moduls welches wiederum auf den Code der libxml2/libxslt, einer im Rahmen des GNOME-Projekts entwickelten Softwarebibliothek, zurückgreift.

Das Betriebssystem

Linux als Basis einer Open-Source-Lösung war eine Grundsatzentsacheidung aus Kosten- und Sicherheitsgründen, Sicherheit hier vor allem im Sinne der prinzipiellen Garantie, jeden beliebigen Teil des Systems den Notwendigkeiten und Bedürfnissen anpassen oder auswechseln zu können, ohne dabei die Rechte eines Softwareherstellers zu verletzen.

Die Wahl fiel auf Debian-Linux. Diese Distribution basiert vollständig auf Open-Source-Software, enthält die für das CMS nötige Basissoftware (Webserver, Datenbank, Zope) und verfügt über eine ausgezeichnetes Software-Management, das die sichere Administration des Systems erleichert.

Debian Linux ist vollständig im Netz verfügbar. Eine Liste von Anbietern, die Debian-Linux auf CD anbieten finden Sie unter http://www.debian.de/CD/vendors/#de. Debian Linux erhalten Sie auch über den Buchhandel, z.B.: Debian GNU /Linux 3.0 (Final); Lehmanns Fachbuchhandlung, Berlin, 2002, 8 CD, 25 EUR, ISBN: 3-931253-89-9 oder über http://www.lin24.de/

Die Hardware

Das System läuft auf verschiedenen PC-basierten Serversystemen, die von 700MHz/768MB/30GB bis 2*1GHz/2GB/80GB reichen.





Fragen, Hinweise, Vorschlaege und Kritik senden Sie bitte per E-Mail an: Peter M. Buhr (webmaster@zeit.de)

© P. Buhr / R. Mattes 2002



Powered by Plone CMS, the Open Source Content Management System

This site conforms to the following standards: