Making of wien.info – Content schaufeln

Im Juni 2009 führte WIENFLUSS im Auftrag von WienTourismus den Relaunch der offiziellen Wiener Tourismuswebsite wien.info durch. In einer losen Artikelserie wollen wir ein wenig die Hintergründe und Erfahrungen aus diesem Projekt beleuchten.

Der Transfer der Inhalte vom alten Contentmanagement-System auf das neue hatte sich rasch als Herausforderung für sich herausgestellt. Hier galt diesen Transfer möglichst reibungslos und kurz zu halten, um zu verhindern, dass man allzu lange zwei Systeme parallel pflegen muss. Jeder der das schon mal gemacht hat, weiß was es heißt, tausende Inhalte möglichst automatisiert zu übernehmen. Auch hier war es nicht gerade förderlich, wenn man selbst zehn der zwölf Sprachen nicht verstehen und zwei davon auch nicht lesen kann.

Die Übertragung der vielen tausend Bilder und Artikel vom alten ins neue CMS stand unter einigen Prämissen:

  • Möglichst eine großer Teil der Inhalte sollte weitgehend automatisiert übernommen werden.
  • Die Dauer des Doppelbetriebs von beiden CMS – d.h. das alte wird noch gepflegt, da das neue noch nicht online ist, und das neue wird für den Launch vorbereitet – sollte möglichst kurz gehalten werden.
  • Die Linkintegrität im Content muss erhalten bleiben, die HTML-Qualität sollte soweit möglich automatisch verbessert werden, um die manuelle Nachbearbeitung minimal zu halten.

Trotz detaillierter Planung der weit mehr als hundert Teilaufgaben hat der Contenttransfer inklusive Vorbereitungs- und Testimporten mehrere Monate gedauert. Allein die heiße Phase, in der zahlreiche RedakteurInnen am neuen System die Inhalte finalisierten, erstreckte sich über mehrere Wochen.

Die wesentlichsten Eckpunkte der Übertragung der Inhalte seien hier kurz skizziert:
Eine Testexport und Import ermöglichten, dass das Transferkonzept im fast realen Umfeld entwickelt und durchgespielt werden konnte – das CMS war zu diesem Zeitpunkt natürlich noch nicht 100% fertig. Dieser Schritt hat sich definitiv als unumgänglich herausgestellt, eine rein theoretische Planung des Transferprozesses wäre mit Sicherheit an dessen Komplexität gescheitert.

“Ausmisten soviel geht und vom verbliebenen Rest die Hälfte noch rausstreichen”, war die Devise. Diese Regel hat sich schon hundertmal beim Übersiedeln und beim Rucksack packen bewährt und gilt genau so bei einem Relaunch. Die Redakteure von WienTourismus haben immerhin 50 % aller Inhalte (inklusive archivierter Inhalte) vor dem Transfer gestrichen. Alleine dafür verdienen sie den Friedensnobelpreis.

Bei dieser Gelegenheit wurden auch wesentliche Metainformationen überarbeitet: aussagekräftigere Seitentitel, Alternativtexte, Teaserbilder für Artikel, und das natürlich alles in zwölf Sprachen. Viele dieser Kurzinformationen benötigte man ja gleich wieder für Überblicksseiten und Navigation, in denen die entsprechenden Artikel damit angerissen werden können.

In weiser Voraussicht

Für die Zeit nach dem Contentexport aus dem alten Redaktionssystem und vor dem Launch des neuen hatte man sich intensiv vorbereitet. Die Redaktion von wien.info hatte versucht, allen Bedarf an neuen Seiten für diesen Zeitraum schon Wochen vorher zu erheben und diese Seiten zumindest in einer Grundstruktur anzulegen, damit diese in den exportierten Inhalten bereits vorhanden waren. Dadurch konnten diese Inhalten in ihrer Struktur bereits mitberücksichtigt und angelegt werden. Das ersparte vor dem Launch jede Menge Arbeit, nämlich neue Seiten und Übersetzungen anlegen, in die Navigation und Taxonomie einordnen, in Überblickseiten verorten etc.

Eine der wesentlichen Herausforderungen war es nämlich die Abhängigkeiten aller Inhalte korrekt abzubilden. Im alten System waren diese Abhängigkeiten nur bedingt dargestellt bzw. uns nicht zugänglich. So war es eine Herausforderung von 9.500 Artikeln die jeweils zusammengehörigen Sprachvarianten zuzuordnen, diese in eine Informationsstruktur einzugliedern und mit den zugehörigen Ressourcen (Bildern, Downloads etc.) zu verknüpfen und gleichzeitig an die neue Navigation anzupassen.

Als ein sehr wertvolles Tool hat sich hier OpenOffice Calc herausgestellt, dessen Funktionsumfang in entscheidenden Punkten über den von Excel hinausgeht. Manche der Spreadsheets brachten meinen PC mit 4 GB und einem Dual-Core Prozessor durchaus an seine Grenzen, zu Unfällen kam es aber kaum.

Obwohl die alten Inhalte im XML-Format zur Verfügung standen, was durch die Striktheit des Formats eine recht gute Datenbasis sicherstellte, war eine Transformation notwendig, um das HTML für den verwendeten Doctype und für eine semantische Struktur vorzubereiten. Dabei konnten wir auf gängige XML-Parser zurückgreifen.

Ein CMS aus Papier

Die neuen Überblickseiten, also thematische Verteilerseiten, hatten eine völlig neue Struktur und konnten daher nicht von früher übernommen werden – ganz abgesehen davon, dass sich ja die Navigationsstruktur in wesentlichen Teilen verändert hatte.
Damit wir mit dem Anlegen dieser Seiten aber nicht warten müssen, bis das System betriebsbereit ist, alle Artikel und Bilder importiert sind und die RedakteurInnen eingeschult sind, haben wir uns ein Papier-CMS gebaut. Für jedes zukünftige Template gab’s ein Papiervorlage, in welche die ThemenmanagerInnen die Artikel-ID von der alten Website eintragen konnten.

Die so erfassten Grundstrukturen der deutschen Verteilerseiten wurden von Heinzelmännchen in einem eigens dafür vorbereiteten Spreadsheet erfasst und automatisch in die elf anderen Sprachen konvertiert – Artikel die in den Zielsprachen nicht vorhanden waren, wurden dabei automatisch rausgenommen.
Theoretisch hätte man natürlich die Erfassung auch direkt elektronisch machen können. Es hat sich in der Vorbereitung jedoch schnell herausgestellt, dass es deutlich aufwändiger gewesen wäre, hierfür ein benutzerfreundliches System zusammenzustellen, das man nur ein einziges Mal benötigt, als die Daten händisch zu erfassen.

Die Nachbearbeitung der Überblickseiten direkt im CMS war trotzdem eine der wesentlichen Arbeiten der Transferphase. Die Stimmigkeit des Gesamtbildes und das Zusammenspielen der Teaserbilder musste überprüft werden, Einleitungstexte wurden korrigiert. Besonders aufwändig wird das natürlich in Sprachen jenseits von Deutsch, Englisch und Italienisch. Spätestens bei Ungarisch, Russisch, Japanisch und Arabisch steigen die meisten von uns aus.

Handgemachte Qualität

Und damit sind wir schon beim letzten Arbeitsschritt vor dem Relaunch – zumindest aus Sicht der Inhalte. Die Qualitätssicherung geht ja weit über automatische Linkchecks und HTML-Validierung hinaus – diese waren übrigens gleich mal gute Tests für die Performance des Systems und haben die Server jede Nacht beschäftigt. Untertags hieß es für RedakteurInnen und ÜbersetzerInnen möglichst viele der Seiten nochmals visuell zu überprüfen und aufzuräumen: Seitentitel, die in der Hitze des Gefechts falsch zugeordnet wurden, waren da genauso zu beheben wie lästige Überbleibsel aus dem alten Richtext-Editor: Zeilenumbrüche statt Absätze, Fett statt Zwischenüberschriften und Links, die sich über Zeilenumbrüche hinweg in die (über)nächste Zeile fortsetzten.