Die erzeugten Grafiken sollen im Buch in einer hohen Druckqualität dargestellt werden. Da sie nach unseren Vorstellungen hauptsächlich aus Typographie und Farbflächen bestehen sollen, fiel die Wahl auf ein Beschreibungsformat, welches Grafiken vektoriell und nicht pixelbasiert beschreibt. Zudem sollte das Format der Ausgabedatei durch einen Algorithmus geschrieben werden können, um einen voll automatisierbaren Prozess zu erhalten. Dazu war es wichtig, ein "offenes" Format zu wählen, dessen interne Syntax dokumentiert ist und das von den Programmen für das Layout des Buches [ad.03] problemlos weiterverarbeitet werden kann. Das Scalable Vector Graphics Format des W3C Gremiums, welches auf Vorschlag unter anderem von Adobe definiert wurde, erfüllte diese Anforderungen und brachte zudem den Vorteil mit sich, in einer XML-ähnlichen Form auch für Menschen lesbar zu sein.
Schnell und flexibel Änderungen an den Regeln zur Erzeugung der Grafiken vornehmen zu können, war eine weitere Anforderung an den Generierungsprozess. Aus diesem Grund wurde mit Macromedia Director ein Autorensystem mit interpretierter Programmiersprache [ad.07] zur Implementierung des Algorithmus gewählt. Director ermöglicht direkten Eingriff in die Skriptverarbeitung ohne Neukompilierung und verfügt über mächtige Funktionen zur Manipulation von Texten, Worten und Zeichen. Weiterhin eröffnet das Autorensystem die Möglichkeit, neben der Ausgabe der Grafiken im SVG-Format diese ebenso ohne grösseren Aufwand innerhalb des Programms anzuzeigen.
Der Prozess der Generierung der Grafiken läuft in verschiedenen Schritten sequenziell ab und wird für jede neue Erzeugung derselben Grafik teilweise wiederholt. Er beginnt mit dem Einlesen und "Säubern" des Artikeltextes. Dabei werden Leerabsätze, Leerzeichen, Sonderzeichen und so weiter umgewandelt oder gestrichen. Der saubere Text wird dann Wort für Wort gefiltert (siehe "Stoppwortliste" weiter oben) und gezählt. Das Resultat ist eine Tabelle mit allen vorkommenden Worten des Artikels und deren Häufigkeit des Auftretens. Diese Datenaufbereitung muss nur einmal pro Artikel erfolgen und kann dann als Zwischenergebnis gespeichert werden. Daraus lässt sich beispielsweise berechnen werden, wieviele Worte Füllfunktion haben oder mehrfach vorkommen, wieviele Worte alleinstellend sind und diese Werte können auf die gesamte Länge des Artikels normiert werden.
In einem zweiten Schritt werden Korrelationen zwischen Artikeln berechnet. Für jedes Wort wird der Zweitautor ermittelt und die relativen Häufigkeiten verglichen, um festzustellen, für welchen der beiden Autoren und ihre Artikel dieses Wort "wichtiger" ist.
Darauf folgen geometrische Berechnungen, die die erhobenen Daten in grafische Gebilde (in unserem Fall hauptsächlich Kreise) umwandeln. Dabei variieren die Position des Mittelpunkts, Radius, Füllfarbe, Textbeschriftungsfarbe und Transparenz der Kreise je nach erhobenen Daten.
Die grafischen Konstrukte werden in der Beschreibungssprache SVG ausgedrückt und in eine Ausgabedatei geschrieben. Nachdem alle Beschreibungen für eine Inhaltsgrafik zusammengefügt sind, wird die Datei geschlossen und an ein Browser-Programm mit Softwarebestandteil zur Anzeige von SVG-Dateien [ad.08] weitergeleitet. Dieser Bestandteil wandelt dann die Beschreibung in eine visuelle Form um.
Das verwendete Autorensystem Director besitzt selbst auch eine Anzeigemöglichkeit für vektorbasierte Grafiken. Damit wäre eine direkte Anzeige innerhalb des Autorensystems ebenso möglich und würde eventuell durch einfachere Eingriffsmöglichkeit während der Generierung den forschenden Entwicklungsprozess vereinfachen. In unserem Fall haben wir auf diese alternative Ausgabe aus Zeitgründen verzichtet.
Die Inhaltsgrafiken lassen sich in drei strukturelle Ebenen aufgliedern, die jeweils unterschiedliche Informationen visualisieren.
Der Hintergrund der Grafik befasst sich mit einer Einordnung des fraglichen Artikels in den Gesamtkontext der anderen Artikel.
Konzentrische Kreise repräsentieren alle Artikel des Buches, wobei der Radius proportional zur Anzahl der Zeichen eines Artikels ist. Die langen Artikel haben also die am weitesten aussen liegenden Kreise.
Weiterhin gibt es einen nach dem Farbkreis nach Johannes Itten codierten Sektorabschnitt für jeden Artikel, der seinen Kreiswinkel aus der Anzahl der Worte bezieht, die zwischen dem fraglichen Artikel und dem Zweitautor übereinstimmen. Hat der Artikel mit einem weiteren Artikel viele Worte gemeinsam, wird der weitere Artikel mit einem grossen Farbsektor repräsentiert.
Der Radius des Sektorabschnitts ergibt sich wie bei den konzentrischen Ringen aus der Länge des jeweiligen Artikels. Die Artikel sind in der Abfolge innerhalb des Buches angeordnet, sodass der erste Artikel oben am Kreis startet und die weiteren im Uhrzeigersinn folgen.
Der Radius des weissen Freiraumes in der Mitte der Sektorabschnitte ist im Radius relativ zur Länge der anderen Artikel. Dabei ist die Distanz zwischen Mittelpunkt und Radius des Weissraums und die Distanz zwischen Weissraumradius und äusserstem konzentrischen Kreis proportional zum Verhältnis der Längen zwischen fraglichem Artikel und dem längsten Artikel des Buches. Ein kurzer Artikel hat also wenig zentralen Weissraum, ein langer Artikel hat davon viel. Die Segmentabschnitte haben dann "Längen" die der jeweiligen Artikellänge entsprechen. Zur Verdeutlichung des Farbcodes haben wir einen Aussenrand mit voll deckender Farbe verwendet, der am konzentrischen Kreis für diesen Artikel angesetzt ist.
Die Barcode-ähnliche Struktur, die innerhalb des konzentrischen Kreises des fraglichen Artikels angesetzt ist, schlüsselt die Struktur des Artikels selbst auf.
Der Kreiswinkel eines jeweiligen Abschnitts entspricht der Länge der Absätze untereinander, ebenso die Transparenz. Ein langer Abschnitt innerhalb des Textes hat eine helle Farbe (hohe Transparenz, niedrige Deckkraft) und einen grossen Kreiswinkel. Der Anteil der weissen Fläche am Ende der Barcodes hin zu einem Vollkreis ist proportional zur Länge der Fussnoten und Quellenhinweise am Ende des Textes [ad.09]. Ein grosser Weissbereich im Barcode-Ring deutet demnach auf einen Artikel mit vielen Fussnoten oder Quellenangaben hin.
In der Vordergrundebene liegen nun die Wortkreise, die eine Auswahl der häufigst vorkommenden Worte in einem Artikel wiederspiegeln. Die Häufigkeit (und damit teilweise auch die Wichtigkeit) eines Wortes ist proportional zu seinem Schriftgrad und zum Radius des Kreises. Die Farbe der Wortkreise entspricht der dem Autor zugeordneten Grundfarbe, die ihm durch den Farbkreis und die Stellung innerhalb des Buches zugeordnet ist. Sie wird mit einer reduzierten Deckkraft verwendet, um bei Überlagerungen verschiedener Wortkreise zu Verstärkungen und Hervorhebungen zu führen.
Die Position der Wortkreise zeigt zum einen an, welcher Zweitautor ein Wort ausserhalb des fraglichen Artikels am häufigsten verwendet hat. Entsprechend werden die Wortkreise in den jeweiligen Sektorenabschnitten plaziert. Zum anderen entspricht die Position auf der radialen Achse zwischen fraglichem Autor im Zentrum und Zweitautor am Rand dem Häufigkeitsverhältnis zwischen den beiden Artikeln. Ist der Begriff für den Zweitautor in dessen Artikel "wichtiger" als für den fraglichen Artikel, so ist der Wortkreis näher am Zweitautor plaziert und umgekehrt.
Wortkreise im Zentrum sind alleinstellend und haben keinen Zweitautor. Entsprechend ist ihre Schriftfarbe grau und ihre radiale Position im Weissraum entspricht ihrer Häufigkeit im Text. Worte im Zentrum sind dabei häufig, Worte am Rand selten. Der Kreiswinkel der Wortkreise wird entsprechend der alphabetischen Position ihres Anfangsbuchstabens berechnet. Innerhalb eines Sektorabschnitts sind im Uhrzeigersinn also zuerst Worte mit a, b, c, etc. platziert.
Mit einem möglichst voll automatisierbaren Verfahren, welches hauptsächlich auf Worthäufigkeiten basiert, sollte eine Inhaltsgrafik zu Artikeln geschaffen werden. Ein wichtiger Augenmerk lag dabei neben dem Informationsgehalt auf der (subjektiven) Ästhetik der Darstellung. Im beschriebenen Entwicklungsprozess achteten wir immer wieder auf den subjektiven Eindruck des Rezipienten und justierten die Regeln der Umsetzung von erhobenen Daten zu grafischen Konstrukten, um Leser über die Informationsgrafiken auch intuitiv zu inhaltlichen Schlüssen über den Artikel zu leiten. Ob dieser Versuch geglückt ist, entscheiden die Leserinnen und Leser...
nächste Seite...