Schnellauswahl

Tausend Daten sind ein Bild

(c) Www.BilderBox.com (Www.BilderBox.com)
  • Drucken

Visual Analytics hilft, sich ein Bild von riesigen Datenmengen zu machen. Ein Laura- Bassi-Zentrum erforscht interaktive Methoden der Bilddarstellung.

Zuerst schaun wir mal, dann sehn wir schon! Das mag eine Binsenweisheit sein – und doch beinhaltet sie viel Wahres. Denn um zu sehen, wie die Dinge liegen, muss man zuerst genau hinschauen. Wissenschaftler sind im „Genau-Hinschauen“ besonders geübt; je mehr Daten sie aber sammeln, umso schwieriger wird das Finden von Mustern und Tendenzen, die darin versteckt sind.

Der Umgang mit sogenannten „Datenfriedhöfen“ muss dann von langer Hand vorbereitet werden, um Ergebnisse sichtbar zu machen. Im Fachjargon spricht man von „Visual Analytics“. Grundidee dieser Forschungsrichtung ist, die hervorragenden Fähigkeiten des Menschen beim Erkennen visueller Darstellungen mit den automatischen Verarbeitungsmöglichkeiten von Computersystemen zu verbinden.

Darauf konzentriert sich Silvia Miksch (Donau-Universität Krems). Sie leitet ab Dezember eines der acht Laura-Bassi-Zentren, die über das BMWFJ finanziert werden und Frauen in der Spitzenforschung fördern. Einen Teil der Finanzierung tragen die Wirtschaftspartner des jeweiligen „Laura-Bassi Centers of Expertise“. Bei Miksch' CVAST (Center for Visual Analytics Science and Technology) sind das die heimischen Unternehmen Artaker und Ximes.


Malen nach Zahlen. „Am einfachsten kann man Datenvisualisierung mit ,Malen nach Zahlen‘ beschreiben“, sagt Miksch und demonstriert das anhand einer – vorerst nichtssagenden – Zahlenkolonne. Ordnet man die Zahlen nach gegebenen X- und Y-Werten der Koordinaten und verbindet sie in der richtigen Reihenfolge durch Linien, so sieht man – wie in einem Rätselbuch für Kinder –, dass die verbundenen Zahlen das Bild eines Elefanten ergeben. So einfach wie im Beispiel ist wissenschaftliche Visualisierung freilich nicht! Oft geht es um Millionen von Daten, die Forscher analysieren und darstellen müssen, um sich – im wahrsten Sinne des Wortes – ein „Bild davon zu machen“.

„Es geht uns aber nicht nur um schöne Bilder“, betont Miksch. Was herkömmliche Statistikprogramme können, muss man nicht neu erfinden. Viel wichtiger ist es, den Forschern durch „Visual Analytics“ Werkzeuge zu liefern, mit denen sie interaktiv – auch spielerisch – die Darstellung und Analyse ihrer Daten gestalten können. Als Beispiel zeigt die Forscherin eine Auswertung von Fragebögen, die magersüchtige Mädchen und deren Umfeld ein Jahr lang nach Verhaltenstherapie-Sitzungen ausgefüllt haben. Das Erkennen, welche Kriterien der Therapie gewirkt haben, lässt sich mit dem von Miksch' Forschungsgruppe entwickelten Werkzeug schnell und einfach darstellen.

Wie bei einem Computerspiel zieht man mit der Maus die Fragebogenergebnisse einzelner Testpersonen in das Auswahlfeld. Diese scheinen dann als kleine Kreise für die jeweiligen Personen auf. Im sogenannten „Federmodell“ werden die Kreise der Testpersonen so nah an das jeweilige Kriterium herangezogen, wie dies im Fragebogen angekreuzt wurde. „Hier unten kann man den Zeitverlauf anklicken“, steuert Miksch auf den „Play“-Knopf zu. Schon rutscht der Kreis der Testperson von links nach rechts – je nachdem, wie sehr sich das Fragebogenkriterium im Laufe des Beobachtungsjahres verändert hat.

„Das Ziel unseres Laura-Bassi-Zentrums sind alle möglichen Fragestellungen, welche die Struktur der Zeit behandeln“, erklärt Miksch. Denn wo man bisher mühsam „Vorher-nachher“-Ergebnisse händisch vergleichen musste, möchte das Visual-Analytics-Team neue Methoden präsentieren, die den Zeitverlauf der Daten ebenso wie die Analyseschritte und -ergebnisse mit all ihren Dimensionen klar und deutlich sichtbar machen. „Ich komme aus der medizinischen Anwendung, aber darauf beschränken wir uns nicht im Team“, erklärt Miksch.

Ein Beispiel für gigantische Datenmengen, die es zu visualisieren und zu analysieren gilt, könnte etwa im Flugbetrieb liegen: Wann sollen einzelne Flugzeuge zur Wartung? Wie sind die Flugpläne? Wie sind die Erfahrungswerte des Personals? Wer ist wann wo? Das alles so klar darzustellen, dass ein Manager sich nicht mehr durch dicke Ordner quälen muss, sondern alle Daten als leicht verständliche Visualisierung vor sich hat und interaktiv alle Möglichkeiten durchprobieren kann, ist das Ziel von Miksch.

Um dahin zu kommen, entwickelt das Team auch analytische Methoden, quasi „Datenreduzierer“. Da wird mit Mittelwerten, Clustern und Musterfindung gearbeitet, um aus einem großen Haufen an Daten einen überschaubaren zu machen. „Wir ersetzen damit aber nicht die Statistik“, so Miksch. Vielmehr sollen die analytischen Methoden auf das abgestimmt werden, was zur Visualisierung benötigt wird.

„Unser System kann man sich wie Legobausteine vorstellen: Wir liefern die ,Bodenplatte‘ als Grundstruktur. Auf diese sollen unsere Werkzeuge wie Bausteine so passen, dass man daraus Anwendungen bauen kann, die den Anforderungen der Nutzer optimal entsprechen.“


Benutzerfreundlich. Auch was den Leuten am besten gefällt, wird im neuen Team untersucht. Schlagwörter wie „Usability-Studien“ und „Erkenntnisstudien“ fallen hier. Keine Anwendung zu entwickeln, ohne die Verständlichkeit und Benutzerfreundlichkeit zu untersuchen – das schwebt dem Laura-Bassi-Team vor.

Bisher besteht das Team noch aus wenigen Frauen. Abgesehen von Silvia Miksch, Margit Pohl von der TU Wien und Sabine Wahl von Ximes sind die Visual-Analytiker derzeit noch ausschließlich Männer. „Bei Einstellungen für das neue Team suchen wir aber speziell nach Frauen“, sagt Miksch „Es ist schade, dass so wenige Frauen ein Informatikstudium abschließen, aber die wollen wir gezielt ansprechen.“ Es ist nämlich erklärtes Ziel der Laura-Bassi-Förderung, die Frauenquote in der Forschung zu erhöhen, deren exzellente Forschungsleistungen sichtbar zu machen und neue Karriereoptionen für alle Forschungsmitarbeiter und -mitarbeiterinnen zu eröffnen.

("Die Presse", Print-Ausgabe, 25.10.2009)