Vom Bild zur Information
Vom Verständnis der Vorgänge im Innern einer Zelle über das industrielle Schweißen mit Laserstrahlen oder das Bestimmen des Gasaustausches an der Meeresoberfläche reichen die Einsatzmöglichkeiten der modernen Bildverarbeitung, die aus Bilddaten quantitative Informationen extrahiert. Vor welchen Herausforderungen die Forscher dabei stehen und wie sie sie meistern, schildert der Beitrag von Fred Hamprecht und Bernd Jähne vom Interdisziplinären Zentrum für Wissenschaftliches Rechnen.
Das visuelle System ist für
uns Menschen und viele andere Lebewesen das wichtigste Instrument, um
sich in der Umwelt zu orientieren und Informationen zu erfassen. Auch
aus der Technik und Grundlagenforschung ist die Aufnahme und Analyse
bildhafter Informationen nicht mehr wegzudenken. Jedes Produkt, das wir
benutzen, durchläuft beispielsweise während seiner Herstellung eine
automatische visuelle Inspektion, die sicherstellt, dass es keine
Mängel aufweist. Dieser Beitrag will einige wissenschaftliche Fragen
illustrieren, die der Extraktion quantitativer Information aus
Bilddaten bedürfen, und damit einen Einblick in die Arbeiten der
Forschergruppen Bildverarbeitung und multidimensionale Bildverarbeitung
geben.
Auf der technischen Seite lassen sich diese Aufgaben grob aufteilen in
Bildverarbeitung, Bildauswertung und Bildverständnis. Bei der
Bildverarbeitung werden wichtige Merkmale, etwa Kanten oder Bewegungen,
hervorgehoben, andere unwichtige Merkmale oder Rauschen hingegen
unterdrückt. Das Auffinden von Kanten kann etwa einer anschließenden
Lagebestimmung dienen, wie sie für automatisch greifende Roboter
erforderlich ist. Autonom navigierende Fahrzeuge müssen den weiteren
Verlauf der Straße finden und können sich beispielsweise an
Straßenmarkierungen oder Leitplanken orientieren, die sich durch leicht
aufzufindende Kanten auszeichnen.
Ein Bereich, in dem das automatische Unterdrücken von Bildrauschen
einer weiteren Analyse zwingend vorausgeht, ist die Untersuchung
dynamischer Prozesse in Mikro- und Nanostrukturen in den
Lebenswissenschaften. Zu deren Beobachtung ist bei den notwendigen
hohen Auflösungen nur ganz wenig Licht verfügbar, weshalb die Bilder
stark verrauscht sind. Ein Beispiel hierfür ist das Untersuchen der
Funktionsweise von Muskeln auf molekularer Ebene.
Zusammen mit Wissenschaftlern des Physiologischen Instituts der
Universität Heidelberg haben wir das Bewegungsvermögen von so genannten
Motorproteinen untersucht. Eine Analyse der Bewegung in diesen
Bildsequenzen war aber erst möglich, nachdem das Rauschen durch eine
spezielle, nichtlineare Filtertechnik reduziert wurde, welche die
Bildinformation über die sich bewegenden Fibrellen nicht veränderte.
Ein echtes Bildverständnis zu erreichen, ist ein überaus
ambitionierteres Problem: Das Ziel ist, einen Computer eine Szene
inhaltlich verstehen zu lassen. Vom Erreichen dieses Zieles sind wir
derzeit noch genauso weit entfernt wie vom Bau einer Maschine, die die
Inhalte gesprochener oder geschriebener Sprache versteht. Ein mögliches
Einsatzgebiet wären zum Beispiel Überwachungssysteme, die unterscheiden
können, ob zwei Jugendliche bloß raufen oder ob ein Mensch ernstlich in
Not ist. Die Bildauswertung steht zwischen den eben beschriebenen
Gebieten: Sie hat zum Ziel, aus räumlichen Daten quantitative Merkmale
herauszulesen, und von diesen Merkmalen ausgehend eine abhängige Größe
oder eine Klassenzugehörigkeit vorherzusagen.
Die Grenze des heute Machbaren zieht sich mitten durch die Gebiete der
Bildverarbeitung und -auswertung. Im Folgenden wollen wir beispielhaft
einige Anwendungen vorstellen, die diesseits der Grenze liegen und so
ihren Verlauf erahnen lassen.
Der Wirkungsgrad von Verbrennungsmotoren liegt, durch die Gesetze der
Thermodynamik bedingt, unter 30 Prozent. Um den Wirkungsgrad zu
erhöhen, werden immer höhere Einspritzdrücke benötigt. Die Komponenten
sind dabei hohen Belastungen ausgesetzt. Fallen sie aus, wird es
gefährlich – wer möchte schon mitten auf der Autobahn stehen bleiben –
und teuer. Das Ziel ist also, dass jedes der circa 15 000 Teile, die
täglich in einer Fertigungslinie geschweißt werden, einwandfrei sein
soll. Dieses Ziel wird erreicht, indem der Schweißvorgang selbst
überwacht wird.
Wer schon einmal das kleine Feuerwerk beobachtet hat, das entsteht,
wenn ein Stahlträger mit einem Schweißgerät durchtrennt wird, ahnt,
dass eine Schweißung ein hochdynamischer Prozess ist. In der
Serienfertigung wird freilich mit einem Laser anstatt einer
Acetylenflamme gearbeitet. Und die Positioniergenauigkeit eines
Schweißroboters ist der menschlichen weit überlegen. Das ändert aber
nichts daran, dass das Schweißbad selbst eine ziemlich unruhige
Umgebung darstellt. In dieser Umgebung gilt es nun, störende Ereignisse
wie etwa Spritzer zu detektieren. Es lässt sich leicht denken, dass ein
Computer nicht ohne Weiteres dazu zu bringen ist, einen schnell
fliegenden, kleinen Spritzer aus geschmolzenem Metall vom Hintergrund
zu unterscheiden. Erschwerend kommt hinzu, dass diese Fehler selten
auftreten: zwischen ein und zwei Mal pro 15 000 Wiederholungen. Es ist
also nicht einfach, einen repräsentativen Satz von Fehlern zu sammeln,
die als Muster verwendet werden können. Diese Aufgabe konnte von den
Doktoranden Martin Brocke und Sören Hader in zwei Stufen gelöst werden.
Und zwar wie folgt: Eine sehr schnelle Kamera – die heute eingesetzten
liefern bis zu 3000 Bilder pro Sekunde – schaut durch eine spezielle
Optik entlang dem Laserstrahl in das Schweißbad. Verdächtige
Ereignisse, auch Ausreißer genannt, werden mit Methoden aus der so
genannten robusten Statistik identifiziert. Diese Methoden haben die
Eigenart, sich bei der Schätzung einer Größe nicht von weit
außenliegenden Beobachtungen irreführen zu lassen. Der Preis dieser
erhöhten Stabilität besteht darin, dass nicht mehr alle Beobachtungen
in die Schätzung einfließen, selbst wenn sie ungestört sind. Wenn
umgekehrt ein einzelner Messwert stark von der robusten Schätzung
abweicht, kann er als Ausreißer identifiziert werden.
In einem zweiten Schritt müssen die herausgefilterten auffälligen
Ereignisse klassifiziert werden. Handelt es sich tatsächlich um einen
Spritzer? Oder nur um eine harmlose Aufhellung? Hierzu werden
geometrische Eigenschaften herangezogen, zum Beispiel die Größe einer
Auffälligkeit, ihre Form und so fort.
Die vorgeschlagene Methode zur Detektion von Auffälligkeiten ist auf
weitere Probleme anwendbar. So stellen die Ozeane riesige Reservoirs
für Gase dar. Die Austauschgeschwindigkeiten dieser Gase mit der
Atmosphäre sind entscheidend für Vorhersagen zur zukünftigen
Entwicklung des Weltklimas. Die Vorgänge an der Wasseroberfläche lassen
sich zum Beispiel mit der Infrarot-Thermographie verfolgen. Sie liefert
ein direktes Wärmebild der Oberfläche. Die Wärme wiederum lässt
Schlüsse zu über die Geschwindigkeit, mit der das Wasser nahe der
Oberfläche umgewälzt wird.
Auch die zur Ereignisdetektion entwickelten Programme lassen sich ohne
Änderung verwenden, um weitere Probleme zu lösen. In der Ruperto
Carola, Ausgabe 1/2003, berichtete Professor Werner Hofmann vom
Max-Planck-Institut für Kernphysik über die Cherenkov-Teleskopie, die
dem Studium kosmischer Gammaquellen dient. Ein dabei auftretendes
praktisches Problem ist die Trennung der "echten" Signale von ähnlich
aussehenden Störsignalen. Die für das Laserschweißen entwickelte
Algorithmik kann auch diese Aufgabe mit hoher Präzision lösen.
Die beschriebenen Beispiele lassen die Grenzen des heute Möglichen
erahnen. Sie illustrieren aber zugleich, dass Gegenstände industrieller
und universitärer Forschung aus ganz verschiedenen Anwendungsbereichen
zu ähnlichen Formulierungen führen und mit ähnlichen oder gleichen
Methoden gelöst werden können. Diese Sicht der Dinge wird von der
Industrie geteilt, die sich folgerichtig auch in der universitären
Forschung engagiert und von den neuesten Entwicklungen profitieren kann.
Autoren:
Professor Fred Hamprecht und Professor Bernd Jähne,
Interdisziplinäres Zentrum für Wissenschaftliches Rechnen, 69120 Heidelberg,
Telefon (0 62 21) 54 88 00/54 88 27,
e-mail: fred.hamprecht@iwr.uni-heidelberg.de und bernd.jaehne@iwr.uni-heidelberg.de