Siegel der Universität Heidelberg
Bild / picture

Vom Bild zur Information

Vom Verständnis der Vorgänge im Innern einer Zelle über das industrielle Schweißen mit Laserstrahlen oder das Bestimmen des Gasaustausches an der Meeresoberfläche reichen die Einsatzmöglichkeiten der modernen Bildverarbeitung, die aus Bilddaten quantitative Informationen extrahiert. Vor welchen Herausforderungen die Forscher dabei stehen und wie sie sie meistern, schildert der Beitrag von Fred Hamprecht und Bernd Jähne vom Interdisziplinären Zentrum für Wissenschaftliches Rechnen.  

Das visuelle System ist für uns Menschen und viele andere Lebewesen das wichtigste Instrument, um sich in der Umwelt zu orientieren und Informationen zu erfassen. Auch aus der Technik und Grundlagenforschung ist die Aufnahme und Analyse bildhafter Informationen nicht mehr wegzudenken. Jedes Produkt, das wir benutzen, durchläuft beispielsweise während seiner Herstellung eine automatische visuelle Inspektion, die sicherstellt, dass es keine Mängel aufweist. Dieser Beitrag will einige wissenschaftliche Fragen illustrieren, die der Extraktion quantitativer Information aus Bilddaten bedürfen, und damit einen Einblick in die Arbeiten der Forschergruppen Bildverarbeitung und multidimensionale Bildverarbeitung geben.

Auf der technischen Seite lassen sich diese Aufgaben grob aufteilen in Bildverarbeitung, Bildauswertung und Bildverständnis. Bei der Bildverarbeitung werden wichtige Merkmale, etwa Kanten oder Bewegungen, hervorgehoben, andere unwichtige Merkmale oder Rauschen hingegen unterdrückt. Das Auffinden von Kanten kann etwa einer anschließenden Lagebestimmung dienen, wie sie für automatisch greifende Roboter erforderlich ist. Autonom navigierende Fahrzeuge müssen den weiteren Verlauf der Straße finden und können sich beispielsweise an Straßenmarkierungen oder Leitplanken orientieren, die sich durch leicht aufzufindende Kanten auszeichnen.

Ein Bereich, in dem das automatische Unterdrücken von Bildrauschen einer weiteren Analyse zwingend vorausgeht, ist die Untersuchung dynamischer Prozesse in Mikro- und Nanostrukturen in den Lebenswissenschaften. Zu deren Beobachtung ist bei den notwendigen hohen Auflösungen nur ganz wenig Licht verfügbar, weshalb die Bilder stark verrauscht sind. Ein Beispiel hierfür ist das Untersuchen der Funktionsweise von Muskeln auf molekularer Ebene.

Zusammen mit Wissenschaftlern des Physiologischen Instituts der Universität Heidelberg haben wir das Bewegungsvermögen von so genannten Motorproteinen untersucht. Eine Analyse der Bewegung in diesen Bildsequenzen war aber erst möglich, nachdem das Rauschen durch eine spezielle, nichtlineare Filtertechnik reduziert wurde, welche die Bildinformation über die sich bewegenden Fibrellen nicht veränderte.

Ein echtes Bildverständnis zu erreichen, ist ein überaus ambitionierteres Problem: Das Ziel ist, einen Computer eine Szene inhaltlich verstehen zu lassen. Vom Erreichen dieses Zieles sind wir derzeit noch genauso weit entfernt wie vom Bau einer Maschine, die die Inhalte gesprochener oder geschriebener Sprache versteht. Ein mögliches Einsatzgebiet wären zum Beispiel Überwachungssysteme, die unterscheiden können, ob zwei Jugendliche bloß raufen oder ob ein Mensch ernstlich in Not ist. Die Bildauswertung steht zwischen den eben beschriebenen Gebieten: Sie hat zum Ziel, aus räumlichen Daten quantitative Merkmale herauszulesen, und von diesen Merkmalen ausgehend eine abhängige Größe oder eine Klassenzugehörigkeit vorherzusagen.

Die Grenze des heute Machbaren zieht sich mitten durch die Gebiete der Bildverarbeitung und -auswertung. Im Folgenden wollen wir beispielhaft einige Anwendungen vorstellen, die diesseits der Grenze liegen und so ihren Verlauf erahnen lassen.

Der Wirkungsgrad von Verbrennungsmotoren liegt, durch die Gesetze der Thermodynamik bedingt, unter 30 Prozent. Um den Wirkungsgrad zu erhöhen, werden immer höhere Einspritzdrücke benötigt. Die Komponenten sind dabei hohen Belastungen ausgesetzt. Fallen sie aus, wird es gefährlich – wer möchte schon mitten auf der Autobahn stehen bleiben – und teuer. Das Ziel ist also, dass jedes der circa 15 000 Teile, die täglich in einer Fertigungslinie geschweißt werden, einwandfrei sein soll. Dieses Ziel wird erreicht, indem der Schweißvorgang selbst überwacht wird.

Wer schon einmal das kleine Feuerwerk beobachtet hat, das entsteht, wenn ein Stahlträger mit einem Schweißgerät durchtrennt wird, ahnt, dass eine Schweißung ein hochdynamischer Prozess ist. In der Serienfertigung wird freilich mit einem Laser anstatt einer Acetylenflamme gearbeitet. Und die Positioniergenauigkeit eines Schweißroboters ist der menschlichen weit überlegen. Das ändert aber nichts daran, dass das Schweißbad selbst eine ziemlich unruhige Umgebung darstellt. In dieser Umgebung gilt es nun, störende Ereignisse wie etwa Spritzer zu detektieren. Es lässt sich leicht denken, dass ein Computer nicht ohne Weiteres dazu zu bringen ist, einen schnell fliegenden, kleinen Spritzer aus geschmolzenem Metall vom Hintergrund zu unterscheiden. Erschwerend kommt hinzu, dass diese Fehler selten auftreten: zwischen ein und zwei Mal pro 15 000 Wiederholungen. Es ist also nicht einfach, einen repräsentativen Satz von Fehlern zu sammeln, die als Muster verwendet werden können. Diese Aufgabe konnte von den Doktoranden Martin Brocke und Sören Hader in zwei Stufen gelöst werden. Und zwar wie folgt: Eine sehr schnelle Kamera – die heute eingesetzten liefern bis zu 3000 Bilder pro Sekunde – schaut durch eine spezielle Optik entlang dem Laserstrahl in das Schweißbad. Verdächtige Ereignisse, auch Ausreißer genannt, werden mit Methoden aus der so genannten robusten Statistik identifiziert. Diese Methoden haben die Eigenart, sich bei der Schätzung einer Größe nicht von weit außenliegenden Beobachtungen irreführen zu lassen. Der Preis dieser erhöhten Stabilität besteht darin, dass nicht mehr alle Beobachtungen in die Schätzung einfließen, selbst wenn sie ungestört sind. Wenn umgekehrt ein einzelner Messwert stark von der robusten Schätzung abweicht, kann er als Ausreißer identifiziert werden.

In einem zweiten Schritt müssen die herausgefilterten auffälligen Ereignisse klassifiziert werden. Handelt es sich tatsächlich um einen Spritzer? Oder nur um eine harmlose Aufhellung? Hierzu werden geometrische Eigenschaften herangezogen, zum Beispiel die Größe einer Auffälligkeit, ihre Form und so fort.

Die vorgeschlagene Methode zur Detektion von Auffälligkeiten ist auf weitere Probleme anwendbar. So stellen die Ozeane riesige Reservoirs für Gase dar. Die Austauschgeschwindigkeiten dieser Gase mit der Atmosphäre sind entscheidend für Vorhersagen zur zukünftigen Entwicklung des Weltklimas. Die Vorgänge an der Wasseroberfläche lassen sich zum Beispiel mit der Infrarot-Thermographie verfolgen. Sie liefert ein direktes Wärmebild der Oberfläche. Die Wärme wiederum lässt Schlüsse zu über die Geschwindigkeit, mit der das Wasser nahe der Oberfläche umgewälzt wird.

Auch die zur Ereignisdetektion entwickelten Programme lassen sich ohne Änderung verwenden, um weitere Probleme zu lösen. In der Ruperto Carola, Ausgabe 1/2003, berichtete Professor Werner Hofmann vom Max-Planck-Institut für Kernphysik über die Cherenkov-Teleskopie, die dem Studium kosmischer Gammaquellen dient. Ein dabei auftretendes praktisches Problem ist die Trennung der "echten" Signale von ähnlich aussehenden Störsignalen. Die für das Laserschweißen entwickelte Algorithmik kann auch diese Aufgabe mit hoher Präzision lösen.

Die beschriebenen Beispiele lassen die Grenzen des heute Möglichen erahnen. Sie illustrieren aber zugleich, dass Gegenstände industrieller und universitärer Forschung aus ganz verschiedenen Anwendungsbereichen zu ähnlichen Formulierungen führen und mit ähnlichen oder gleichen Methoden gelöst werden können. Diese Sicht der Dinge wird von der Industrie geteilt, die sich folgerichtig auch in der universitären Forschung engagiert und von den neuesten Entwicklungen profitieren kann.

Autoren:
Professor Fred Hamprecht und Professor Bernd Jähne,
Interdisziplinäres Zentrum für Wissenschaftliches Rechnen, 69120 Heidelberg,
Telefon (0 62 21) 54 88 00/54 88 27,
e-mail: fred.hamprecht@iwr.uni-heidelberg.de und bernd.jaehne@iwr.uni-heidelberg.de

Seitenbearbeiter: Email
zum Seitenanfang