Kurzfassung: ArUco-Marker können als planare Referenz genutzt werden, um aus einem Smartphone-Foto mittels Homographie ein maßhaltiges Orthofoto zu erzeugen.
Der Scanner-Ansatz ist im separaten Beitrag Scanner als Messinstrument beschrieben. In diesem Beitrag steht die Smartphone-Kamera im Mittelpunkt und die Frage, wie sich eine perspektivische Aufnahme durch eine Homographie projektiv entzerren lässt.
Im Gegensatz zum Scanner, der eine definierte Aufnahmegeometrie vorgibt, ist die Situation bei Smartphone-Aufnahmen grundsätzlich offener. Die Kamera ist frei im Raum beweglich, die Abbildung erfolgt perspektivisch, und die Szene wird projektiv auf die Bildebene transformiert. Unter geeigneten Voraussetzungen kann dennoch eine messbare und maßhaltige Darstellung gewonnen werden.
Entscheidend ist, dass die betrachtete Szene lokal als Ebene modelliert werden kann und dass diese Ebene im Bild eindeutig referenziert ist.
Planare Referenz
Liegt das betrachtete Objekt näherungsweise in einer Ebene, dann lässt sich die perspektivische Abbildung der Kamera durch eine projektive Transformation (Homographie) beschreiben. Diese verknüpft Punkte der Objektebene direkt mit Punkten im Bild.
Formal gilt in homogenen Koordinaten:
\[\mathbf{x}’ \sim H\,\mathbf{x}, \qquad H \in \mathbb{R}^{3\times 3}.\]
Bemerkenswert ist, dass dafür keine explizite Kamerakalibrierung erforderlich ist. Stattdessen genügt es, die Ebene selbst mit bekannten Referenzpunkten auszustatten. Hier kommen ArUco-Marker ins Spiel.
ArUco-Marker als geometrische Referenz
ArUco-Marker werden häufig zur Marker-Erkennung und zur Kameraposen-Schätzung eingesetzt. Für planare Szenen lassen sie sich jedoch auch direkt als geometrische Referenz verwenden, um eine Homographie zwischen Bildebene und Objektebene zu bestimmen.

Werden mehrere ArUco-Marker mit bekannter Anordnung in einer gemeinsamen Ebene platziert, liefern ihre detektierten Eckpunkte im Bild genau die Punktkorrespondenzen, die zur Bestimmung der projektiven Transformation benötigt werden.
In der einfachsten Variante genügt ein gedrucktes Blatt mit vier ArUco-Markern, etwa in den Ecken eines A4-Formats. Die Marker definieren dabei eine eindeutige Ebene, legen über ihre bekannten Abstände den Maßstab fest und ermöglichen durch ihre IDs eine eindeutige Zuordnung.
Die Marker fungieren somit nicht nur als visuelle Markierungen, sondern übernehmen eine geometrische Rolle: Sie bilden einen Messrahmen. Aus den eindeutig identifizierbaren Marker-IDs und den detektierten Eckpunkten entstehen feste Referenzpunkte mit bekannter Lage in der Ebene. Dadurch ist ein Koordinatensystem mit definiertem Maßstab gegeben, und die perspektivische Aufnahme kann rechnerisch so entzerrt werden, dass das Foto in dieser Ebene maßhaltig ausgewertbar ist.
Das A4-Blatt dient hier lediglich als einfaches, gut reproduzierbares Beispiel. Entscheidend ist nicht das Papierformat, sondern dass mehrere eindeutig zuordenbare Referenzpunkte mit bekannter Geometrie in einer gemeinsamen Ebene vorliegen. Die Marker können daher auch anders positioniert werden, etwa auf einer Messplatte, einem Rahmen oder direkt auf einer ebenen Fläche, solange sie in derselben Ebene liegen, nicht kollinear angeordnet sind und ausreichend groß im Bild abgebildet werden.
Von der Homographie zum Orthofoto
Ist die Homographie einmal bestimmt, kann das gesamte Bild rechnerisch auf die Referenzebene zurückgeführt werden. Das Ergebnis ist ein entzerrtes Bild, das sich wie ein Scan interpretieren lässt:
- Parallele Kanten werden wieder parallel.
- Längen und Flächen sind maßhaltig.
- Messungen erfolgen im Koordinatensystem der Ebene, nicht im Bild.
Die Rückabbildung lautet:
\[\mathbf{x} \sim H^{-1}\,\mathbf{x}’.\]
Mit „messbar“ und „maßhaltig“ ist gemeint, dass die Entzerrung nicht nur optisch „geradezieht“, sondern eine geometrische Zuordnung liefert. Jeder Pixel des Orthofotos steht für einen Punkt \((X,Y)\) in der Referenzebene. Der Maßstab ergibt sich aus der bekannten Geometrie des Marker-Layouts, also aus den definierten Positionen und Abständen der Marker in der Referenzebene. Damit lassen sich im zurückprojizierten Bild Längen, Abstände und Flächen bestimmen. Maßhaltig bedeutet, dass diese Messwerte innerhalb der zugrunde gelegten Ebenenannahme mit den realen Abmessungen in der Szene übereinstimmen, sofern die betrachtete Struktur näherungsweise in der Referenzebene liegt.



Die Ränder des entzerrten Orthofotos erscheinen häufig nicht rechteckig, sondern „schief“ oder abgeschnitten. Das ist kein Artefakt der Berechnung, sondern eine direkte geometrische Konsequenz der Entzerrung. Das Orthofoto zeigt genau denjenigen Ausschnitt der Referenzebene, der im Rohfoto tatsächlich sichtbar war. Bereiche der Ebene, die außerhalb des ursprünglichen Bildfeldes lagen, können nicht rekonstruiert werden und fehlen entsprechend im entzerrten Bild. Anschaulich gesprochen wird das perspektivische Bild auf die Ebene „zurückgelegt“. Dabei bildet der sichtbare Bildbereich im Allgemeinen kein Rechteck mehr, sondern ein schiefwinkliges Polygon in der Ebene.
Einordnung
Der Einsatz von ArUco-Markern zur Homographie ist kein Ersatz für vollständige Photogrammetrie und liefert keine „echte“ 3D-Rekonstruktion. Er ist aber ein sehr praktischer Weg, um aus einem einzelnen Foto eine maßhaltige 2D-Darstellung in einer Referenzebene zu gewinnen.
Der Ansatz lohnt sich besonders dann, wenn es schnell gehen soll und der Aufwand überschaubar bleiben muss:
- ein Foto genügt,
- die Referenz entsteht durch einen einfachen Markerrahmen,
- die Auswertung bleibt robust, solange die Szene lokal näherungsweise eben ist.
Das ist kein Allheilmittel, aber für viele Dokumentations- und Messaufgaben im Feld eine sehr brauchbare Zwischenlösung.
Kurz gesagt: Ein Markerrahmen macht aus einer perspektivischen Aufnahme eine entzerrte, messbare Darstellung in der Ebene.
Hinweis: Der Beitrag entstand mit Unterstützung von ChatGPT. Inhaltliche Prüfung, Auswahl und Redaktion liegen beim Autor.
