Wie digitale Technologien die moderne Wirtschaftsforschung bereichern – ein Werkstattbericht

Hochauflösende Luftbilder – ausgewertet mit Techniken des maschinellen Lernens – können genutzt werden, um Erfolgsindikatoren für Bauprojekte in der Schweiz zu erstellen. Bisher war es nicht möglich, zu messen, ob geplante Bauprojekte umgesetzt wurden oder nicht. Erste Ergebnisse eines KOF-Pilotprojekts deuten darauf hin, dass vor allem nach der Zweitwohnungsinitiative von 2012 viele Bauvorhaben unvollendet blieben.

Mit zunehmender Komplexität und Umfang der verfügbaren Datensätze ändern sich Methoden der Wirtschaftswissenschaften und der Bedarf an aufwendigeren Berechnungsmethoden. Die ökonomische Forschung stützt sich zunehmend auf Methoden des maschinellen Lernens, sowohl bei der Datengenerierung als auch bei der Auswertung grosser Datensätze. Dabei lassen sich grob zwei Richtungen unterscheiden: Methoden des Neuro-Linguistischen Programmierens (NLP), also Daten aus Text, und Computer Vision, d.h. Daten aus Bildmaterial.

Text als Datenquelle erfreut sich schon seit einiger Zeit grosser Beliebtheit. So werden beispielsweise im Finanzwesen Texte aus Finanznachrichten, sozialen Medien und Unternehmensberichten verwendet, um die Entwicklung von Vermögenspreisen vorherzusagen und kausale Auswirkungen neuer Informationen zu untersuchen. Auch in der Makroökonomie werden Texte als Datenquellen verwendet, beispielsweise um Fluktuationen bei Inflation und Arbeitslosigkeit vorherzusagen, die Auswirkungen politischer Unsicherheit abzuschätzen und geldpolitische Entscheidungen besser zu verstehen (Baker, Bloom und Davis, 2016; Tetlock, 2007; Anderes, Rathke, Streicher und Sturm, 2021).

Bilder als Datenquelle – ein unterschätztes Potenzial

Im Gegensatz dazu ist die Verwendung von Bildern als Datenquelle in der Forschung noch nicht so weitverbreitet. Das liegt wohl daran, dass Bilder schwer in konsistenter Qualität sind und deren Zugang oft beschränkt ist. Ausnahmen hiervon finden sich insbesondere in der Entwicklungsökonomie. So wird zum Beispiel die Entwicklung von Slums durch die Betrachtung von Dachbaustoffen untersucht oder die Qualität von Stränden und Gewässern anhand von Bildern für den Tourismus analysiert (Faber und Gaubert, 2019). Auch städtische Strukturen und Ungleichheiten können auch anhand von Bildern untersucht werden, z.B. kann die Helligkeit in der Nacht zu diesem Zweck genutzt werden (Galimberti, Pleninger und Pichler, 2021).

Die KOF hat das Potenzial von Bilddateien erkannt und verwendet diese für ein neues Pilotprojekt. Als Datenquelle dienen hochauflösende Bilddaten, die das Bundesamt für Landestopografie (Swisstopo) für Forschungszwecke zur Verfügung stellt (siehe Grafik G 6). Mithilfe dieser Bilder soll ermittelt werden, ob Baugenehmigungen in der Schweiz umgesetzt werden. Im Folgenden wird ein «Werkstattbericht» über den Bauerfolg-Indikator vorgestellt.

Die Erstellung des Bauerfolg-Indikators

Die Grundidee des Bauerfolg-Indikators ist einfach: Es werden Bildteile verwendet, die Bauprojekte zu verschiedenen Zeitpunkten darstellen. Ist der Unterschied zwischen einem Bildteil und dem nächsten gross, so dass darauf z.B. ein verändertes Gebäude zu sehen ist, ergibt sich ein Signal für einen Umbau. Ist dies nicht der Fall, bleibt das Signal aus. In Grafik G 7 – Beobachtungen im Zeitraffer sollte beispielsweise ein Signal für Neubau (6. Bild von links) vorliegen.

Obwohl die Grundidee einfach ist, wirft das Projekt einige Probleme auf. Zum einen ist die Erstellung der Bildserien umfangreich und erfordert einen Prozess, der von den jeweiligen Koordinaten einer Baugenehmigung abhängt. Grafik G 6 veranschaulicht den Prozess. Schritt für Schritt wird für jede Beobachtung eine Vergrösserung erstellt.

Zum anderen sind klassische statistische Methoden zur Analyse von Bildveränderungen ungeeignet – jedes Pixel in den Farben Rot, Gelb und Grün bestimmt einen Eingabeparameter, was mehr als 150 000 Variablen pro Bild entspricht. Es ist daher notwendig, die Datenmenge zu reduzieren und in einem zweiten Schritt ein Modell darauf aufzubauen, das es ermöglicht, mit weniger Trainings-daten deutliche Fortschritte bei der Klassifizierung zu erzielen. Dieser Prozess wird als Transferlernen bezeichnet.

Beim Transferlernen werden Modelle verwendet, deren Parameter bereits anhand von markierten Daten festgelegt wurden, die aber wenig mit Fernerkundungsbildern zu tun haben und sich auf verschiedene Unterkategorien beziehen können (z.B. Tiere, Möbel und andere Objekte). Nichtsdestotrotz können diese Modelle, die auf Convolutional Neural Networks (CNN)1 basieren, Kanten, Farbkombinationen und Hauptkomponenten aus Bildern extrahieren. Dies geschieht über mehrere Schichten (siehe Grafik G 8). Sogenannte «Convolutional Layer» fassen Pixel-Matrizen wie Filter in Vektoren zusammen (dargestellt in Schritt (1.)). Bevor diese weiter genutzt werden können, um ein Objekt zu klassifizieren, wird das Netzwerk abgebrochen (dargestellt in Schritt (2.)). Die erhaltenen Vektoren sind nun eine stark reduzierte Version eines Bildes.

Sodann werden die beschriebenen Vektoren in Grafik G 9 nochmals dargestellt. Die Vektoren werden voneinander subtrahiert und bilden den Input für ein neues Modell (dargestellt in Schritt (4.)). Das ausgewählte Modell (4.) kann nunmehr mit deutlich weniger Eingabeparametern (X1, X2, X3) arbeiten und erzielt am Beispiel unserer Daten eine Trefferquote von über 85%. In Anbetracht der Tatsache, dass viele Baustellen aus der Luft kaum von Neubauten zu unterscheiden sind, sind dies extrem gute Ergebnisse.

Die Ergebnisse des Bauindikators

Grafik G 10 zeigt die Ergebnisse des beschriebenen Verfahrens und den finalen Bauerfolg-Indikator. Die Y-Achse gibt die aggregierte durchschnittliche Erfüllungsrate an, d.h., ob das Baugesuch von dem Algorithmus als erfolgreich (+1) oder nicht erfolgreich (-1) eingestuft wurde. Die Daten wurden so normiert, dass der Durchschnitt gleich null und die Varianz gleich eins ist. Um die Aussagekraft der generierten Erfolgsrate zu testen, wird auf die Zweitwohnungsinitiative fokussiert, die am 11. März 2012 in Kraft trat und ein Verbot von neuen Zweitwohnungen vorsieht, sobald der Anteil der Zweitwohnungen in einer Gemeinde 20% übersteigt. Der graue Balken in der Abbildung stellt den Zeitraum ab Inkrafttreten der Initiative bis zum 31.12.2012 dar. Die Hypothese ist, dass aufgrund der Initiative weniger Bauvorhaben erfolgreich waren.

In der Grafik zeigt sich ab Inkrafttreten der Initiative ein deutliches Absinken des Bauerfolg-Indikators, mit einem Tiefstand im Herbst 2013. Das ist wohl damit zu erklären, dass das überraschende Abstimmungsergebnis zu einer Flut von Anträgen geführt hat, die überproportional von denjenigen eingereicht wurden, die noch auf die Umsetzung ihres Bauprojekts hofften, bevor die Initiative in Kraft getreten ist. Diese Anträge dürften schlechter geplant worden oder unter das Verbot gefallen sein. Die daraus resultierende Erfüllungsquote ist daher in diesem Zeitraum deutlich niedriger und zeichnet sich so auch in der Grafik ab. Eine detailliertere Analyse der Bauerfolgsquote ist noch notwendig, um externe Faktoren auszuschliessen, so dass kausale Schlussfolgerungen aus diesem Pilotprojekt gezogen werden können.

Schliesslich stellt die Anwendung dieser Algorithmen und Bilddaten eine enorme Chance für die Wirtschaftswissenschaften dar, zumal immer mehr Petabytes an Satellitenbildern öffentlich verfügbar werden und moderne Cloud-basierte Rechenleistungen zur Verfügung stehen. Insbesondere mit der zunehmenden Bedeutung von Umweltthemen dürfte auch die Bedeutung für die Sozialwissenschaften wachsen und eine intensivere Beschäftigung mit Luftbildern zu erwarten sein.

-----------------------------------

1 CNNs sind – grob vereinfacht – vielschichtige, neurale Netzwerke, die vor allem in der Bildverarbeitung zum Einsatz kommen.

Literatur

Anderes, Mark, Alexander Rathke, Sina Streicher, and Jan-Egbert Sturm (2021): externe SeiteThe role of ECB communication in guiding markets. Public Choice 186:3-4, 351-383.

Baker, Scott R., Nicholas Bloom, and Steven J. Davis (2016): Measuring economic policy uncertainty. The Quarterly Journal of Economics 131:4, 1593-1636, externe Seitehttps://doi.org/10.1093/qje/qjw024

Faber, Benjamin, and Cecile Gaubert (2019): Tourism and economic development: Evidence from Mexico's coastline. American Economic Review 109:6, 2245-93, externe Seitehttps://doi.org/10.1257/aer.20161434

Galimberti, Jaqueson K., Stefan Pichler, and Regina Pleninger (2021): Measuring inequality using geospatial data. No. 493. KOF Working Papers, 2021, externe Seitehttps://doi.org/10.3929/ethz-b-000473903

Tetlock, Paul C. (2007): Giving content to investor sentiment: The role of media in the stock market. The Journal of Finance 62:3, 1139-1168,
externe Seitehttps://doi.org/10.1111/j.1540-6261.2007.01232.x
 

Kontakt

Tim Reinicke
  • LEE G 207
  • +41 44 632 32 53

KOF FB Konjunktur
Leonhardstrasse 21
8092 Zürich
Schweiz

JavaScript wurde auf Ihrem Browser deaktiviert