Vitor ist Analyst für Geographische Informationssysteme beim Berliner PropTech-Startup Homeday. Er zeigt uns sein Setup der GIS-Tools, erklärt, wie sie bei Homeday Geo-Daten verarbeiten und wie sie mit Machine-Learning Vorhersagen über die Entwicklung der Immobilienpreise treffen.

Vita

Nach seinem Studium der Informatik im brasilianischen Vitoria beginnt Vitor ein Praktikum bei INFLOR, einem Anbieter für Verwaltungssoftware für die Forstwirtschaft. In den nächsten acht Jahren arbeitet er sich zum Lead Software Engineer hoch und entscheidet sich dann, seine Karriere in Übersee fortzusetzen. Heute arbeitet Vitor als Senior GIS Analyst bei Homeday.

Tools

  • PostgreSQL, PostGIS, Quantum GIS
  • Google Maps API
  • Java Script, Ruby, Python
  • Slack

Empfehlungen

  • Reddit, ESRI Blog

Social

1800px__img_4519-2

Hi Vitor, um was geht es bei Homeday?

Bei Homeday geht es um den Verkauf und Kauf von Immobilien. Der Preis einer Immobilie hängt dabei sehr stark von ihrer Geolocation ab. Meine Aufgabe ist es, Geo-Daten zu sammeln, zu analysieren und Prozesse zu automatisieren, aufgrund deren wir genaue Preisberechnungen machen können. Ich arbeite also hauptsächlich mit Geolocation-Daten.

Wie sieht deine Arbeit damit genau aus?

Homeday hat mich nach Deutschland geholt, damit ich herausfinde, was der durchschnittliche Verkaufspreis eines Stadtteils ist. Nicht nur das. Ihr Ziel war es, noch eine Ebene tiefer zu gehen. Was ist der Durchschnittspreis in dieser Straße bzw. des Hauses? Ist er teuer oder preiswert? Dafür brauchten sie einen Data Scientist und einen Geo Developer, und weil die Aufgabe alles andere als einfach ist, sind wir da auch noch lange nicht fertig.

Die Datenbasis hierfür wird ständig erweitert und wir arbeiten jeden Tag daran, den Algorithmus kontinuierlich weiterzuentwickeln. Mich hat besonders überrascht, wie schwer es ist, an die Daten zu kommen. Besonders im Vergleich zu Brasilien.

Wie unterscheidet sich Deutschland diesbezüglich von Brasilien?

In Brasilien sind alle Bundesländer gleich strukturiert. Hier in Deutschland hat jedes Bundesland seine eigenen Regeln und seine eigenen Behörden. Dazu kommt, dass die Strukturen in den Städten unterschiedlich sind. In Brasilien gibt es Webseiten, von denen man die Geo-Daten kostenlos herunterladen kann. Ich hatte erwartet, dass es in Deutschland ähnlich sein würde. Aber an die Daten zu kommen, ist alles andere als einfach. Manchmal muss Tobias, der ein Experte darin ist, Geo-Daten zu bekommen, auch schon mal mit öffentlichen Behörden direkt telefonieren, um an die Daten zu kommen.

Das heißt, du bist für Homeday nach Deutschland gekommen?

Genau. Homeday hat mich über LinkedIn angefragt. Das kam zum richtigen Zeitpunkt, weil ich mich bereits darauf vorbereitet hatte, nach Übersee zu gehen.

840px__img_4495

Was hast du vorher gemacht?

Vorher habe ich in Brasilien gearbeitet. Direkt nach dem Studium habe ich ein Praktikum bei INFLOR gemacht. INFLOR ist der Marktführer im Bereich Software zur Verwaltung von Forstbetrieben. Meine Hauptaufgabe war die Entwicklung von Anwendungen zur Verwaltung des Landes unserer Kunden. Für die Forstwirtschaft ist das eine wichtige Sache, besonders wenn man mit Farmen auf mehreren Millionen Hektar Land zu tun hat. Damals wusste ich wirklich noch gar nichts und ich lernte in der Firma viel über Geographie und Forstwirtschaft.

Bei dieser Firma war ich neun Jahre und dort habe ich mich vom Praktikanten zum Senior Developer und später noch zum Gebietsleiter hochgearbeitet. Sie hatten mir sogar angeboten, Partner der Firma zu werden. Es war eine schöne Zeit und tolle Erfahrung. Allerdings fehlte die Herausforderung und ich entschied mich, nach Übersee zu gehen. Im Nachhinein ein bisschen verrückt. Einige Monate vor der Anfrage von Homeday begann ich schon, mein Englisch zu verbessern. Mein Ziel war es, fließend sprechen zu können, was mir jetzt sehr hilft. Heute wohne ich mit meiner Frau in Berlin.

Seid ihr direkt nach Berlin gezogen oder wart ihr auch schon in Köln dabei?

Wir sind im Dezember letzten Jahres direkt nach Berlin gekommen. Das war schon ein sonderbares Gefühl. Wir sind wirklich hier, haben wir uns immer wieder gesagt. Wir leben in einem anderen Land, eine komplett neue Erfahrung. Man fängt noch mal komplett von vorne an.

1800px__img_4571

840px__img_4497

840px__img_4605

Lass uns etwas genauer auf deine Arbeit eingehen. Wie genau seid ihr bei der Erstellung der Map vorgegangen?

Das Erste, was wir getan haben, war Informationen von OpenStreetMap abzurufen und in eine Datenbank zu schreiben. Als Nächstes ging es um die Kerndaten einer Immobilie, also wie viele Räume hat das Gebäude, Quadratmeterzahl, Alter und so weiter. Dann kommen die soziodemographischen Daten. Diese sind uns besonders wichtig, weil sie einen großen Einfluss auf den Preis haben. Das sind Daten wie Schulen, Banken, Haltestationen und so weiter. Im nächsten Schritt kombiniert unsere Machine-Learning-Technologie die Daten, um auf diese Weise eine Beziehung der Daten untereinander zu identifizieren und eine Beurteilung der Lage und des Preises zu berechnen.

Welches Tool verwendest du, um die Daten in die Datenbank zu schreiben?

Ich verwende osm2pgsql, um PBF-Dateien zu laden, die ich von OpenStreetMap heruntergeladen habe. Als Nächstes lade ich diese in die Postgres-Datenbank. Das ist ein wunderbares Tool, mit dem man die ganzen Tabellen abfragen kann. Davon gibt es drei Arten: In einer Tabelle sind alle Punkte, also Restaurants, Schulen und Banken. Es gibt eine Tabelle mit Linien, da sind zum Beispiel Flüsse und Straßen drin. In der Tabelle für die Polygone befinden sich Parks, Strukturdaten wie Stadtgrenzen und Stadtteile, Flüsse und so weiter.

Zu Anfang haben wir in einer Experimentierphase mal Berlin importiert und eine der Aufgaben war es, zu schauen, wie viele Schulen sich in einem Stadtteil befinden.

Wie habt ihr das gemacht?

Das ist eine Funktion in Quantum QGIS. Zuerst habe ich QIS verwendet, um die Form zu bekommen und mit einer mathematischen Schnittmengenfunktion die Anzahl der Punkte zu bekommen. Um räumliche Informationen innerhalb von Postgres zu erhalten, habe ich eine Erweiterung namens PostGIS verwendet.

Eine weitere Methode, die wir verwenden, ist eine Heat Map. Angenommen, wir haben einen schlauchförmigen Stadtteil, und an beiden Enden befindet sich jeweils eine Schule, dann könnte man sagen, dass es gut ist, an den beiden Enden zu wohnen, aber eher weniger in der Mitte des Stadtteils. Wenn der Stadtteil jetzt sehr lang ist, dann ist der durchschnittliche Wert Fläche pro Anzahl Schulen schlecht. Anliegende Schulen anderer Stadtteile strahlen aber vielleicht auf die Mitte des Stadtteils ab. Und darum ist es wichtig, Heat Maps zu verwenden.

840_natural-places-heatmap

840_wheelchair-accessibility

Wie sieht dann der Prozess aus, um die Daten für das Machine Learning verfügbar zu machen?

Art, mein Kollege, der sich um Data Science kümmert, hat ein Python-Programm geschrieben, mit dem er direkt auf die Datenbank zugreift. Damit prüft er jede Auflösung, Stadtteil, Postleitzahl, Grundstücke und Gebäude, circa 150 Merkmale verwenden wir für den Algorithmus. Für jeden Eintrag überprüft er jedes geolokalisierte Feature auf der Karte. Mit Machine-Learning-Technologie versuchen wir die Preise vorauszuberechnen.

Wie aktualisiert ihr die Daten, wenn zum Beispiel eine neue Schule gebaut wurde?

Am Anfang haben wir das alles manuell gemacht, was ungefähr eine Woche dauerte. In der Zwischenzeit brauchen wir nur noch einen Knopf zu drücken, um einen Bericht für ein Stadtteil zu erstellen. Wenn da eine neue Schule ist, dann wird die berücksichtigt, da ich die aktualisierte PBF hochgeladen habe. Damit sind unsere Daten aktuell und präzise.

Welche anderen Tools sind bei deiner Arbeit wichtig?

Ich nutze ein spezielles Setup an GIS Tools. Das Wichtigste, wie schon erwähnt, ist PostgreSQL mit PostGIS. Das ist eine sehr nützliche Datenbank, wenn man räumliche Informationen verarbeiten will. Darauf aufbauend haben wir eine API. Mit Leaflet, der Google Maps API und Java Script generieren wir die Karten-Fliesen.

Außerdem nutze ich viel Ruby und Python für Backend-Themen.

840px__img_4524

840px__img_4513

Was nutzt ihr für die Teamkommunikation?

Slack. Hin und wieder auch E-Mail. Allerdings bekomme ich wirklich wenige E-Mails.

Was benötigst du, um arbeiten zu können?

Ich habe einen Dell-Laptop mit einem i7-Prozessor und 16 Gigabyte RAM. Früher habe ich alles mit Windows gemacht. In der Zwischenzeit bin ich zu Ubuntu gewechselt. Das läuft jetzt alles noch schneller. Außerdem brauche ich noch einen zusätzlichen Monitor.

Wie sieht dein Arbeitsalltag aus?

Das ist von Tag zu Tag verschieden. Normalerweise komme ich zur Arbeit und lege gleich los. Um 10.45 Uhr haben wir unser Daily und jeden Dienstag das All-hands-Meeting mit unserem Managementteam. Hier werden unternehmensbezogene News verkündet. Jeden Donnerstag ist das Sprint-Planning, bei dem wir die kommenden Aufgaben planen. Gegen 18.30 Uhr gehe ich für gewöhnlich in den Feierabend.

Was für ein Typ bist du? Klappst du zu Hause den Laptop noch mal auf?

Ja, allerdings arbeite ich dann nicht für die Arbeit, sondern ich liebe es, neue Technologien zu entdecken, um weiterzukommen. Zum Beispiel schaue ich mir gerade neue Open Source Map Renderer an. Ich mag es, da voranzukommen.

840px__img_4573

840px__img_4566

Was war für dich die größte Umstellung in Bezug auf deinen Job, als du nach Deutschland gekommen bist?

Meine Arbeit in Brasilien war oft mit Bürokratie und komplizierten Prozessen verbunden. Als ich dann nach Deutschland kam, war ich schon überrascht, wie gut das hier mit der agilen Methode funktioniert. Keine Ahnung, ob das jetzt etwas mit Brasilien zu tun hat.

Was ist unter GIS-Analysten gerade ein wichtiges Thema?

Ganz aktuell ist das Thema Vector-Tiles bei der Kartengenerierung. Das basiert auf einer vorherigen Version von osm2switch und damit soll es einfacher sein eine Map zu rendern. Vor allem ist die Kartengenerierung viel schneller.

Was ist ein wichtiges Learning in deiner Laufbahn?

Als ich Manager und Gebietsleiter des Geo-Teams in Brasilien wurde, habe ich erst mal versucht, mit jedem gut auszukommen. Das hat dann erst mal zu Problemen geführt, da das Team nicht produktiv war. Besonders mit einem Entwickler war es sehr problematisch und ich habe Monate gebraucht, um zu realisieren, dass ich was tun musste. Zu meinem Glück konnte ich mich mit dem Geschäftsführer darüber austauschen und er hat mich gecoacht. Das Learning war, dass ich eine Balance finden musste zwischen meinem Anspruch, für Leute da zu sein, aber auch einen guten Job für die Firma zu machen. In diesem Fall hatte ich es lange versucht, aber mir blieb dann irgendwann nichts anderes mehr übrig, als ihn zu kündigen.

Welchen Bildungsweg würdest du empfehlen, um in deinem Beruf arbeiten zu können?

Ich denke, es ist einfacher, wenn man zunächst lernt, zu programmieren, und sich dann an Geographie heranwagt. Die Basis wäre also ein Studium in Computer Science oder etwas Vergleichbarem. In meiner spezifischen Rolle hilft es, wenn man ein IT-Guy ist, also weiß zu programmieren, und dann den GIS Stack lernt, mit PostgreSQL, PostGIS, Quantum GIS und allem, was dazugehört.

840px__img_4592

840px__img_4596

840px__img_4508

Was sind deine Langzeitziele in Bezug auf deinen beruflichen Werdegang?

Eines Tages würde ich gerne einen Beitrag in einem wichtigen Open-Source-Projekt leisten. Ich habe dir ja von OpenMapTiles erzählt. Obwohl ich schon zehn Jahre Erfahrung mit GIS habe, gibt es noch viel zu lernen. Bei Homeday kann ich das und ich sehe mich hier auch noch für eine lange Zeit.

Welche Bücher und Blogs liest du?

Ich lese viel auf Reddit über Programmierung und Python. Auf Thoughtworks lese ich viel über die Trends der Technologie. Außerdem lese ich den ESRI-Blog, auch wenn es sich dabei um proprietäre Software handelt. Denn alles, was sie dort launchen, baut jemand anderes als OpenSource-Variante nach.

Ich lese gerne Fantasy-Bücher, um zu entspannen. Aber ich mag es auch, Bücher zu lesen, um mich beruflich weiterzuentwickeln. Empfehlen kann ich hier Technologiethemen, aber auch Bücher über das Führen von Unternehmen.

Lieber Vitor, vielen Dank für das Interview!

Das Interview wurde am 5. Juli 2017 im Berliner Office von Homeday auf Englisch gehalten.

Webseite: Homeday

840px__img_4644