Vitor ist Analyst f├╝r Geographische Informationssysteme beim Berliner PropTech-Startup Homeday. Er zeigt uns sein Setup der GIS-Tools, erkl├Ąrt, wie sie bei Homeday Geo-Daten verarbeiten und wie sie mit Machine-Learning Vorhersagen ├╝ber die Entwicklung der Immobilienpreise treffen.

Vita

Nach seinem Studium der Informatik im brasilianischen Vitoria beginnt Vitor ein Praktikum bei INFLOR, einem Anbieter f├╝r Verwaltungssoftware f├╝r die Forstwirtschaft. In den n├Ąchsten┬áacht Jahren arbeitet er sich zum Lead Software Engineer hoch und entscheidet sich dann, seine Karriere in ├ťbersee fortzusetzen. Heute arbeitet Vitor als Senior GIS Analyst bei Homeday.

Tools

  • PostgreSQL, PostGIS,┬áQuantum GIS
  • Google Maps API
  • Java Script,┬áRuby, Python
  • Slack

Empfehlungen

  • Reddit,┬áESRI Blog

Social

Vitor, Software-Entwickler bei Homeday

Hi Vitor, um was geht es bei Homeday?

Bei Homeday geht es um den Verkauf und Kauf von Immobilien. Der Preis einer Immobilie h├Ąngt dabei sehr stark von ihrer Geolocation ab. Meine Aufgabe ist es, Geo-Daten zu sammeln, zu analysieren und Prozesse zu automatisieren, aufgrund deren wir genaue Preisberechnungen machen k├Ânnen. Ich arbeite also haupts├Ąchlich mit Geolocation-Daten.

Wie sieht deine Arbeit damit genau aus?

Homeday hat mich nach Deutschland geholt, damit ich herausfinde, was der durchschnittliche Verkaufspreis eines Stadtteils ist. Nicht nur das. Ihr Ziel war es, noch eine Ebene tiefer zu gehen. Was ist der Durchschnittspreis in dieser Stra├če bzw. des Hauses? Ist er teuer oder preiswert? Daf├╝r brauchten sie einen Data Scientist und einen Geo Developer, und weil die Aufgabe alles andere als einfach ist, sind wir da auch noch lange nicht fertig.

Die Datenbasis hierf├╝r wird st├Ąndig erweitert und wir arbeiten jeden Tag daran, den Algorithmus kontinuierlich weiterzuentwickeln. Mich hat besonders ├╝berrascht, wie schwer es ist, an die Daten zu kommen. Besonders im Vergleich zu Brasilien.

Wie unterscheidet sich Deutschland diesbez├╝glich von Brasilien?

In Brasilien sind alle Bundesl├Ąnder gleich strukturiert. Hier in Deutschland hat jedes Bundesland seine eigenen Regeln und seine eigenen Beh├Ârden. Dazu kommt, dass die Strukturen in den St├Ądten unterschiedlich sind. In Brasilien gibt es Webseiten, von denen man die Geo-Daten kostenlos herunterladen kann. Ich hatte erwartet, dass es in Deutschland ├Ąhnlich sein w├╝rde. Aber an die Daten zu kommen, ist alles andere als einfach. Manchmal muss Tobias, der ein Experte darin ist, Geo-Daten zu bekommen, auch schon mal mit ├Âffentlichen Beh├Ârden direkt telefonieren, um an die Daten zu kommen.

Das hei├čt, du bist f├╝r Homeday nach Deutschland gekommen?

Genau. Homeday hat mich ├╝ber LinkedIn angefragt. Das kam zum richtigen Zeitpunkt, weil ich mich bereits darauf vorbereitet hatte, nach ├ťbersee zu gehen.

Vitor, Software-Entwickler bei Homeday

Was hast du vorher gemacht?

Vorher habe ich in Brasilien gearbeitet. Direkt nach dem Studium habe ich ein Praktikum bei INFLOR gemacht. INFLOR ist der Marktf├╝hrer im Bereich Software zur Verwaltung von Forstbetrieben. Meine Hauptaufgabe war die Entwicklung von Anwendungen zur Verwaltung des Landes unserer Kunden. F├╝r die Forstwirtschaft ist das eine wichtige Sache, besonders wenn man mit Farmen auf mehreren Millionen Hektar Land zu tun hat. Damals wusste ich wirklich noch gar nichts und ich lernte in der Firma viel ├╝ber Geographie und Forstwirtschaft.

Bei dieser Firma war ich neun Jahre und dort habe ich mich vom Praktikanten zum Senior Developer und sp├Ąter noch zum Gebietsleiter hochgearbeitet. Sie hatten mir sogar angeboten, Partner der Firma zu werden. Es war eine sch├Âne Zeit und tolle Erfahrung. Allerdings fehlte die Herausforderung und ich entschied mich, nach ├ťbersee zu gehen. Im Nachhinein ein bisschen verr├╝ckt. Einige Monate vor der Anfrage von Homeday begann ich schon, mein Englisch zu verbessern. Mein Ziel war es, flie├čend sprechen zu k├Ânnen, was mir jetzt sehr hilft. Heute wohne ich mit meiner Frau in Berlin.

Seid ihr direkt nach Berlin gezogen oder wart ihr auch schon in K├Âln dabei?

Wir sind im Dezember letzten Jahres direkt nach Berlin gekommen. Das war schon ein sonderbares Gef├╝hl. Wir sind wirklich hier, haben wir uns immer wieder gesagt. Wir leben in einem anderen Land, eine komplett neue Erfahrung. Man f├Ąngt noch mal komplett von vorne an.

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Lass uns etwas genauer auf deine Arbeit eingehen. Wie genau seid ihr bei der Erstellung der Map vorgegangen?

Das Erste, was wir getan haben, war Informationen von OpenStreetMap abzurufen und in eine Datenbank zu schreiben. Als N├Ąchstes ging es um die Kerndaten einer Immobilie, also wie viele R├Ąume hat das Geb├Ąude, Quadratmeterzahl, Alter und so weiter. Dann kommen die soziodemographischen Daten. Diese sind uns besonders wichtig, weil sie einen gro├čen Einfluss auf den Preis haben. Das sind Daten wie Schulen, Banken, Haltestationen und so weiter. Im n├Ąchsten Schritt kombiniert unsere Machine-Learning-Technologie die Daten, um auf diese Weise eine Beziehung der Daten untereinander zu identifizieren und eine Beurteilung der Lage und des Preises zu berechnen.

Welches Tool verwendest du, um die Daten in die Datenbank zu schreiben?

Ich verwende osm2pgsql, um PBF-Dateien zu laden, die ich von OpenStreetMap heruntergeladen habe. Als N├Ąchstes lade ich diese in die Postgres-Datenbank. Das ist ein wunderbares Tool, mit dem man die ganzen Tabellen abfragen kann. Davon gibt es drei Arten: In einer Tabelle sind alle Punkte, also Restaurants, Schulen und Banken. Es gibt eine Tabelle mit Linien, da sind zum Beispiel Fl├╝sse und Stra├čen drin. In der Tabelle f├╝r die Polygone befinden sich Parks, Strukturdaten wie Stadtgrenzen und Stadtteile, Fl├╝sse und so weiter.

Zu Anfang haben wir in einer Experimentierphase mal Berlin importiert und eine der Aufgaben war es, zu schauen, wie viele Schulen sich in einem Stadtteil befinden.

Wie habt ihr das gemacht?

Das ist eine Funktion in Quantum QGIS. Zuerst habe ich QIS verwendet, um die Form zu bekommen und mit einer mathematischen Schnittmengenfunktion die Anzahl der Punkte zu bekommen. Um r├Ąumliche Informationen innerhalb von Postgres zu erhalten, habe ich eine Erweiterung namens PostGIS verwendet.

Eine weitere Methode, die wir verwenden, ist eine Heat Map. Angenommen, wir haben einen schlauchf├Ârmigen Stadtteil, und an beiden Enden befindet sich jeweils eine Schule, dann k├Ânnte man sagen, dass es gut ist, an den beiden Enden zu wohnen, aber eher weniger in der Mitte des Stadtteils. Wenn der Stadtteil jetzt sehr lang ist, dann ist der durchschnittliche Wert Fl├Ąche pro Anzahl Schulen schlecht. Anliegende Schulen anderer Stadtteile strahlen aber vielleicht auf die Mitte des Stadtteils ab. Und darum ist es wichtig, Heat Maps zu verwenden.

natural-places-heatmap

840_wheelchair-accessibility

Wie sieht dann der Prozess aus, um die Daten f├╝r das Machine Learning verf├╝gbar zu machen?

Art, mein Kollege, der sich um Data Science k├╝mmert, hat ein Python-Programm geschrieben, mit dem er direkt auf die Datenbank zugreift. Damit pr├╝ft er jede Aufl├Âsung, Stadtteil, Postleitzahl, Grundst├╝cke und Geb├Ąude, circa 150 Merkmale verwenden wir f├╝r den Algorithmus. F├╝r jeden Eintrag ├╝berpr├╝ft er jedes geolokalisierte Feature auf der Karte. Mit Machine-Learning-Technologie versuchen wir die Preise vorauszuberechnen.

Wie aktualisiert ihr die Daten, wenn zum Beispiel eine neue Schule gebaut wurde?

Am Anfang haben wir das alles manuell gemacht, was ungef├Ąhr eine Woche dauerte. In der Zwischenzeit brauchen wir nur noch einen Knopf zu dr├╝cken, um einen Bericht f├╝r ein Stadtteil zu erstellen. Wenn da eine neue Schule ist, dann wird die ber├╝cksichtigt, da ich die aktualisierte PBF hochgeladen habe. Damit sind unsere Daten aktuell und pr├Ązise.

Welche anderen Tools sind bei deiner Arbeit wichtig?

Ich nutze ein spezielles Setup an GIS Tools. Das Wichtigste, wie schon erw├Ąhnt, ist PostgreSQL mit PostGIS. Das ist eine sehr n├╝tzliche Datenbank, wenn man r├Ąumliche Informationen verarbeiten will. Darauf aufbauend haben wir eine API. Mit Leaflet, der Google Maps API und Java Script generieren wir die Karten-Fliesen.

Au├čerdem nutze ich viel Ruby und Python f├╝r Backend-Themen.

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Was nutzt ihr f├╝r die Teamkommunikation?

Slack. Hin und wieder auch E-Mail. Allerdings bekomme ich wirklich wenige E-Mails.

Was ben├Âtigst du, um arbeiten zu k├Ânnen?

Ich habe einen Dell-Laptop mit einem i7-Prozessor und 16 Gigabyte RAM. Fr├╝her habe ich alles mit Windows gemacht. In der Zwischenzeit bin ich zu Ubuntu gewechselt. Das l├Ąuft jetzt alles noch schneller. Au├čerdem brauche ich noch einen zus├Ątzlichen Monitor.

Wie sieht dein Arbeitsalltag aus?

Das ist von Tag zu Tag verschieden. Normalerweise komme ich zur Arbeit und lege gleich los. Um 10.45 Uhr haben wir unser Daily und jeden Dienstag das ÔÇ×All-handsÔÇť-Meeting mit unserem Managementteam. Hier werden unternehmensbezogene News verk├╝ndet. Jeden Donnerstag ist das ÔÇ×Sprint-PlanningÔÇť, bei dem wir die kommenden Aufgaben planen. Gegen 18.30 Uhr gehe ich f├╝r gew├Âhnlich in den Feierabend.

Was f├╝r ein Typ bist du? Klappst du zu Hause den Laptop noch mal auf?

Ja, allerdings arbeite ich dann nicht f├╝r die Arbeit, sondern ich liebe es, neue Technologien zu entdecken, um weiterzukommen. Zum Beispiel schaue ich mir gerade neue Open Source Map Renderer an. Ich mag es, da voranzukommen.

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Was war f├╝r dich die gr├Â├čte Umstellung in Bezug auf deinen Job, als du nach Deutschland gekommen bist?

Meine Arbeit in Brasilien war oft mit B├╝rokratie und komplizierten Prozessen verbunden. Als ich dann nach Deutschland kam, war ich schon ├╝berrascht, wie gut das hier mit der agilen Methode funktioniert. Keine Ahnung, ob das jetzt etwas mit Brasilien zu tun hat.

Was ist unter GIS-Analysten gerade ein wichtiges Thema?

Ganz aktuell ist das Thema ÔÇ×Vector-TilesÔÇť bei der Kartengenerierung. Das basiert auf einer vorherigen Version von osm2switch und damit soll es einfacher sein eine Map zu rendern. Vor allem ist die Kartengenerierung viel schneller.

Was ist ein wichtiges Learning in deiner Laufbahn?

Als ich Manager und Gebietsleiter des Geo-Teams in Brasilien wurde, habe ich erst mal versucht, mit jedem gut auszukommen. Das hat dann erst mal zu Problemen gef├╝hrt, da das Team nicht produktiv war. Besonders mit einem Entwickler war es sehr problematisch und ich habe Monate gebraucht, um zu realisieren, dass ich was tun musste. Zu meinem Gl├╝ck konnte ich mich mit dem Gesch├Ąftsf├╝hrer dar├╝ber austauschen und er hat mich gecoacht. Das Learning war, dass ich eine Balance finden musste zwischen meinem Anspruch, f├╝r Leute da zu sein, aber auch einen guten Job f├╝r die Firma zu machen. In diesem Fall hatte ich es lange versucht, aber mir blieb dann irgendwann nichts anderes mehr ├╝brig, als ihn zu k├╝ndigen.

Welchen Bildungsweg w├╝rdest du empfehlen, um in deinem Beruf arbeiten zu k├Ânnen?

Ich denke, es ist einfacher, wenn man zun├Ąchst lernt, zu programmieren, und sich dann an Geographie heranwagt. Die Basis w├Ąre also ein Studium in Computer Science oder etwas Vergleichbarem. In meiner spezifischen Rolle hilft es, wenn man ein IT-Guy ist, also wei├č zu programmieren, und dann den GIS Stack lernt, mit PostgreSQL, PostGIS, Quantum GIS und allem, was dazugeh├Ârt.

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Vitor, Software-Entwickler bei Homeday

Was sind deine Langzeitziele in Bezug auf deinen beruflichen Werdegang?

Eines Tages w├╝rde ich gerne einen Beitrag in einem wichtigen Open-Source-Projekt leisten. Ich habe dir ja von OpenMapTiles erz├Ąhlt. Obwohl ich schon zehn Jahre Erfahrung mit GIS habe, gibt es noch viel zu lernen. Bei Homeday kann ich das und ich sehe mich hier auch noch f├╝r eine lange Zeit.

Welche B├╝cher und Blogs liest du?

Ich lese viel auf Reddit ├╝ber Programmierung und Python. Auf Thoughtworks lese ich viel ├╝ber die Trends der Technologie. Au├čerdem lese ich den ESRI-Blog, auch wenn es sich dabei um propriet├Ąre Software handelt. Denn alles, was sie dort launchen, baut jemand anderes als OpenSource-Variante nach.

Ich lese gerne Fantasy-B├╝cher, um zu entspannen. Aber ich mag es auch, B├╝cher zu lesen, um mich beruflich weiterzuentwickeln. Empfehlen kann ich hier Technologiethemen, aber auch B├╝cher ├╝ber das F├╝hren von Unternehmen.

Lieber Vitor, vielen Dank f├╝r das Interview!

Das Interview wurde am 5. Juli 2017 im Berliner Office von Homeday auf Englisch gehalten.

Webseite: Homeday

Vitor, Software-Entwickler bei Homeday