Datenvisualisierung Neuerscheinungen

In diesem Frühjahr werden drei interessante Neuerscheinungen aus dem Umfeld der Datenvisualisierung angekündigt. How Charts Lie: Getting Smarter about Visual Information Das erste Buch, auf das hier hingewiesen werden soll, trägt den Titel: How Charts Lie: Getting Smarter about Visual Information und stammt von Alberto Cairo. Cairo hat einen Lehrstuhl für visuellen Journalismus an der…

Zum Internationalen Frauentag: Gender Data Gap

Wie sich die gesellschaftliche Benachteiligung von Frauen in Daten auswirkt Am 23.09.2019 veröffentlichte der britische Guardian unter der Überschrift „The deadly truth about a world built for men – from stab vests to car crashes“ redaktionell bearbeitete Auszüge aus dem Buch Invisible Women: Exposing Data Bias in a World Designed for Men[i] von Caroline Criado Perez. Der…

Für Ohren und Augen von Data Scientists

Das Internet stellt eine Vielzahl von Audio- und Videodateien bereit, die sich mit Data Science beschäftigen. Auf drei dieser Quellen möchten wir an dieser Stelle ihre Aufmerksamkeit lenken. Stats + Stories Mittlerweile 80 Folgen umfasst die Audio Reihe Stats + Stories. Die Interviewserie verfolgt den Zweck „statistics behind the stories and the stories behind the…

Die Gefahren des Storytelling

Geschichten und Daten sind seit langem mit einander verbunden. Das englische „Tell“ und das deutsche „Erzählen“ haben eine rund tausend Jahre zurückreichende gemeinsame Wurzel und bezeichnen jeweils eine geordnete Darstellung. In der Gegenwart bildet Storytelling einen wichtigen Bestandteil von Data Science. Nach Zugriff, Vorverarbeitung und Analyse geht es schließlich um die überzeugende und begreifliche Darstellung…

Numeracy: Groß und klein, viel und wenig

Bei Data Science geht es nicht nur um Modellbildung und Algorithmen, häufig besteht ein Teil des Jobs auch nur darin, Zahlen richtig einordnen und bewerten zu können. Data Science ohne Zahlenverständnis oder neudeutsch Numeracy ist ein Ding der Unmöglichkeit. Vor einigen Jahren lieferte Andre Gelman in einem Blog Post unter der Überschrift „Doing Data Science:…

Es gibt eine Welt jenseits von R und Python

Die CeBIT ist Geschichte. Das Aus der legendären Computermesse wurde gestern unter anderem so begründet: „Der digitale Wandel findet inzwischen überall statt,…“ (S. Weil, Ministerpräsident von Niedersachsen).

Diese zutreffende Aussage lässt sich zwanglos abwandeln: „Data Science findet inzwischen überall statt“.

Amtliche Statistik und Offene Daten

Offene Daten sind maschinenlesbare Daten, die der Öffentlichkeit zur Verfügung gestellt werden. Der Nutzen offener Daten ist vielfältig, er reicht von der Bürgerbeteiligung bis zur Entwicklung komplexer Geschäftsmodelle. Wir wollen an dieser Stelle aber nicht so hoch greifen, sondern nur einige Hinweise auf Quellen geben, die auch für die Weiterbildung zum Themenkreis Data Science von Interesse sein können.

Profiling, Reinigung und Wrangling

Die Überschrift deutet es an: Die Sprache der Informationstechnologie ist durchsetzt mit Anglizismen. An dieser Stelle soll aber nicht das Für und Wider dieser Tatsache diskutiert werden, vielmehr geht es um den jeweils konkreten Inhalt dieser Begriffe. Die folgenden Erläuterungen geben eine Sichtweise wieder, sie erheben nicht den Anspruch allgemein verbindliche Definitionen zu liefern.