Es gibt eine Welt jenseits von R und Python

Die CeBIT ist Geschichte. Das Aus der legendären Computermesse wurde gestern unter anderem so begründet: „Der digitale Wandel findet inzwischen überall statt,…“ (S. Weil, Ministerpräsident von Niedersachsen).

Diese zutreffende Aussage lässt sich zwanglos abwandeln: „Data Science findet inzwischen überall statt“.

Amtliche Statistik und Offene Daten

Offene Daten sind maschinenlesbare Daten, die der Öffentlichkeit zur Verfügung gestellt werden. Der Nutzen offener Daten ist vielfältig, er reicht von der Bürgerbeteiligung bis zur Entwicklung komplexer Geschäftsmodelle. Wir wollen an dieser Stelle aber nicht so hoch greifen, sondern nur einige Hinweise auf Quellen geben, die auch für die Weiterbildung zum Themenkreis Data Science von Interesse sein können.

Profiling, Reinigung und Wrangling

Die Überschrift deutet es an: Die Sprache der Informationstechnologie ist durchsetzt mit Anglizismen. An dieser Stelle soll aber nicht das Für und Wider dieser Tatsache diskutiert werden, vielmehr geht es um den jeweils konkreten Inhalt dieser Begriffe. Die folgenden Erläuterungen geben eine Sichtweise wieder, sie erheben nicht den Anspruch allgemein verbindliche Definitionen zu liefern.