Liebe Leser!
Jeder redet von Big Data. Von großen Datenhaufen, die es zu durchwühlen gilt, um nach der einen Stecknadel zu suchen, die Dir dann den großen Gewinn verheißt. Die Lösung aller Probleme. Das Paradies. Das Mutterschiff. Die Balance. Das ewige Glück.
Genau.
Jeder von uns rennt ja einem Ziel nach. Wie heißt das doch gleich. Ach ja – die Liebe war’s.
Und der beste Verkäufer ist der, der Dir Liebe verspricht.
Wenn, ja wenn Du halt in sein Produkt investierst.
Die Datenkraken, Google, Facebook und wie sie alle heißen, haben jetzt seit 20 Jahren Daten gesammelt – große Mengen von Daten – und jetzt wissen wir schön langsam, was wir mit diesen Daten alles machen können.
Aber wie hat es begonnen?
Einleitung
Ich muss vorausschicken, dass ich kein Experte bin. Vielmehr bin ich eine Art „Wochenendphilosoph“.
Im letzten Beitrag hatte ich versprochen, dass ich mir zu folgenden Fragen Gedanken machen möchte:
Was eigentlich sind Daten?
Sind Daten und Information nicht eigentlich dasselbe?
Es ist immer gut, wenn man mit dem Use Case beginnt. Also stellen wir uns folgende Frage:
Was können wir mit Daten alles anstellen?
Auch hier muss ich sagen: ich bin zwar ein Programmierer, und sollte also einen Begriff davon haben, WAS Daten eigentlich sind, aber – und das ist leider eine Tatsache – trotz dem täglichen Umgang mit Daten und Informationen bin ich nicht in der Lage, in aller Klarheit zu sagen, WAS Daten eigentlich sind.
Deshalb möchte ich mich – wie gesagt – als „Wochenendphilosoph“ betätigen und mir zuerst einmal überlegen, woher unser Umgang mit Daten und Informationen eigentlich entstanden sein könnte.
Ist es nicht so, dass schon im Tier- und Pflanzenreich, also eigentlich für jedes Lebewesen, der Umgang mit Informationen ein wesentlicher Faktor ist?
Denken wir an einen Hund, der sich sozusagen den „lokalen Tratsch erschnüffelt“, wenn er mit seiner Schnauze den nächsten Hydranten begutachtet.
Oder die Pflanzen, die aufgrund der Lufttemperatur und der Sonneneinstrahlung feststellen, dass es Zeit ist, mit der Blüte loszulegen.
Und hier sehen wir schon den Unterschied zwischen Daten und Informationen.
Nehmen wir die Datenlage „frühlingshaftes Wetter“, dann BEDEUTET das für verschiedene Lebewesen etwas Verschiedenes. Der Informationsgehalt ist ein anderer.
Pflanzen werden die Information bekommen: „es ist Zeit, mit der Blüte zu beginnen“. Menschen werden aus dem „frühlingshaften Wetter“ ableiten: „es ist Zeit, die Autoreifen zu wechseln“.
Dieselben DATEN können unter anderen Umständen eine andere BEDEUTUNG haben. Einen anderen INFORMATIONSGEHALT.
Zweifellos ist unsere menschliche Sprache ein Gipfelpunkt der Evolution, was die Möglichkeiten der Informationsweitergabe betrifft.
Trotzdem gibt es Menschen, die schneller „zum Punkt“ kommen, und solche, die komplizierte Geschichten erzählen, um ein einziges „AHA-Erlebnis“ mitzuteilen.
Das bringt uns zum Begriff der REDUNDANZ (also zum begriff der „unnötigen“ Daten) und zu einer heuristischen Formel:
DATEN = INFORMATION + REDUNDANZ
Das, was Du von anderen Menschen bekommst, sind die Daten als Gesamtheit, und Deine mühsame Aufgabe ist es jetzt, die Information aus den Daten herauszuschälen und die Information zu behalten.
Die guten ins Töpfchen, die schlechten ins Kröpfchen.
WAS sind Daten?
Daten sind also das, was man bekommt. Bzw. das, was man hergibt
Es sind MUSTER AUF EINEM DATENTRÄGER
Information ist das, was ankommt
Und damit wollen wir es für diese Woche gut sein lassen.
Meint
Euer Christoph
[…] sind wir uns auch einigermaßen klar geworden, WAS Daten eigentlich SIND (sie sind Muster auf einem Datenträger), und dass Daten Information enthalten, wobei die Information eigentlich etwas Subjektives ist, […]
[…] hier ventiliert: https://letztersein.com/2024/03/16/musterhaufen-big-data/ […]