Daten sind entscheidend für den Unternehmerischen Erfolg. Generell gibt es in der Informatik drei Kategorien von Daten. Strukturierte Daten, semi-strukturierte Daten und unstrukturierte Daten.
Was sind strukturierte Daten?
Diese Daten liegen in tabellarischem Format vor. In einer relationalen Datenbank stehen sie in eindeutigen Beziehungen zueinander. Dies macht es einfach, spezifische Daten zu finden und zu verarbeiten. Strukturierte Daten liegen häufig in Tabellenform vor. Sie bieten bei einer systematischen Datenverarbeitung, z.B. Suche und Weiterverarbeitung mit Machinelearning Systemen einige Vorteile.
Beispiele für Strukturierte Datenformate sind z.B.:
- CSV,
- Tabellen,
- Excel
Was sind semi-strukturierte Daten?
Bei semi-strukturierten Daten gibt es eine nicht gleich ersichtliche Struktur – sie ist versteckt. Derartige Strukturen werden als implizit, partiell oder irregulär bezeichnet. Es ergeben sich semi-strukturierte Datensätze beim Zusammenfügen von unterschiedlichen Objekten in diversen Software Systemen.
Die Daten sind zu einem bestimmten Grad strukturiert, die Dateninhalte sind jedoch größtenteils unbekannt.
Beispiele für Semistrukturierte Datenformate sind:
- XML oder
- JSON.
Was sind unstrukturierte Daten?
Bei dieser Art von Daten ist keine Struktur vorhanden, sodass die Speicherung z.B. in einer SQL-Datenbank nahezu unmöglich ist. Um Informationen zu gewinnen und somit den Wert der Daten zu extrahieren, ist vorher eine Aufbereitung oder Strukturierung nötig.
Beispiele für Unstrukturierte Daten sind:
- Text,
- Audio,
- Bilder
- oder Video.
Die meisten Daten in einem Unternehmen sind unstrukturiert: Textdaten von E-Mails, Beiträge in Foren oder Social Media sowie Kundenbewertungen. Auch Video- und Bilddaten gehören in diese Kategorie. Da die Informationen, die in unstrukturierten Daten stecken, für Unternehmen interessant sein können.
Nach der Betrachtung der Art von Daten aus der Informatik, gehen wir noch einen Schritt weiter. Welche Klassifizierungen von Daten machen Unternehmen das Leben einfacher?
Wie häufig ändern sich Daten?
Es gibt unterschiedliche Änderungszyklen von Daten. So ändern Sich Anschriften von Kunden weniger häufig als Ansprechpartner. Überweisungsdaten, wie z.B. die Höhe der Überweisung wird häufiger Anpassungen mit sich bringen als die bekannten IBAN Nummern der Konten.
Es gibt demnach unterschiedliche Änderungszeitpunkte von Daten, welche durch Klassifizierungen zusammengefasst werden können.
Bewegungsdaten
Bewegungsdaten werden in einer Datenbank als dynamische Kundendaten gespeichert. Dies können Bestellungen, Vertragsdaten oder Bestandsveränderungen in einem Warenwirtschaftssystem sein.
Bewegungsdaten sind im Gegensatz zu Stammdaten nicht statisch, sondern können sich fortlaufend verändern. Sie haben in der Regel einen zeitlichen Bezug und werden von den Anwendern seltener genutzt als die Stammdaten.
Bewegungsdaten liefern Fakten zur Analyse des Kunden- oder Kaufverhaltens. Sie werden im Gegensatz zu den oft langfristig gehaltenen Stammdaten, nur kurz- oder mittelfristig gehalten, daher sind Bewegungsdaten besonders für Data Warehouse- oder Business Intelligence-Systeme interessant.
Stammdaten
Sind eben jede Daten die sich nur alle “Jubeljahre” ändern. Man kann bei Auswertungen davon ausgehen, dass selbst X Monate alte Stammdaten noch einen sehr aktuellen Stand haben.