Definition: strukturierte Daten

Strukturierte Daten werden auch als quantitative Daten bezeichnet und folgen einer vordefinierten Struktur oder einem Modell. Strukturierte Daten liegen in organisierter Form vor und können daher mühelos von Machine-Learning-Algorithmen und von Menschen verarbeitet werden. Strukturierte Daten werden in Datenbanken und in Data Warehouses gespeichert.

Beispiele für unstrukturierte Daten sind Metriken, Datumsangaben, Namen, Postleitzahlen und Kreditkartennummern. Diese Arten von Daten passen problemlos in Tabellenkalkulationen oder relationale Datenbanken wie etwa SQL, MySQL und PostgreSQL und stellen leicht abrufbare und interpretierbare Informationen für Unternehmen bereit.

Mit strukturierten Daten können Unternehmen das Verhalten ihrer Kunden anhand von Datenpunkten wie Namen, Kaufhistorie und Aufenthaltsort auswerten. Dies wird wiederum für das Kundenbeziehungsmanagement (Customer Relationship Management, CRM) genutzt, bei dem Unternehmen das Verhalten ihrer Kunden mit relationalen Datenbanken analysieren.

Beispiele für strukturierte Daten

Beispiele für strukturierte Daten sind Zahlen oder Werte. Diese Daten sind quantitativ und liegen als Excel-Dateien, Ergebnisse aus Webformularen, Reservierungssysteme oder SQL-Datenbanken vor. Weitere Arten von strukturierten Daten sind Daten aus Verkaufsstellen, Produktverzeichnisse und Finanztransaktionen. Strukturierte Daten werden in verschiedenen Anwendungsbereichen und Branchen genutzt, inklusive:

  • Finanzdienstleistungen: Strukturierte Daten werden von Banken, Buchhaltern und Finanzbehörden genutzt, um Daten wie etwa Transaktionen, Kontonummern und Namen von Kontoinhabern zu erfassen, zu verarbeiten, zu verwalten und zu analysieren.
  • Reisebranche: Buchungs-Websites, Hotels, Fluglinien und andere Transportunternehmen nutzen strukturierte Daten wie etwa Daten von Kunden und Passagieren, Hotel- oder Flugpreise, Bus-, Zug- oder Flugpläne sowie Transaktionen.
  • Gesundheitswesen: Im Gesundheitswesen werden strukturierte Daten für Kranken- und Versicherungsakten sowie für die Verwaltung medizinischer Geräte eingesetzt.
  • Einzelhandel und E-Commerce: Einzelhandel und E-Commerce nutzen strukturierte Daten, um Produktbestände, Preise, Transaktionen und Benutzerkontodaten zu erfassen und zu speichern.
  • Öffentlicher Sektor: Regierungsbehörden setzen strukturierte Daten auf viele verschiedene Arten ein. Eine Möglichkeit sind Volkszählungsdaten mit Informationen zur Bevölkerung zu einem bestimmten Zeitpunkt. Diese strukturierten Daten enthalten Informationen wie Aufenthaltsort, Geschlecht, Volkszugehörigkeit und Anzahl der Haushaltsmitglieder.

Worin unterscheiden sich strukturierte, teilweise strukturierte und unstrukturierte Daten?

Strukturierte Daten sind quantitativ, bestehen aus Zahlen und Werten, liegen in organisierter Form vor und sind leicht abrufbar und interpretierbar. Beispiele für unstrukturierte Daten sind Datums- und Zeitangaben oder Kunden-IDs.

Unstrukturierte Daten sind qualitative Daten, die keiner internen Struktur folgen, aus Text, Video und Bildern bestehen und nur mit dedizierten Tools verwaltet und interpretiert werden können. Beispiele für unstrukturierte Daten sind Kundenbewertungen, Video- oder Satellitenüberwachungsdaten sowie Produktfotos oder Vorführungsvideos.

Teilweise strukturierte Daten sind weder strukturiert noch unstrukturiert. Sie folgen keiner vordefinierten Struktur wie strukturierte Daten, können jedoch mit weniger Aufwand verwaltet und interpretiert werden als unstrukturierte Daten. Teilweise strukturierte Daten verwenden Metadaten, um Datenpunkte zu definieren, und können daher leichter organisiert und gespeichert werden. Beispiele für teilweise strukturierte Daten sind JSON, XML, Webdaten und .zip-Dateien.

Strukturierte Daten verwalten

Strukturierte Daten werden mit relationalen Datenbanken verwaltet, zum Beispiel mit Excel-Tabellen oder SQL-Datenbanken. Relationale Datenbanken basieren auf dem relationalen Modell und bilden Daten in Tabellenform ab. Mit diesen Tabellen können Unternehmen Beziehungen zwischen verschiedenen Datenpunkten herstellen und strukturierte Daten eingeben, durchsuchen und bearbeiten.

Strukturierte Daten folgen einem Schema-on-Write-Modell und müssen daher in einem Datenmodell strukturiert werden, bevor sie in einer Datenbank abgelegt werden können. Für das Datenmodell wird ein Schema auf Basis der Daten definiert. Daraus ergeben sich Tabellen oder Entitäten. Anschließend werden Beziehungen zwischen den Entitäten hergestellt. Zuletzt wird ein SQL-Skript geschrieben, das die relationale Datenbank erstellt, in der die strukturierten Daten gespeichert werden.

Anschließend können die Daten nach Belieben abgerufen und bearbeitet werden. Um beispielsweise die Daten für ein Restaurantmenü zu ingestieren, erstellen wir zunächst einige Tabellen:

  • Artikel
  • Zutaten
  • Nährwerte

Anschließend erstellen wir Beziehungen zwischen den Datenpunkten. Zuletzt schreiben wir das SQL-Skript. Strukturierte Daten stammen beispielsweise aus Onlineformularen, Netzwerk-Logs, Sensordaten oder Verkaufsstellen. Nach der Speicherung können diese Daten mit Machine-Learning-Algorithmen (ML) verarbeitet, durchsucht und analysiert werden, um Berichte und Vorhersagen zu generieren.

Verwalten von strukturierten Daten mit Elastic

Vorteile von strukturierten Daten

Strukturierte Daten bieten zahlreiche Vorteile, da sie von Menschen und Computern gleichermaßen einfach verwendet, gespeichert, skaliert und analysiert werden können.

Strukturierte Daten sind einfach zu verwenden.
Strukturierte Daten sind gut organisiert und können daher mit Machine-Learning-Technologien einfach bearbeitet und abgefragt werden.

Für Geschäftsanwender sind strukturierte Daten praktisch, weil keine umfangreichen Data-Science-Kenntnisse erforderlich sind. Alle Nutzer, die sich mit dem Thema der Daten auskennen, können diese abrufen und analysieren.

Außerdem steht eine Vielzahl an Tools zum Analysieren und Interpretieren strukturierter Daten bereit. Dies liegt teilweise daran, dass strukturierte Daten älter als unstrukturierte Daten sind und außerdem genauere Ergebnisse liefern.

Strukturierte Daten sind einfach zu speichern.
Strukturierte Daten können in relationalen Datenbanken, NoSQL-Datenbanken, Data Warehouses, Data Lakes, speicherinternen Datenbanken und anderen Formaten gespeichert werden und belegen weniger Speicherplatz als unstrukturierte Daten. Strukturierte Daten können also sehr effizient gespeichert werden.

Strukturierte Daten sind einfach zu skalieren.
Strukturierte Daten können in Data Warehouses gespeichert werden und sind daher einfach zu skalieren. Data Warehouses dienen als Repository für alle strukturierten Daten, die ein Unternehmen produziert. Mit zunehmendem Volumen an strukturierten Daten können die Unternehmen jederzeit mehr Speicherplatz und Verarbeitungsleistung hinzufügen.

Strukturierte Daten vereinfachen das Data Mining.
Strukturierte Daten sind das Fundament für Big-Data-Analytics. Diese Daten sind quantitativ und eignen sich daher besser für Vorhersagen, Prognosen und Studien. Strukturierte Daten können in relationalen Datenbanken gespeichert werden, um Abfragen und das Generieren von Berichten zu erleichtern. Machine-Learning-Algorithmen können diese Daten leichter durchforsten. Daher liefern strukturierte Daten bessere und genauere Business Intelligence.

Strukturierte Daten können Ihre Discoverability verbessern.
Sie können strukturierte Daten in Ihrem Website-Code mit Schema-Markups verwenden, um reichhaltige Ausschnitte zu erstellen oder reichhaltige Ergebnisse zu liefern, was erwiesenermaßen zu mehr Kundeninteraktionen führt. Unternehmen können strukturierte Daten zu ihrer Website hinzufügen, um Click-Through-Raten, Conversion-Raten und den organischen Datenverkehr zu steigern.

Einschränkungen im Zusammenhang mit strukturierten Daten

Strukturierte Daten bieten zwar zahlreiche Vorteile für Unternehmen, sind jedoch auch mit gewissen Einschränkungen verbunden.

Strukturierte Daten sind manchmal nur eingeschränkt nutzbar.
Die vordefinierte Struktur von strukturierten Daten ist gleichzeitig Vorteil und Einschränkung, da diese Daten nur zu ihrem vorgesehenen Zweck genutzt werden können.

Strukturierte Daten sind oft qualitativ minderwertig.
Die Qualität der Daten lässt nach, wenn Daten fehlen oder unvollständig sind. Daten, die nicht genau in das Schema passen, können sich ebenfalls negativ auf die Gesamtqualität auswirken. Dies kann wiederum zu ungenauen Suchergebnissen oder Berichten führen.

Mit zunehmender Unternehmensgröße wächst auch das Datenvolumen, und oft entstehen Duplikate oder Daten, die nicht mehr relevant sind. Dadurch nimmt die Qualität der strukturierten Daten des Unternehmens ab.

Best Practices beim Umgang mit strukturierten Daten

Beachten Sie diese Best Practices für eine möglichst optimale Nutzung Ihrer strukturierten Daten.

Wählen Sie einen zukunftssicheren Ansatz für Ihre Datenverwaltung.
Entwickeln Sie langfristig gültige Konventionen für die Benennung und Katalogisierung von Dateien. Vergeben Sie aussagekräftige und standardisierte Dateinamen, um die Dateien später leicht finden zu können.

Erfassen Sie die Datenherkunft mit Metadaten.
Metadaten beschreiben die Inhalte, Strukturen, Autoren und Berechtigungen Ihrer Daten. Wenn Sie Ihre Metadaten sorgfältig pflegen, ist Ihre Site auffindbar und Sie können Daten vom Ursprung bis zum Ziel nachverfolgen, Datenbeziehungen abbilden und letztendlich ein effektives Data-Governance-System einrichten.

Schützen Sie Ihre strukturierten Daten.
Strukturierte Daten enthalten oft besonders vertrauliche Informationen: Kreditkartennummern, Kontonummern, medizinische Daten und so weiter. Der Schutz Ihrer strukturierten Daten ist ein wichtiger Schritt zu deren Verwaltung. Dabei ist es wichtig, Ihre Daten zu sichern und einen Speicherplan auszuwählen, der Tools für Sicherheit und Observability umfasst, um sich vor Cybersicherheitsbedrohungen zu schützen.

Wählen Sie einen passenden Speicherplan aus.
Wählen Sie einen passenden Speicherplan für die Größe und die Anforderungen Ihres Unternehmens aus, um Ihre Daten langfristig vor Sicherheitsverletzungen zu schützen. Kleinere Unternehmen produzieren ein geringeres Datenvolumen als Großunternehmen. Ein auf Großunternehmen ausgerichteter Plan eignet sich vermutlich nicht für Ihre Anforderungen.

Erstellen Sie ein Such-Tool, das Ihre Datensätze mit Elastic durchsuchen kann.

Verwalten und Verarbeiten von strukturierten Daten mit Elastic

Der Elastic Stack ist eine Suchplattform, mit der Sie Daten aus beliebigen Quellen und in beliebigen Formaten durchsuchen, analysieren und visualisieren können. Der Elastic Stack besteht aus Elasticsearch, Kibana, Beats und Logstash und hilft Ihnen, Ihre strukturierten und unstrukturierten Daten besser zu verwalten und zu verarbeiten.