Big Data – Wie speichern wir in Zukunft unsere Daten ab?

01.04.2019 | Alexander Breitenbauer | Speichermedien

Big Data ist ein immer gängigerer Begriff. Die Bedeutung dieses Ausdrucks ist dahingegen eher weniger gängig. Ist von Big Data die Rede, sind zwei Faktoren entscheidend: Die anfallende Menge an Daten, welche in ihrem Umfang immer schneller wächst und die IT-Lösungen, die Unternehmen helfen sollen, die Informationsfülle zu bändigen.

Viele Unternehmen werden damit konfrontiert, aber was bedeutet Big Data eigentlich genau und was sind die Folgen in Bezug auf unsere Speichermedien? Wie und vor allem wo werden wir unsere Daten in Zukunft abspeichern? Und welches Medium sorgt dafür, dass wir möglichst viele Daten für eine sehr lange Zeit halten können?

Was ist Big Data?

Big Data bedeutet übersetzt „große Datenmenge“. Konkret gesagt beschreibt Big Data die Datenmengen, welche zu groß, unstrukturiert oder komplex sind, um sie mit bekannten Vorgehensweisen der Datenverarbeitung analysieren zu können.

Ursprünglich gibt es im Rahmen von Big Data drei Merkmale, die diesen Begriff genauer definieren:

  • Volume: Der Umfang - Es werden Daten aus vielen unterschiedlichen Quellen zusammengetragen. In Unternehmen entstehen von Tag zu Tag mehr Informationen, die verarbeitet werden müssen. Aufgrund des enormen Umfangs dieser Daten ist es oft eine Herausforderung, diese mit konventionellen Methoden zu speichern bzw. auszuwerten.
  • Velocity: Die Geschwindigkeit - Die Unmengen an entstehenden Daten werden mittlerweile (fast) in Echtzeit verarbeitet und analysiert. Velocity drückt die Geschwindigkeit aus, mit der diese Daten produziert und untersucht werden.
  • Variety: Die Vielfalt - Eine große Menge an Daten bedeutet auch, dass neue Formate entstehen. Diese können in verschiedenen Formen auftreten. Variety beschreibt die Vielfalt dieser Datenquellen und -typen. Big Data soll dazu dienen, die verschiedenen Formate (Fotos, Videos, Texte, Audiodateien, Transaktionsdaten, Nutzerdaten und noch viel mehr) zu sortieren, Zusammenhänge zu erkennen und zu analysieren.

Mittlerweile sind zwei weitere Charakteristika dazu gekommen, um Big Data genauer beschreiben zu können, sodass aus den „3 Vs“ die „5 Vs“ wurden.

  • Veracity (Validity): Die Glaubwürdigkeit - Wie vertrauenswürdig sind die Daten, die produziert werden? Auch wenn viele Daten vorhanden sind, bedeutet das nicht zwangsläufig, dass die Qualität ausreichend ist. Die Daten müssen gültig, wahrhaftig und glaubwürdig sein, um die Aussagekraft bestätigen zu können.
  • Value: Der Mehrwert - Der Besitz von immer mehr Daten kann zwar ein Vorteil für ein Unternehmen sein, bringt hingegen nichts, wenn diese Daten keinen Mehrwert schaffen.

Im Jahr 2018 betrug der Umfang der weltweiten Datenmenge 33 Zettabytes (33.000.000.000.000.000.000.000 Bytes). Diese Zahl mag einem schon groß vorkommen. Vergleicht man diese Menge mit der Prognose der International Data Corporation (IDC) staunt man nicht schlecht. Die IDC erwartet im Jahr 2025 eine Datenmenge von 175 Zettabytes. Würde man diese Daten auf DVDs abspeichern und diese dann stapeln, würde dieser Stapel von der Erde bis zum Mond führen. Und das 23 Mal!

Wo also die Daten abspeichern?

Im Laufe der Jahre wurden immer wieder neue Speichermedien entwickelt. Die einen halten sich länger, andere sind so schnell wieder weg, wie sie gekommen sind. Waren es vor Jahrzehnten noch Kassetten (1963), VHS (1976) und Disketten (1982), sind es später CD’s (1989), DVD’s (2001) und USB-Sticks (1996), die zur Abspeicherung von Daten genutzt werden.

Die Kunst besteht darin, ein Medium zu entwickeln, das zum einen eine große Datenmenge abspeichern kann, zum anderen nicht anfällig ist und dementsprechend lange hält. Viele Versuche, diese Kombination erfolgreich umsetzen zu können sind bereits gescheitert. Hier sind einige Beispiele von Projekten und Ideen, die bereits erforscht und mehr oder weniger erfolgreich umgesetzt wurden.

Holographische Datenträger:

Da die Kapazität von Datenträgern, wie CDs und DVDs vergleichsweise gering ist und darüber hinaus anfällig für Beschädigungen (z. B. Kratzer) sind, verlieren diese Medien nach und nach an Bedeutung. Eine Alternative zu diesen optischen Datenträgern ist eine HVD (Holographic Versatile Disc). Hierbei soll eine weitere Ebene entstehen (CDs sind zweidimensional), was zu einer Erweiterung der Speicherkapazität führen soll. Das Projekt wurde leider eingestellt, Experten vermuten jedoch einen baldigen Neustart der Idee eines holographischen Speichermediums.

Glas:

Nein, das bedeutet nicht, dass unsere Fensterscheibe den USB-Stick ablöst – genau genommen handelt es sich um Quarzglas. Forscher der Universität von Southampton haben hier bereits erste Erfolge verzeichnen können. Ein Laser hat eine Scheibe mit der Größe einer 2-Euro-Münze beschrieben. Die Kapazität liegt bei 360 Terrabyte. Diese Menge ist möglich, weil eine fünfdimensionale Nanostruktur verwendet wurde (x-, y- und z-Achse sowie die Ausrichtung und Größe).

Racetrack-Speicher:

Hier werden die einzelnen Speicherbits auf Nanodrähten gespeichert. Die Drähte sind nebeneinander angeordnet, was zu einer Ähnlichkeit mit Rennbahnen (Racetracks) führt, womit sich der Name des Mediums erklären lässt. Der Racetrack-Speicher verfügt über eine hohe Speicherdichte verglichen mit anderen Speichermedien. Das Konzept wurde 2008 erstmalig vorgestellt und sticht aktuelle Flashspeicher aus, da die Menge der möglichen speicherbaren Datenmenge um bis zum 100-mal übertroffen wird.

Noch ist nicht klar, wie wir in Zukunft unsere Daten abspeichern werden und welche Methode sich in Sachen Qualität, Menge und Haltbarkeit etabliert. Wir dürfen gespannt sein, welche neuen Speichermedien uns bald zur Verfügung stehen.