Off-Site Backup mit Arq

Kürzlich habe ich mein Online-Backup-Setup neu aufgestellt. Das ganze schwelte in meinem Kopf schon etwas länger rum, nun ist der Umstieg abgeschlossen – es wird also Zeit darüber zu schreiben.

Warum Online-Backup?

Festplatten und SSDs können sterben, soweit so klar – aber warum brauche ich ein Online-Backup wenn ich doch auf externe Festplatten sichern kann? Die Gründe können vielfältig sein. Sowohl externe Festplatten können kaputt gehen, aber vor allem können größere Schadensereignisse den eigenen Computer inkl. der Sicherungen dahinraffen. Beispiele wären zum Beispiel Einbruch, Feuer, Wasserschäden oder der berühmt berüchtigte Blitzschlag der gleich alle elektrischen Geräte frisst die irgendwo in der Wohnung an einer Steckdose stecken.

Vorteile

Die Vorteile liegen auf der Hand, das Backup der Daten ist einem anderen Ort – raus aus den eigenen vier Wänden. Ein Einbruch oder Feuer kann physisch nicht mehr auf das Backup zugreifen, die Daten sind vor allen denkbaren oberen Szenarien sicher. Peace of mind.

Nachteile

Natürlich gibt es Dinge über die man nachdenken sollte. Zum einen wäre da die schiere Dauer.

Upload-Dauer überschlagen
Upload-Dauer überschlagen

In meinem Mac steckt eine 500 GB SSD – aufgrund von fieser Daten-Sammel-Wut meinerseits ist diese zu 440 GB belegt, also nahezu voll. Davon entfallen einige wenige Gigabyte auf das Betriebssystem und die Software – Dinge also die man problemlos von woanders wieder bekommt, der überwiegende Rest jedoch sind meine Daten, also Dinge die für das Backup in Frage kommen. Wir reden also über etwa 380 GB an Daten die ins Internet verfrachtet werden müssen. Gehen wir von einem durchschnittlichen Internetanschluss mit 2 MBit/s Uploadgeschwindigkeit aus – dann ergibt sich für den ersten Upload aller Daten eine Dauer von 18 Tagen. Reine Uploadzeit – ohne Pause – Tag und Nacht – ohne weitere Benutzung des Internetanschlusses. In der Praxis redet man eher über die doppelte Zeit. Bei mir dauerte es jetzt beim Umstieg etwa 28 Tage.

Ein weiterer Nachteil, bzw. eine Frage die man sich stellen sollte ist die nach der Privatheit der Daten.

Alle(!) Daten werden in die ominöse Cloud (also auf Computer anderer Leute) geladen. Dafür müssen sie natürlich antständig verschlüsselt werden, am besten so das der Key niemals den eigenen Computer verlässt. Die Daten müssen bereits auf dem eigenen Rechner verschlüsselt werden und somit niemals im Klartext in der Cloud landen. Aber auch Krypto ist nur so gut wie die Implementierung mit der der sie gemacht wird und hier braucht man dann schon ein bißchen Vertrauen in den Anbieter den man sich aussucht.

auf den Key aufpassen

Eins gilt es in jedem Fall zu beachten: Auf den Schlüssel (bzw. das Passwort aus dem der Schlüssel abgeleitet wurde) müsst Ihr in dieser Konfiguration selbst aufpassen. Auch im Falle eines Wasserschadens/Feuers/Einbruchs und totalem Verlust des Computers solltet Ihr dieses (trotzdem hoffentlich starke) Kennwort noch haben. Bankschließfach, Passwort-Manager oder Gehirn – wie auch immer.

Anbieter

Nun habe ich mich schon vor Jahren für Online-Backup entschieden und verwende es seither. Damals habe ich über Mozy auch schon einmal zu dem Thema geschrieben. Irgendwann bin ich von Mozy (wegen Änderung der Preisstruktur) weg und auf Backblaze umgestiegen. Warum hab ich darüber damals eigentlich nicht gebloggt?

bisher: Backblaze

Bis vor wenigen Tagen habe ich also Backblaze verwendet. Die Preisgestaltung ist sehr fair. Man zahlt 5$ im Monat für den gesamten Inhalt des eigenen Rechners – egal wie groß die Festplatte ist. Externe Medien oder Netzlaufwerke/NAS-Geräte möchte Backblaze in diesem Tarif aber nicht so gern sichern, das würde wohl die Mischkalkulation kaputt machen. Dafür gibt es dann Business-Tarife – die sind allerdings nicht mehr für 5$ haben. Backblaze bietet einen nativen Client für Mac und Windows – kein Echtzeit-Java™ oder irgend so ein Mist. Der Client hält sich angenehm im Hintergrund, springt alle Nase lang an, stellt fest welche der Dateien sich seit der letzten Sicherung geändert haben oder dazugekommen sind und schiebt diese dann ins Rechenzentrum. Die Daten werden mit einem privaten Key auf dem eigenen Rechner verschlüsselt und dann hochgeladen. Soweit so prima. Leider hat Backblaze eigenartigerweise nur eine Online-Restore-Funktion bei der man auf der Webseite das Krypto-Kennwort eingeben muss und dann die gespeicherten Dateien herunterladen kann. Diese Art der Wiederherstellung machte mir immer irgendwie Bauchschmerzen – warum verschlüssel ich alle Daten auf meinem Rechner und später muss ich den Key auf der Webseite des Anbieters eingeben?

ab jetzt: Arq

icon_1024x1024Daher stand jetzt irgendwann mal der Wechsel zu einem anderen Anbieter an. Nach einiger Recherche habe ich mich für Arq-Backup entschieden. Der erste offensichtliche Unterschied ist hier die Tatsache das Arq keinen eigenen Onlinespeicher mitbringt (wie bei Mozy und auch Backblaze zuvor). Arq bietet also zunächst nur eine Client-Software die in der Lage ist vordefinierte Ordner auf Änderungen zu überwachen, die Inhalte zu verschlüsseln und in einen Online-Speicher der Wahl hochzuladen. Unterbrochene Uploads können bei nächster Gelegenheit nahtlos fortgesetzt werden, ältere Stände werden auf dem Onlinespeicher gesammelt und ggf. (um die Kosten nicht zu hoch zu treiben) je nach Alter wieder ausgedünnt. Da Arq als Firma keine Mischkalkulation zwischen Speicherplatzgröße und monatlichem Beitrag in Einklang bringen muss, sondern nur das Upload-Werkzeug zur Verfügung stellt, hat es auch kein Problem mit dem Upload von externen Platten oder Netzlaufwerken. Wenn diese zum Backup-Zeitpunkt nicht angeschlossen/verfügbar sind, dann setzt das Backup einfach aus. Wird das Laufwerk später wieder angeschlossen geht es weiter.
Arq kostet einen einmaligen Beitrag – good old style: 1x kaufen – fertig.

alles sichern

bring your own Onlinespeicher

Nun braucht man also noch einen Online-Speicher wo man die Daten hinschieben kann. Google Drive, Amazon S3/Glacier oder ein SFTP-Server kommen zunächst mal ins Gedächtnis. Alle 3 Variante werden von Arq unterstützt. Ich habe mich zunächst für Amazon S3 entschieden. Genauer für die Variante Glacier. Glacier ist vermutlich irgendeine Form von Bandspeicher-Storage-Pod-Roboter-Dings. Daten die man dort hinein speichert sind (anders als bei S3) eher zum lange lagern und selten zugreifen gedacht, dafür billiger. Bei der Wiederherstellung muss man einen Restore-Request stellen und einige Zeit später stehen die Daten dann zur Verfügung. Hintergrund dürfte sein, dass der Storage-Roboter das Band rausfischen und einlegen muss. Zum Glück automatisiert Arq diesen Request-Wait-Download-Zyklus – man muss sich da also eigentlich nicht drum kümmern – es sollte nur klar sein dass man nicht “mal eben” also im Sinne von jetzt ein File wiederherstellen kann. Man kann jetzt klicken, aber es kann ein paar Stunden dauern bis der Restore losgeht.
Eine andere Variante, die ich mir vorstellen und die ich vielleicht noch testen werde, wäre ein NAS zu kaufen und das Ding bei meiner Mutter in der Wohnung aufzustellen – SFTP-Port freigeben und dort hin sichern.

Kosten

Ok, Butter bei die Fische: Was kostet der Spaß denn nun? Bei Backblaze war das natürlich einfach zu beantworten und recht übersichtlich. Die Rechnung betrug jeden Monat 5$ für jeden Computer der gesichert wurde. Bei mir war das einer – also hing der Preis nur noch vom aktuellen Dollarkurs ab.

Für Arq ist die Rechnung etwas schwieriger – zum einen muss man zunächst mal Arq kaufen. Dafür werden einmalig 40$ fällig. Es gibt auch ein 70$ Paket in dem Lifetime-Updates inbegriffen sind – dieses hab ich gewählt.

Dazu kommen monatliche Kosten für den Onlinespeicher, oder eben die Kosten für ein NAS das man irgendwo aufstellen kann – vielleicht eine(n) Freund(in) finden, gegenseitig ein NAS aufstellen und sich den Speicher zur Verfügung stellen.

In meinem Fall zahle ich für Amazon S3 Glacier. Das Preismodell von Glacier ist nicht in einer Zahl zusammen zu fassen. Es gibt einen Preis für Upload, einen für Download – vorzeitiges löschen kostet extra, lagern der Daten kostet Geld und es gibt einen Preis für die Anzahl der Requests. Das klingt alles ganz schlimm, aber da jeder einzelne dieser Preise im 0,0…x $ Bereich liegt sind die Summen die hier zusammen kommen gar nicht so schlimm.

Budget
Nach dem initialen Upload lassen sich Budget-Grenzen festlegen die eingehalten werden sollen.

Die erste Amazon-Monatsrechnung die nach meinem Upload kam (vielleicht war der Upload am Ende des Abrechnungszeitraums noch nicht ganz fertig, das kann ich nicht mehr sagen) lag bei etwas über 15$. Der größte Teil dieses Preises bezieht sich auf die Upload-Requests und Transferkosten. Nach diesem ersten Upload werden monatlich nur noch erheblich weniger Dateien und Gigabyte übertragen, somit gehen auch die monatlichen Rechnungen deutlich runter. Verschweigen sollte man allerdings auch nicht, dass ein vollständiger Download der Daten, im Falle einer großen Datenkatastrophe, ebenfalls nochmal Restore-, Request- und Transferkosten bedeutet.

multiple versions
Mehrere Version des Backups werden gespeichert.

Ein NAS bei meiner Mutter aufzustellen kostet mich monatlich nichts (meine Mutter dagegen Strom), jedoch bringt es zunächst initiale Kosten von sicher mehr als 150€ mit sich und später müssen da irgendwann mal neue/größere Platten rein. Beide Varianten produzieren Kosten. Schlussendlich hat man die Wahl bei einem Cloudanbieter Infrastruktur zu mieten oder eben das Betriebsrisiko der Infrastruktur selbst zu tragen – das alte Spiel.

Fazit

Zusammenfassend lässt sich sagen dass Arq bislang für mich super funktioniert . Ich hab testweise auch mal ein paar Daten wiederhergestellt und auch das hat gut funktioniert. Die Kosten sind bislang gut zu überblicken (außerdem hatte ich passenderweise gerade einen 25$ Amazon-S3-Gutschein rumliegen).

Arq 5

Kurz vor Ende der Arbeiten an diesem Artikel erschien Arq 5 – auf den ersten Blick hat das nichts an meiner Wertung geändert, das Preismodell ist nun von “per Machine” auf “per User” umgestellt worden. Das ist für viele sicher nochmal mehr ein Argument, für mich macht das mit aktuell einem Rechner keinen Unterschied.

On this day..

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.