Single Drive Tape mit DPM

Einer unserer Leser hatte folgende Frage:

Für die Langzeitarchivierung sichere ich auf Band (DPM2010). Gesichert wird auf ein Einzellaufwerk (LTO-3), dessen Kapazität aber  nicht ausreicht. Nach Einlegen eines 2. Bandes wird aber der Job nicht automatisch fortgesetzt, man muss den aus der Überwachung heraus anstoßen (fortsetzen), damit es weiter geht. Kann man das automatisieren?

Ich habe ihm dazu ein Mail geschrieben und will euch hier auch einen Tipp dazu verraten.

DPM schreibt ein Band voll und wartet dann 60 Minuten auf ein freies Tape. Wird in dieser Zeit ein freies Tape gefunden läuft der Job weiter. Andernfalls wird der Job abgebrochen und man muss ihn anschliessend manuell fortsetzen (Resume backup).

Man kann diese Zeit verlängern mit einem Registryeintrag auf dem DPM Server.
Dazu navigiert man in den Tree:
HKLM\Software\Microsoft\Microsoft Data Protection Manager\1.0\Prompting

Timeout für Wartezeit auf freies Tape

und legt hier einen neuen DWORD Wert an namens PromptingTimeOut an.

Dessen Wert in Millisekunden ist dann die neue Definition für die Wartezeit auf Tapewechsel. Anpassen und anschliessend den MSDPM Dienst neustarten.

DPM und Hyper V – security process error(s)

DPM und Security Process Errors beim Sichern von Hyper V Maschinen.
Hier für Dich eine erste Hilfe.

a.)    Versionsstände der Integration Services auf den einzelnen VMs (guest) und Hosts  überprüfen und falls unterschiedlich auf einen identischen Stand zu bringen

Hierzu kannst Du auch gerne das in dem nachfolgenden Artikel beschriebene Script verwenden

http://blogs.msdn.com/b/robertvi/archive/2010/10/11/a-script-to-check-the-integration-services-version-on-hyper-v-host-and-guests.aspx

b.)    Überprüfe, ob alle benötigten Hotfixes für Hyper-V auf dem Host bzw Guests hinterlegt und installiert sind

http://technet.microsoft.com/en-us/library/dd430893(WS.10).aspx

c.)  Dieses gilt ebenfalls für den DPM Server selbst, wo das aktuellste DPM Rollup Package installiert sein sollte. Bitte einmal diesbezüglich überprüfen und falls fehlend auf dem System nachinstallieren

http://support.microsoft.com/kb/2250436

d.)    Oftmals hilft auch ein Offline Backup für eine zwischenzeitliche Sicherung.

Es gibt auch einen RegKey der Offline Backups als Fehlgeschlagen anzeigen lässt – was DPM dazu veranlasst keine Snapshots zu machen wenn die VM in einem nicht sicherbaren Online Backup Status ist, um so eine Downtime für die VMs zu verhindern. Leider ist daher auch die Konsiquenz das keinerlei Backups von der betroffenen VM gemacht werden. Hier der Reg Key:

Erstelle auf der Hyper-V Host Maschine einen DWORD Key im folgenden Pfad:  HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Microsoft Data Protection Manager\Agent\, und nenne es  „AllowOffline“  und setzte den Wert auf 0.

Oder durch Markieren der Box im nachfolgenden Screen:

e.) Die Workarounds wie in den nachfolgenden Artikeln beschrieben umsetzen, da diese den Fall behandeln: Online Sicherung schlägt fehl, jedoch die Offline Sicherung funktioniert:

http://technet.microsoft.com/en-us/library/ff634205.aspx

http://technet.microsoft.com/en-us/library/dd347840.aspx

Dieses Thema bezieht sich hauptsächlich auf DPM 2010. In DPM 2012 konnten wir solche Fehlermeldungen bislang noch nicht beobachten.

Registry Key(s) für das Laufzeitverhalten / Autoheal

Anbei eine Tabelle mit den Registry Einträgen wie DPM sich bei fehlgeschlagenen Jobs verhält. Hier können jeweils die Werte angepasst werden um z.B. einen Fehlgeschlagenen Job automatisch nach x Minuten erneut zu versuchen und selbstverständlich die Anzahl nach wie vielen Versuchen der Job komplett fehlschlägt.

Alle Keys unter sind hier zu finden:

HKLM\Software\Microsoft\Microsoft Data Protection Manager\Configuration

Key Type Setting the key controls Implications
DisableAutoHeal DWORD Auto-rerun only If set to a non zero value, DPM will not automatically rerun jobs.If missing or set to zero, DPM will automatically rerun jobs.If auto-heal is disabled, other keys for auto-rerun do not apply.
AutoRerunDelay DWORD The delay in time before which DPM will attempt to automatically rerun failed jobs This should be changed if you have typical production server down time/network down time in excess of the default value of 60 mins.If multiple reruns are configured, this is the gap between the reruns as well.
AutoRerunNumberOfAttempts DWORD The no. of times a failed job will be retried before giving up if it consistently fails. Default is one. Increasing this value may increase the load on your system.The reruns are done at the gap of AutoRerunDelay.