Update Rollup 3 für DPM 2012R2 ist erschienen

Seit gestern bietet Microsoft das KB2966014 zum Download:
http://support.microsoft.com/kb/2966014

Das Update Rollup 3 für den DPM 2012R2 löst ein großes Hyper-V VM Backupproblem im Zusammenhang mit Cluster Shared Volumes.

Wer schon mal mit solchen Meldungen zu kämpfen hatte:

Cluster Shared Volume ‚Volume3‘ (‚Cluster Disk 4‘) is no longer accessible from this cluster node because of error ‚ERROR_TIMEOUT(1460)‘

oder

Cluster Shared Volume ‚Volume3‘ (‚Cluster Disk 4‘) has entered a paused state because of ‚(c0130021)‘. All I/O will temporarily be queued until a path to the volume has been reestablished.

wird sich über dieses Update Rollup riesig freuen.

Daneben wird ein neues Features eingeführt mit der man Backup und Consistency Check Wartungsfenster via Powershell definieren kann. Sollte also das Backup mal länger dauern , kann man so wenigstens dafür sorgen, dass der Produktivbetrieb nicht eingeschränkt wird. Jobs, die dann noch nicht begonnen haben werden abgebrochen. Laufende Jobs werden natürlich zu Ende gebracht.

Momentan unterstützt diese Funktion nur die VM Sicherung, aber es wird wohl nur eine Frage der Zeit sein bis diese Funktionalität auch für alle anderen Sicherungstypen angeboten wird.

Eine weitere neue Funktion ermöglichst es nun auch den DPMRA Port zu konfigurieren.

Mehr Details dazu im obigen KB Artikel auf der Microsoft Seite.

System Protection Backup schlägt fehl und im Eventviewer findet sich ein CAPI2 Fehler – Eventid 513

Manchmal muss man tief in den Eingeweiden von Windows wühlen um einen Backupfehler zu finden und zu lösen. Ein physikalischer Server ließ sich plötzlich nicht mehr sichern nach diversen Windows Updates. In den DPM Logs ließ sich kein Fehler finden. Allerdings loggte der Server bei jedem Backupversuch das Event 513 für CAPI2:

event513_CAPI2

Damit ließ sich schon mehr anfangen. CAPI2 ist die Crypto API die vom Cryptographic Services Dienst benutzt wird. Offensichtlich ein Permission Problem, dass durch ein Windows Update verursacht wurde. Der NETWORK_SERVICE darf hier nicht zugreifen. Das ist der Account mit dem der VSS System Writer versucht ein Backup zu machen.

Um das gerade zu biegen benötigen schauen wir uns mit Hilfe von sc sdshow MSLLDP die Permissions des Microsoft Link-Layer Discovery Protocols an. Parallel schauen wir uns mit sc sdshow MUP die funktionierenden Permissions an. Daraus kopieren wir den String für den NETWORK_Service und setzen ihn dann mit Hilfe sc sdset. Dabei kopieren wir aus dem vorhergehenden sdshow von MSLLDP alle Security Informationen und fügen den Code für den NETWORK_SERVICE hinzu (A;;CCLCSWLOCRRC;;;SU) und setzen ihn vor S: in dem String von MSLLDP.

Zusammengefasst sieht das dann so aus:

sc_sdshow_mslldp

Jetzt noch den Dienst neustarten mit net stop cryptsvc und net start cryptsvc und schon ist der Fehler behoben und es gibt keine CAPI2 Error Events mehr im Eventlog.

Lässt man nun einen Recovery Point in DPM erstellen, dann läuft dieser ohne Probleme durch.

Ich gehe davon aus, dass das ein Bug in einem der Windows Updates für Server 2012R2 ist, denn ein ungepatchter 2012R2 läuft nicht in dieses Problem. Auf der anderen Seite laufen auch nicht alle gepatchten 2012R2 in dieses Problem hinein. Ist vermutlich eine magische Kombination aus mehreren Faktoren die hier die Permissions durcheinander bringt.

 

DPM beschwert sich über fehlenden Speicherplatz beim Baremetal Backup – Shadow Copy

DPM beschwert sich immer mal wieder über fehlenden Speicherplatz. Sei es im Replica Volume, dem Recovery Point Volume oder auch mal direkt auf C: wenn man ein Baremetal Backup machen möchte.

Eine neue Fehlermeldung ist mir die letzten Wochen häufiger über den Weg gelaufen. DPM meldet:
There is not enough disk space to create the volume shadow copy

Wenn man sich C: anschaut ist meist mehr als genug Platz vorhanden. Diese Fehlermeldung kommt woanders her. Das merkt man ziemlich schnell, wenn man anstelle eines Baremetal Backups nur einen Recovery Point für System State in DPM erstellt. Dieser wird erfolgreich gemacht.

Im Baremetal Backup ist zusätzlich zum System State auch ein Backup der Recovery Partition. Wenn in dieser weniger als 50MB frei sind, dann schlägt das Backup fehl. Die Ursache ist dabei nicht beim DPM zu suchen, sondern beim VSS.

VSS benötigt bei Partitionen die kleiner sind als 500MB ein Minimum von 50MB frei um einen Snapshot (shadow copy) zu erstellen. Bei Partitionen die größer sind als 500MB liegt das Minimum bei 320MB.

Jetzt kann man natürlich hergehen und einfach die Partition vergrößern. In einem sehr kleinen Umfeld kann man das machen. Wenn man aber einige hundert Server hat möchte man die Konfiguration eher einheitlich belassen. Daher gibt es einen einfach Workaround. Man sagt dem VSS Writer, dass er für die Recovery Partition einfach das C: Laufwerk als Storage für die Shadow copy verwenden soll anstelle der direkten Partition.

Um das zu tun, benötigen wir die Laufwerks ID der Recovery Partition. Diese erhalten wir, wenn wir mountvol aufrufen:

mountvol

Die ID ohne Mount Point ist unsere Recovery Partition. Mit vssadmin können wir dem VSS Writer mitteilen, dass er C: benutzen soll für die Shadowcopy:

vssadmin add shadowstorage /for=VOLUMENAME /on=C: /MaxSize=500MB

vssadmin add shadowstorageDer nächste Recovery Point in DPM wird dann erfolgreich erstellt.

 

 

Baremetal Backup schlägt hin und wieder fehl bei früherem Printserver

Bei einem Kunden konnte ich folgendes beobachten in einem DPM Server 2012R2 Umfeld:

Bei einigen Servern liessen sich nach einiger Zeit keine Baremetal Recovery Points mehr erstellen. Logfiles zeigen dass RAPreBackup mit einem Error aussteigt und das ohne ersichtlichen Grund, der auf DPM zurück zu führen ist:
0x80990ED0

Wenn die Server rebooted werden, dann lassen sich wieder Recovery Points mit DPM erstellen. Einige Tage später ist der Fehler wieder da, ohne dass es irgendwelche Änderungen gab. Nach einigem hin und her stellte sich heraus, dass alle Server entweder Printserver oder ehemalige Printserver waren.

Also warteten wir bis der Fehler wieder da war. Dann stoppten wir den Print Spooler und versuchten erneut einen Recovery Point zu erstellen. Dieser funktionierte einwandfrei.

Es stellte sich heraus, dass auf den ehemaligen Printservern noch einige HP Dienste zurückgeblieben sind, obwohl die Druckertreiber deinstalliert wurden. Es handelt sich hierbei um den Dienst PML Driver HPZ12 und Net Driver HPZ12.

Wenn man statt des Print Spoolers diese zwei Dienste anhält, dann funktioniert das Baremetal Backup ebenfalls. Also deaktivierten wir die Dienste auf den ehemaligen Printservern.

Auf dem Server der nach wie vor als Printserver agiert, konnte wir diesen Workaround natürlich nicht durchführen. Stattdessen halten wir via PreBackup Skript den Print Spooler an und starten ihn wieder wenn Windows Server Backup fertig ist.