Error 0x800423f3 – VSS Event ID 8204 bei der Bare Metal Sicherung eines (DPM) Servers

Lange Zeit hatten wir unsere beiden DPM Server bei einem Kunden mit dem Windows Server Backup per Scheduled Task auf ein Netzwerkpfad täglich gesichert.

Später sind wir dann zur “Microsoft-Supporteten” Variante übergegangen und haben einen dedizierten Secondary DPM Server für alle DPM Server im Unternehmen aufgebaut.

Doch auch hier verwendet ja DPM Selbst das Windows Server Backup zum Sichern des Servers.

Leider ist nun seit einiger Zeit der Error: Error 0x800423f3 -mit der VSS Event ID 8204 aufgetaucht bei dem Versuch den Server zu sichern. Weder per Scheduled Task noch per DPM oder per Kommandozeile ist eine Bare Metal Sicherung mehr möglich.

Der VSS Writer gibt den folgenden Fehler aus:
Volume Shadow Copy Service error: An invalid XML document was returned from writer {27d4ecb3-4359-4305-8e44-7d1b7bc83780}.

Nach langer Suche bin ich auf ein KB von Microsoft gestossen was den Fehler sehr gut beschreibt.

http://support.microsoft.com/kb/983425

Es geht darum, dass der VSS Reader/Writer ein Limit an Mountpoints verarbeiten kann. Da jedoch der DPM Server selbst für jede Protection Group bzw. Protected Server (und natürlich bei einer Disk Reallocation) einen neuen Mount Point erstellt, es sehr schnell zu vielen Mount Points kommt, tritt dieser Fehler früher oder Später bei “großen” DPM Servern auf. In unserem Falle haben die beiden DPM Server jeweils 50 – 80 Client Server in der Sicherung mit einem Storage von jeweils 60TB.

Leider ist hier die Aussage von Microsoft sehr klar:
Eine Lösung für Windows Server 2008 gibt es im oben genannten KB doch leider keinen “direkten” fix von MS für >2008R2 Servern. Ein DCR (Design Change Request) wurde von der Produktgruppe bei MS abgelehnt. Der einzige Workaround hier ist ein Scalae-Out –> Aufsetzen eines weitern DPM Server und Protected Clients/Server übertragen…

An dieser Stelle hinterlässt das Produkt leider keinen guten Eindruck für eine Enterprise Lösung. . .

 

 

DPM 2012 und ‚Replikat inkonsistent‘

Nach dem Rollout von DPM 2012 und der Einrichtung der ersten Windows Server 2008 R2 kam es in einer Umgebung immer wieder zum o.a. Problem:

  • Die Sicherung der Laufwerke und anderer Komponenten wie z.B. Datenbanken klappt wunderbar,
  • nicht jedoch die Sicherung von
    • Bare-Metal-Recovery und
    • Systemstatus

Nach längerem Suchen fanden sich mehre mögliche Lösungen für diese Behebung dieses Problems:

  1. Das Feature ‚Windows-Server-Sicherungsfeatures’ war nicht installiert. Nur damit erfolgt die Sicherung des Systemstatus ;-)
    Schade, dass das von Microsoft beim Rollout des DPM Remote Agent nicht gemacht wird …
  2. In der Datei “%PROGRAMFILES%\Microsoft Data Protection Manager\DPM\Datasources\PSDataSourceConfig.xml” wird unter <FilesToProtect> vom Windows Sicherungsprogramm das größte gefundenen Laufwerk eingetragen, z.B. in der Form “R:\WindowsImageBackup”. Hier kann es helfen, den Laufwerksbuchstaben auf C: abzuändern.
  3. Unglaublich, aber wahr– einfach ‚mal den DPM-Speicherpooldatenträger überprüfen, ob der nicht voll ist … ;-) Für eine System State Sicherung wird vom DPM ‚mal eben ca. 30 GB reserviert …

Was ist neu in DPM 2012 ?

Bevor man sich mit dem Gedanken rumschlägt auf DPM 2012 zu updaten informiert man sich ja was denn DPM 2012 neues zu bieten hat. Microsoft hat dazu folgende wesentliche Features veröffentlicht. Wir kommentieren jedes Feature kurz :

1. Zentralisiertes Management verschiedener DPM Server. Das ist für uns ein ganz wichtiges Feature, wie wohl für jeden der Locations und Server quer über die Welt verteilt hat. Nun muss man sich nicht über die WAN Leitungen jeweils auf die verschiedenen Server verbinden sondern kann diese zentral managen.

2. Remote Management von DPM-Servern. Unserer Ansicht nach nur Marketing Deutsch von Microsoft und beschreibt letzten Endes ähnliches wie 1.

3. Mehrere DPM Server können sich eine SQL-Datenbank teilen. Auch ein wichtiges Feature wenn man zentralisiertes Tape-Management betreiben will. Weniger wichtig wenn Tapes vor Ort behalten werden. Aber wenn diese zentral gesammelt und gemanagt werden – ein wichtiger Punkt. Ebenso wichtig für Disaster Recovery.

4. Zertifikatsbasierte Authentifizierung für Computer in Arbeitsgruppen oder Domänen ohne Vertrauensstellung. Ganz wichtige Neuheit, gerade um damit Server in einer DMZ zu sichern, die ja nicht der Domäne angehören. Auch wichtig um Server in isolierten Umgebungen zu sichern.

5. Optimiertes Item-Level Recovery für Sharepoint Farmen. Ein paar Verbesserungen damit man einzelne Elemente in Sharepoint besser zurücksichern kann.

6. Verbesserungen beim Tape-Management durch Protection-Group-Sets. Wie in einem anderen Artikel bereits angesprochen hat sich die Art und Weise wie Co-Location organisiert ist in DPM 2012 verändert.

7. Unterstützung um VMM Hosts zu sichern. Das ist sicherlich ein ganz wichtiger Aspekt. Der Test in einer Produktivumgebung steht bei uns noch aus. Wenn wir das getestet haben, werden wir sicher einen Artikel dazu schreiben.

8. Neue Benutzeroberfläche. Das hat sicher die Marketingabteilung dazugedichtet. Mei, so viele hübsche Bilder. Das muss man doch den Leuten sagen ;-) . Mir gefällt die neue Oberfläche besser als die alte.

Es gibt noch weitere Verbesserungen, die man allerdings erst sieht wenn man den Orchestrator installiert hat und den neuen SCOM 2012. Im Gesamtpaket ist Microsoft mit dem neuen System Center 2012 ein gutes Produkt gelungen, auch wenn an einigen Stellen noch ein paar Löcher und Baustellen klaffen.

 

Tape-Report per E-Mail verschicken

Der Tape-Report ist für den Bandwechsel das A und O. Damit man diesen auch per E-Mail erhalten kann, muss man an zwei Stellen Konfigurationsänderungen vornehmen.

Zunächst einmal muss man in den Reporting Services vom SQL Server die Emaileinstellungen vornehmen. Dazu startet man den Reporting Services Configuration Manager. Zu finden unter SQL Server 2008 R2-> Configuration Tools.

Hier geht man dann auf E-Mail Settings und legt Absenderadresse und den SMTP Server fest:

Danach muss man nur noch im Tape Management einen Tape Report planen und die Empfängeradresse angeben im nächsten Tab E-Mail:

Im Tab E-Mail lässt sich auch das Format einstellen.
Zur Verfügung stehen: HTML, Excel & PDF.

 

ID 7024 – DPMRA stürzt immer wieder ab

Wir hatten auf einem unserer Server ein Phänomen, dass sich der DPMRA Service immer wieder abstürzte und wir somit keine Backups machen konnte. Dabei wurde immer das Event 7024 in der Ereignisanzeige generiert:


Nach ein wenig Recherche stellten wir fest, dass einer der Ports, die DPM benutzt um mit diesem Service zu kommunizieren von einem anderem Service bereits blockiert wurde.
DPM benutzt die TCP-Ports 5718 und 5719.

Der einfachste Weg dieses Problem zu lösen, ist dem DPM Agent beizubringen, dass er einen anderen Port benutzt. Dafür benutzt man SetAgentCfg.exe.
Diese findet man auf dem DPM Server unter:
%Programme%\Microsoft DPM\DPM\Setup\SetAgentCfg.exe

Aufpassen : Ist der DPM Server 64bit und der Protected Server 32bit lässt sich die SetAgentcfg.exe vom DPM Server nicht verwenden ! In dem Fall müsst ihr einen 32bit DPM Server testweise aufsetzen und von dort das Verzeichnis kopieren.

Die Datei kopiert man sich auf den Protected Server in das Agent Verzeichnis:
%Programme%\Microsoft Daten Protection Manager\DPM\bin

Die Syntax für den Befehl lautet:
SetAgentCfg e DPMRA PortInBenutzung NeuerPort

In unserem Fall war 5718 in Benutzung und wir haben ihn umgebogen auf 50111:
SetAgentCfg e DPMRA 5718 50111