Archiv für den Monat: September 2015


Host Disconnects mit VMWare 5.5.0U2 / VMware 6.x und IBM Storwize

Neue VMFS Heartbeat Methode

VMWare nutzt seit ESXi 5.5.0 Update 2 eine neue Methode für die VMFS-Heartbeat Überwachung. In Kombination mit einem IBM Storwize Storage-System kann dies zu unerwünschten Disconnects führen.

Wenn der Fehler auftritt, wird im Virtual Center folgender Fehler geloggt:

Lost access to volume <uuid><volume name> due to connectivity issues. Recovery attempt is in progress and the outcome will be reported shortly

Zusätzlich wird im vmkernel.log ein entsprechender Eintrag generiert:

ATS Miscompare detected beween test and set HB images at offset XXX on vol YYY

ATS heartbeat deaktivieren und Einstellung überprüfen

Um den Fehler zu umgehen muss auf dem jeweiligen ESXi-Host das sogenannte „ATS heartbeat“ deaktiviert werden. Dazu muss auf dem CLI des ESXi-Hosts folgender Befehl ausgeführt werden:

Für VMFS5 Datastores:

#Einstellung setzen
esxcli system settings advanced set -i 0 -o /VMFS3/UseATSForHBOnVMFS5

#Einstellung überprüfen
esxcli system settings advanced list -o /VMFS3/UseATSForHBonVMFS5

#Die Ausgabe sieht dann wie folgt aus:

Path: /VMFS3/UseATSForHBOnVMFS5
Type: integer
Int Value: 0 #check this value, 0=ATS ausgeschaltet, 1=ATS eingeschaltet
Default Int Value: 1
Min Value: 0
Max Value: 1
String Value:
Default String Value:
Valid Characters:
Description: Use ATS for HB on ATS supported VMFS5 volumes

Für VMFS3 Datastores:

#ATS für VMFS3 Datastores deaktivieren
esxcli system settings advanced set -i 1 -o /VMFS3/UseATSForHBOnVMFS5

#Einstellung für VMFS3 Datastores prüfen
esxcli system settings advanced list -o /VMFS3/UseATSForHBonVMFS3

#Die Ausgabe sieht dann wie folgt aus:

Path: /VMFS3/UseATSForHBOnVMFS3
Type: integer
Int Value: 0 #Check this value, 0=ATS ausgeschaltet, 1=ATS eingeschaltet
Default Int Value: 0
Min Value: 0
Max Value: 1
String Value:
Default String Value:
Valid Characters:
Description: Use ATS for HB on ATS supported VMFS3 volumes

WICHTIG: Diese Einstellung wird bei jedem ESXi Upgrade (z.B. 5.5.0 auf 6.0.0) überschrieben und muss nach dem Update des ESXi-Hosts neu gesetzt werden!

2015-09-14 10_15_26

Mehr Informationen zu diesem Fehler

IBM hat zu diesem Fehler ein Supportdokument erstellt. Auch bei VMWare ist der Fehler in der KnowledgeBase beschrieben.


Fehlende IPMI Kernel Module nachladen

Das Tool IPMITOOL unter Linux dient dazu, Werte wie Power State oder aktuelle Lüfter-Drehzahl etc… des Servers abzufragen.

Es kann manchmal vorkommen, dass trotz korrekter Installation via YUM oder APT beim Aufruf von ipmitool ein Fehler erscheint:

Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory

In den meisten Fällen ist dann das entsprechende Kernel Modul nicht geladen. Die fehlenden Module lassen sich entweder (als root) direkt laden. Diese stehen dann bis zum nächsten Neustart zur Verfügung. Dazu auf der Konsole des Servers die beiden nachfolgenden Befehle ausführen:

modprobe ipmi_devintf
modprobe ipmi_si

Sollen die Module automatisch beim Start des Systems geladen werden, können diese auch in der Datei /etc/modules eingetragen werden:

# /etc/modules: kernel module, welche während des Bootvorgangs geladen werden.
#
# Diese Datei sollte die Namen der Kernelmodule enthalten, 
# welchen während des Bootens gelanden werden, einzeln pro 
# Zeile. Kommentare beginnen mit einem "#" - alles dahinter 
# wird ignoriert.

#IPMI Module
ipmi_devintf
ipmi_si

Sollte die /etc/modules Datei fehlen kann diese direkt erstellt werden. Beim nächsten Systemstart werden die gewünschten Module automatisch geladen.

Keine Ahnung was du mit IPMI abfragen kannst?

Im WIKI von Thomas-Krenn.com ist dazu ein guter Artikel welcher den Einstieg in die Sensorabfrage via ipmitool erklärt.