Linux Kernel Watchdog
Der Linux -Kernel -Watchdog wird verwendet, um zu überwachen, ob ein System ausgeführt wird. Es soll hängende Systeme automatisch neu starten. Das Watchdog -Modul ist spezifisch für die verwendete Hardware oder Chip. Personalcomputerbenutzer benötigen keinen Watchdog, da diese das System manuell zurücksetzen können. Es ist jedoch nützlich für Systeme, die missionkritisch sind und die Fähigkeit benötigen, sich ohne menschliche Intervention neu zu starten. Zum Beispiel Server an einem abgelegenen Ort oder eingebetteten Geräten auf einem Raumfahrzeug, für das automatische Hardware -Reset -Funktionen erforderlich sind.
Warnung: Vorsicht vorgehen
Falsche Konfigurationen eines Wachhundes auf Ihrem System können Probleme verursachen wie:
Vermeiden Sie also, Live -Server zu verwenden, um Linux -Kernel -Watchdog zu testen.
Watchdog -Modul
Die Watchdog -Funktionalität auf der Hardware -Seite stellt einen Timer ein, der nach einem vorgegebenen Zeitraum ausfällt. Die Watchdog -Software aktualisiert dann regelmäßig den Hardware -Timer. Wenn die Software nicht mehr erfrischt, führt der Timer nach dem vorgegebenen Zeitraum einen Hardware -Reset des Geräts durch. Damit ein Watchdog -Timer funktional ist, muss der Motherboard -Hersteller die Watchdog -Funktionalität des Chips verwenden. Oft ist die Dokumentation des Herstellers nicht klar darüber, ob die Funktionalität implementiert wurde. In diesem Fall müssen Sie es testen.
Außerdem müssen Sie das richtige Watchdog -Kernel -Modul in Ihrem Linux -System geladen werden. Unterschiedliche Chips verwenden unterschiedliche Module. Zum Beispiel:
Nach dem Laden des Moduls können Sie auf dem Linux -System /Dev /Watchdog überprüfen. Wenn diese Datei vorhanden ist, bedeutet dies, dass der Treiber oder Modul des Watchdog -Kernels geladen wurde. Das System schreibt regelmäßig weiter an /dev /watchdog. Es heißt auch "Treten oder Füttern des Wachhundes". Wenn das System den Wachhund nicht tritt oder füttert, ist nach einer Weile das System hart zurückgesetzt.
Watchdog -Daemon
Der Watchdog -Daemon öffnet das Gerät und bietet die erforderliche Aktualisierung, damit das System zurückgesetzt wird. Es kann den Vorgangstabellenraum, Speicherverwendung, Dateizugriffsfunktion, Arbeitsüberladung, Überlauf des Dateitabels, IP -Adress -Ping, Netzwerkschnittstellenverkehr, Temperatur, laufende Prozesse und mehr getestet werden. Wenn die Tests fehlschlagen, verursacht Watchdog eine Abschaltung.
Watchdog anfangen und stoppen
Der Watchdog -Daemon sollte zur Bootzeit beginnen und sich in den Hintergrund setzen. Sie können überprüfen, ob es ausgeführt wird:
PS -AF | Grep Watch*
Wenn der Kernel nicht mit config_watchdog_nowayout kompiliert wird. Wenn Sie den /Dev /Watchdog ordnungsgemäß schließen, verursacht er keinen Neustart. Sie können das Zeichen V in /dev /watchdog schreiben und dann die Datei schließen. Dies sollte den Wachhund stoppen.
Wenn Sie testen möchten, ob der Hardware -Watchdog funktioniert, können Sie Folgendes von Ihrer Administrator -Eingabeaufforderung ausführen:
Katze >> /Dev /Watchdog
Und drücken Sie zweimal auf "Eingeben" und warten Sie. Die Eingabeaufforderung kommt nicht zurück. Nach einer Weile sollte das System abhängig von der Einstellung Ihres Kernels den harten Neustart durchführen.