Was mache ich im Notfall, wenn Andreas nicht da ist

Table of Contents

Für die Zeit meiner Abwesenheit ist hier eine kleine Kurzanleitung zur Behebung der häufigsten Fehler in der Netzwerkinfrastruktur des Instituts hinterlegt.

Probleme

Grundsätzlich kann man über die SmokePing-Konsole sehen, welche wichtigen Rechner nicht erreichbar sind.

grafische Benutzeroberfläche startet nicht

Nach einem Reboot startet bei Computern mit NVidia-GrafikKarten die grafische Benutzeroberfläche gelegentlich nicht, weil der Kerneltreiber für diese Kernelversion noch nicht installiert ist. In diesem Fall

$ lspci | grep VGA

um festzustellen, ob es sich tatsächlich um eine NVIDIA handelt; dann kann mit

$ sudo NVIDIA

das nötige Kernelmodul für den laufenden Kernel installiert werden.

kein Kerberos-Ticket zu erhalten

Nach der Eingabe von “kinit” erhalten sie mit “klist” kein gültiges Token.

Da eine Umkonfiguration der Kerberos-Installation nicht zu erwarten ist, kommt nur ein Problem mit den Kerberos-Servern in Frage.

Die beiden Kerberos-Server laufen innerhalb von virtuellen Maschinen auf unterschiedlichen Hosts.

Problem: kein Zugriff auf AFS

Wenn der Zugriff aufs AFS gestört ist, kann der entsprechende Server über das Kommando “fs checkservers” herausgefunden werden.

alle Server ok (all servers are running ???)

Sollte dabei herauskommen, daß alle Server funktionieren, ist vermutlich der lokale AFS-Client nicht mehr in Ordnung und wird durch einen Neustart des PCs in den meisten Fällen problemlos korrigiert. Sonst kann der AFS-Client gestoppt werden (“service openafs-client stop”), danach wird der Cache gelöscht (“rm -rf /var/cache/openafs/*”) und der Client neu gestartet (“service openafs-client start”).

ein oder mehrere AFS-Server sind nicht erreichbar

  • Bei einem defekten AFS-Server kann man versuchen sich einzuloggen - funktioniert das nicht, ist ein Reboot des Servers nötig. Wenn das einloggen funktioniert, sieht man nach, ob ein Salvage-Prozess läuft (ein Art file system check des AFS), solange dies arbeitet, ist ein manueller Eingriff nicht ohne tiefere Kenntnisse von AFS empfehlenswert.
  • Die Wiederherstellung einer defekten Datenplatte am AFS-Server ist in BackupRestore unter “Restore einer defekten Daten-Partition am AFS-Server” dokumentiert - bitte in diesem Fall an David wenden.
  • Wiederherstellung einer defekten Systempartition - schwierig, siehe BackupRestore unter “Bare Metal Recovery” - bitte in diesem Fall an Christian wenden.

Mail und WWW-Server reagiert nicht

In den meisten Fällen sind Probleme mit den öffentlichen Services auf Probleme des AFS-Clients zurückzuführen - Neustart des Servers hilft dann so gut wie immer.

Drucken mit CUPS funktioniert nicht

Wenn einzelne Drucker über CommonUnixPrintingSystem (CUPS) nicht drucken, muß die entsprechende CUPS-Queue wieder gestartet weren: https://faepcups.tu-graz.ac.at:631/printers

<comment>

Mail und Web-Server (faepsv) oder MLTutor (faepsv02) versagt

Von diesen PCs wird einmal pro Monat mit /root/bin/backup_host ein dump(8) (Level 0, Blockgröße 512 KiByte, Kompression mit bzip2) der Filesysteme “/”, “boot“ und ”/srv“ auf die NFS-Partition /temp durchgeführt. Zum restore muß die Platte mit einem der gängigen CD-Linuxe (z.B. http://www.grml.org) oder dem NFS-Root von FullyAutomaticInstallation partitioniert, formatiert und zurück kopiert werden:

mkfs.ext3 -m 5 -c /dev/hda1
mkdir /mnt/disk; mount -t ext3 /dev/hda1 /mnt/disk
mkdir /mnt/temp; mount -t nfs faepsv03:/itp/faepsv03/temp /mnt/temp
cd /mnt/disk
restore rf /mnt/temp/dump/....

</comment>


Prozeduren

Rechner neu starten

  • einloggen als Benutzer “root”
  • Neustart mit dem Kommando “reboot”
  • nach spätestens 5 Minuten sollte der Rechner wieder aktiv sein (außer es wird ein file system check durchgeführt) - dann bitte einen Neustart über den Reset-Knopf auslösen. Während eines file system check aber bitte keinesfalls RESET auslösen
  • Nach dem starten des Computers als Benutzer “root” einloggen und das Program “cfagent -qK” starten.

neuen Laptop ins Institutsnetz integrieren

  • MAC-Adresse (EthernetHardware-Adresse) des Laptops feststellen - unter Linux geht das am einachsten mit ifconfig eth0 unter Windows irgendwie mit ipconfig.
  • im TugOnline unter IP-Adresse eine freie Adresse im Bereich 129.27.161.200 bis 129.27.161.254 suchen, dem neuen Benutzer zuordnen und aktivieren
  • Name des Benutzers, IP- und MAC-Adresse an Andreas schicken, damit die Änderungen nicht verlorengehen
  • Am Konfigurations-Server (faepsv04) in der Datei /root/config/DIVERSES/dhcpd.master eine neue Zeile mit den Daten des Computers im Block unter #### Notebooks einfügen.
  • rausfinden, auf welchen Computern derzeit die DHCP-Server laufen (ls /root/config/DIVERSES/dhcpd.faep*) und auf mindesten einem der Rechner einloggen, die ConfigurationEngine ausführen (cfagent -qK) und nachsehen, ob der DHCP-Server die Änderungen akzeptiert hat (service isc-dhcp-server status).
  • Wenn DHCP danach funktioniert, sollte der neue Laptop beim nächsten Starten seines Netzwerks die zugewiesene IP-Adresse erhalten.
  • Wenn DHCP danach nicht funktioniert, unbedingt den Fehler beheben, sonst sind nach 36 Stunden alle Desktop-Rechner off line.

Benutzerverwaltung

Passwort für Studierende ändern

Einige Mitarbeiter des Instituts können Passworte von Studierenden ändern. Führen sie dazu die Kommandos

$ alias pw_random='ssh -t faepsv.tugraz.at "sudo /usr/local/sbin/passwd_random"'
$ pw_random <Benutzername(n)> 

aus. Mehrere Benutzernamen werden durch Leerzeichen getrennt. Siehe auch die Seite Passwort ändern für Benutzer im Wiki des Instituts .

neue Benutzer anlegen

Um einzelne neue Benutzerkonten anzulegen müssen sie als Benutzer “root” am Computer faepsv.tugraz.at angemeldet sein; entsprechende AFS und Kerberos-Berechtigungen haben und das Programm createuser.pl starten:

$ ssh faepsv.tugraz.at
$ sudo -i
# kinit admin
# aklog
# finger <accountname>            # gibt es den Benutzer schon
# createuser.pl -c "Vorname Nachname" <accountname>
# make YP                         # verteilen des neuen Accounts per NIS
# logout
$ logout

Mit diesem Beispiel wird eine Mitarbeiter-Account mit größerem Quota und weitergehenden Berechtigungen angelegt.

Studentenaccounts

Um Accounts für Studierende anzulegen laden sie im TUGonline die Teilnehmerliste im Format CSV herunter und schicken sie an Winfried Kernbichler.

<comment> Für Studentenaccounts sollten sie das Web-Formular ausfüllen lassen und statt createuser.pl besser newaccountmake verwenden. Den notwendigen Betreuernamen erfahren sie aus newaccountstats.pl:

$ ssh faepsv.tugraz.at
$ sudo -i
# kinit admin
# aklog
# new_account_stats.pl
# new_account_make.pl <betreuername>
# logout
$ logout

Die Accountzettel werden automatisch am Drucker “3” gedruckt. </comment>


Vermeidung von Problemen

In der Woche vor geplanter Abwesenheit werden keine Änderungen am System vorgenommen. Die Zeit kann besser investiert werden:

  • Doku schreiben
  • Aufräumen des Schreibtisches/Zimmers
  • Einschulen des Ersatzmannes :)
  • ….

Author: Andreas Hirczy

Created: 2017-11-08 Mit 18:19

Validate XHTML 1.0