Sélection de problèmes et de solutions sous Unicenter TNG 2.4

1)    Problèmes de bases

  • La création d’un base plante

→ Vérifier les droits, le groupe et la propriétaire du fichier cadb dans :$CAIGLBL0000/cadb/manager/calnm/cadb

→ Vérifier qu’il ne reste plus rien concernant la base à reconstruire dans ce fichier

→ Vérifier que le répertoire où doit être reconstruit cette base est bien vide

 

2)    Problèmes de calendrier

  • Tous les jobs restent en Wait Ressource (WRSC)  

L’autosub est à OFF , s’il n’a pas été arrêté volontairement :

→ Vérifier que le calendrier existe bien

→  Vérifier que le calendrier est bien défini

→  Vérifier que le démon calendrier est bien lancé

# ps -ef | grep cal

# unistart cal (unishutdown cal pour l’arrêt)

 

  • Un utilisateur ne peut pas se connecter

→  Vérifier que le calendrier associé à cet utilisateur est bien défini

→  Vérifier que le démon calendrier est bien lancé

 

  • Un job ne se lance pas

→  Vérifier que l’utilisateur exécutant le commande (subuser du jobparm) n’a pas un problème de calendrier qui l’empêcherait de se connecter

→  Vérifier que le démon calendrier est bien lancé

NB : On ne parle ici que des exceptions, Il faut toujours vérifier les choses les plus simples en 1er lieu : noms des calendriers, existence des calendriers etc.

 

3)    Problèmes de CCI

  • Impossible de se connecter, pas d’interface graphique, pas de ping, etc.

→ Vérifierla connexion CCI

→ Vérifier que la machine se connaît elle-même :

– Vérifier le fichier /etc/hosts

– Exécuter la commande ‘uname –a’ : si pas de nom de machine alors problème système

– Vérifier le fichier de configuration ccirmtd.prf dans $CAIGLBL000/cci/config/<MACHINE>

NB : Comment créer une liaison CCI entre  deux serveurs unix

Editer les fichiers CCIRMTD.PRF (sur chacune des stations) et définir une station en startup et l’autre en nostart.

Faire un kill –3 sur le processus ccirmtd (faire ps –ef | cci pour connaître le numéro de processus).

 

4)    Problèmes d’ENF

  • Message d’erreur au  démarrage

exec(): 0509-036 Impossible de charger le programme /bnp/unicenter/cci/bin/caiccid en raison

des erreurs suivantes

0509-023 Symbole caienfk dans /usr/local/CAlib/libenf.o non défini.
0509-022 Impossible de charger la bibliothèque /usr/local/CAlib/libpig.o

L’ENF n’est pas rattaché au noyau.

→ Dans ce cas il faut tout arrêter, réinstaller les « hooks » et tout relancer

Pour réinstaller les « HOOK », exécuter le script

/etc/drivers/enf/install_hooks
ou
$CAIGLBL0000/enf/script/install_hooks

5)    Problèmes d’OPR (event Manager)

  • Plus de  logs  OPR

Sur UNIX plusieurs causes possibles :

– Le système de fichier est plein

→ il faut supprimer des logs.

– Le démon CAIOPR et tombé

→ arrêter l’OPR, vérifier avec la commande « ps » que le processus est bien absent et relancer l’OPR.

– problème lié à l’OPR : un message action ne fonctionne pas donc les actions liées à ce message action ne s’effectuent plus ; problèmes potentiels de lancement de jobs.

→ Arrêter proprement, vérifier la présence du processus (kill –9 si nécessaire)  et redémarrer l’OPR.

 

6)    Problèmes de sécurité

  • Un script d’accès à la base sécurité reste bloqué

→ Exécuter la commande ‘unifstat’, si il y a des db_server orphelins faire unidbclr pour nettoyer la base et supprimer les orphelins, puis recycler la sécurité par unicycle sécu.

  • Un job ne se lance pas

L’utilisateur qui exécute le job est suspendu ou n’a pas le droit de se connecter

→ vérifier le calendrier de l’utilisateur & du job

→ vérifier si les intercepts sont positionnés

→ vérifier si l’utilisateur existe, s’il n’est pas suspendu et s’il a bien le droit de se connecter

 

7)    Problèmes du STAR SERVER

  • Problème avec l’interface graphique à la connexion

→ Recycler le star server via la commande ‘uncycle star’

 

8)    Problèmes avec le Workload

  • Les jobs restent en Wait Ressource (WRSC) 

– Ils sont en attente d’une ressource (normal)

– L’autosub a été passé à OFF manuellement (voulu)

– L’autosub est passé à OFF lors de l’autoscan (problème calendrier, voir plus haut)

– La station (Si 1 ou 2 jobs en WRSC) est mal ou pas définie, (le nœud vers lequel doit pointer la station est le nom long de la machine).

 

  • Les jobs ne passent pas en complete & restent figés

Le  workload ne répond plus

→ Recycler le composant ‘unicycle sche’

 

  • Les jobs restent en start

Problème avec l’exit main et l’exit last

→ exécuter ‘enfcontrol 105’ pour connaître le type de configuration

→ s’il s’agit d’un job ayant un rapport avec des bases de données, alors il faut correctement configurer l’EXIT (MAIN/LAST)

 

9)    Problèmes avec les Triggers

  • Le trigger ne se déclenche pas

→ Vérifier que l’utilisateur qui a défini le trigger est bien le même que celui qui effectue la fermeture de fichier

→ Si le fichier est attendu sur un système de fichier monté (NFS), vérifier que la variable usestat=YES dans la définition du Trigger pour autoriser le montage NFS

→ Si le trigger doit se déclencher plusieurs fois, il ne doit pas avoir de calendrier