Bonjour,

Il y a quelques jours un mes disques durs IDE m'a lâché donc mon serveur s'est complètement figé et j'ai du le relancer à la main.
Cela m'était déjà arrivé...
Donc à part le fait que le disque avait moins d'un an, je ne me suis pas inquiété outre mesure quant à la stabilité de mon système après cet incident.

Par la suite, je désirais monter certains partages NFS sur certains postes.
Sur certains de ces postes j'ai un script qui s'occupe de ça, sur d'autre ils sont dans le fstab.
Par exemple :
# mount -a
mount: 192.168.0.1:/partage1 failed, reason given by server: Permission denied
...
mount: 192.168.0.1:/partage8 failed, reason given by server: Permission denied
Sur le coup j'ai testé aussi en smbfs (les partages sont faits avec les deux systèmes).
# mount -t smbfs //192.168.0.1/partage1 /partage1 -o guest
mount: type erroné de système de fichiers, option erronée, super bloc erroné sur //192.168.0.1/partage,
       codepage manquante ou autre erreur
       Dans quelques cas certaines informations sont utiles dans syslog - essayez
       dmesg | tail  ou quelque chose du genre

# mount -t cifs //192.168.0.1/partage1 /partage1 -o guest
#
Cela à donc fini par fonctionner en cifs (beurk).

Je me suis rendu sur le serveur et j'ai voulu relancer les services :
#  service nfs restart; service nfslock restart 
Arrêt de NFS mountd :                                      [  OK  ]
Arrêt du démon NFS :                                       [  OK  ]
Arrêt des quotas NFS :                                     [  OK  ]
Arrêt des services NFS :                                   [  OK  ]
Démarrage des services NFS :                               [  OK  ]
Démarrage du quota NFS :                                   [  OK  ]
Démarrage du démon NFS :                                   [  OK  ]
Démarrage de NFS mountd :                                  [  OK  ]
Arrêt du verrouillage de NFS :                             [  OK  ]
Arrêt de NFS statd :                                       [  OK  ]
Démarrage de NFS statd :                                   [  OK  ]
Ce qui donne (dans /var/log/messages) :
Feb  4 07:19:25 localhost mountd[19973]: Caught signal 15, un-registering and exiting.
Feb  4 07:19:25 localhost kernel: nfsd: last server has exited
Feb  4 07:19:25 localhost kernel: nfsd: unexporting all filesystems
Feb  4 07:19:25 localhost kernel: NFSD: Using /var/lib/nfs/v4recovery as the NFSv4 state recovery directory
Feb  4 07:19:25 localhost kernel: NFSD: starting 90-second grace period
Feb  4 07:19:26 localhost rpc.statd[20022]: Caught signal 15, un-registering and exiting.
Feb  4 07:19:26 localhost rpc.statd[20386]: Version 1.1.0 Starting
Et ça ne fonctionne toujours pas.

Lorsque j'essaye de monter les partages j'ai ça dans /var/log/messages :
Feb  4 07:34:05 localhost mountd[20337]: authenticated mount request from poste1:989 for /partage1 (/partage1)
...
Feb  4 07:34:05 localhost mountd[20337]: authenticated mount request from poste1:1010 for /partage8 (/partage8)
Ça me fait la même chose avec ou sans la ligne de /etc/exports qui désignait le disque défunt.

Je précise aussi que j'ai un poste qui était allumé au moment du plantage du serveur et qui avait déjà les partages montés.
Ce poste n'a pas bronché et je n'ai pas du remonté les partages car ces derniers sont toujours accessibles.
J'ai même redémarré le serveur entre temps (au cas où...) et ce poste se porte toujours bien.


Je suis preneur de toute idée qui pourrait me faire avancer.

Merci de m'avoir lu.
Un petit up.

Je sais que c'est long à lire mais je n'ai pas trouvé de réponse et c'est un service relativement important.
Si il manque des informations pour résoudre ce problème je serais ravi de vous les transmettre.

Merci.
Comment est configuré ton serveur ?
Je ne pense pas avoir bien compris ce que tu me demande.

À tous hasards je mets ces fichiers :

/etc/sysconfig/nfs (que je ne me souviens pas avoir jamais touché) :
#
# Define which protocol versions mountd 
# will advertise. The values are "no" or "yes"
# with yes being the default
#MOUNTD_NFS_V1="no"
#MOUNTD_NFS_V2="no"
#MOUNTD_NFS_V3="no"
#
#
# Path to remote quota server. See rquotad(8)
#RQUOTAD="/usr/sbin/rpc.rquotad"
# Port rquotad should listen on.
#RQUOTAD_PORT=875
# Optinal options passed to rquotad
#RPCRQUOTADOPTS=""
#
#
# TCP port rpc.lockd should listen on.
#LOCKD_TCPPORT=32803
# UDP port rpc.lockd should listen on.
#LOCKD_UDPPORT=32769
#
#
# Optional arguments passed to rpc.nfsd. See rpc.nfsd(8)
#RPCNFSDARGS
# Number of nfs server processes to be started.
# The default is 8. 
#RPCNFSDCOUNT=8
#
#
# Optional arguments passed to rpc.mountd. See rpc.mountd(8)
#RPCMOUNTDOPTS=""
# Port rpc.mountd should listen on.
#MOUNTD_PORT=892
#
#
# Optional arguments passed to rpc.statd. See rpc.statd(8)
#STATDARG=""
# Port rpc.statd should listen on.
#STATD_PORT=662
# Outgoing port statd should used. The default is port
# is random
#STATD_OUTGOING_PORT=2020
# Specify callout program 
#STATD_HA_CALLOUT="/usr/local/bin/foo"
#
#
# Optional arguments passed to rpc.idmapd. See rpc.idmapd(8)
#RPCIDMAPDARGS=""
#
# Set to turn on Secure NFS mounts. 
#SECURE_NFS="yes"
# Optional arguments passed to rpc.gssd. See rpc.gssd(8)
#RPCGSSDARGS="-vvv"
# Optional arguments passed to rpc.svcgssd. See rpc.svcgssd(8)
#RPCSVCGSSDARGS="-vvv"
# Don't load security modules in to the kernel
#SECURE_NFS_MODS="noload"
#
# Don't load sunrpc module.
#RPCMTAB="noload"
#
/etc/exports (qui marchait plutôt bien) :
/partage1 192.168.0.0/255.255.255.0(ro)
/partage2 192.168.0.0/255.255.255.0(ro)
/partage3 192.168.0.0/255.255.255.0(ro)
/partage4 192.168.0.0/255.255.255.0(ro)
/partage5 192.168.0.0/255.255.255.0(rw)
/partage6 192.168.0.0/255.255.255.0(rw)
/partage7 192.168.0.0/255.255.255.0(rw)
/partage8 192.168.0.0/255.255.255.0(rw)
/private1 192.168.0.6(rw)
/private2 192.168.0.3(rw)
/private3 192.168.0.2(rw)
Merci.
Pas d'idée ?

J'ai cherché dans d'innombrable recoins mais en vain.
J'ai essayé tous les redémarrages possibles, sans plus de résultats.

Je me suis même demandé si il n'y avait pas eu une mise à jour bancale de nfs avant le crash, mais d'après /var/log/yum.log ce n'est pas le cas.

Je ne sais plus où chercher.
J'aurais vraiment besoin d'un coup de main.


Merci.
Encore un petit up.

Autant de réponses m'amène à me poser des questions :
- Ce n'est jamais arrivé à personne ?
- Il n'y a pas d'admin-sys ici ?
- Je me suis trompé de forum ?
- Je sens le gaz ?
- ...

Sérieusement quelle raison pourrait expliquer le fait que ce forum d'habitude si réactif, ai aussi peu de réponses à mon problème ?
Pourtant ma question est relativement étoffée avec des détails et tout et tout.

Sinon je suis toujours preneur de n'importe quel début de piste pour résoudre mon problème...


Merci.
euh on peut avoir le résultat d'un petit 'ls -Al /' ??
Bien sur.
# ls -Al /
total 236
-rwxrwxrwx   1 root root 34849 jun  2  2002 apache.jpg
-rw-r--r--   1 root root     0 jan 30 08:54 .autofsck
-rw-------   1 root root     7 jan 31 02:50 .bash_history
drwxr-xr-x   2 root root  4096 fév  6 04:15 bin
drwxr-xr-x   3 root root  4096 jan 30 08:18 boot
drwxr-xr-x   2 root root  4096 oct 10 00:15 .config
drwxr-xr-x  12 root root  4760 jan 31 02:51 dev
drwxr-xr-x 151 root root 12288 fév  7 04:13 etc
drwxr-xr-x   7 root root  4096 oct 25 01:25 home
drwxr-xr-x  15 root root  4096 fév  2 04:12 lib
drwx------   2 root root 16384 sep 30 18:27 lost+found
drwxr-xr-x   2 root root  4096 jan 31 02:51 media
drwxr-xr-x   2 root root     0 jan 31 02:51 misc
drwxr-xr-x  10 root root  4096 oct 29 11:55 mnt
-rw-r--r--   1 root root 25839 jan 31 02:51 murmur.log
drwxr-xr-x   2 root root     0 jan 31 02:51 net
drwxr-xr-x   3 root root  4096 sep 30 17:03 opt
dr-xr-xr-x 251 root root     0 jan 30 09:54 proc
drwxr-x---  36 root root  4096 fév  7 14:04 root
drwxr-xr-x   2 root root 12288 fév  6 11:07 sbin
drwxr-xr-x   6 root root     0 jan 30 09:54 selinux
drwxr-xr-x   4 root root  4096 sep 30 17:03 srv
drwxr-xr-x  12 root root     0 jan 30 09:54 sys
drwxr-xr-x   3 root root  4096 sep 19 23:26 tftpboot
drwxrwxrwt  34 root root  4096 fév  7 14:01 tmp
drwxr-xr-x  16 root root  4096 jan 25 12:45 usr
drwxr-xr-x  27 root root  4096 oct 15 23:13 var
Mais j'imagine que tu demande ça pour connaitre les droits appliqués aux partages (dont je change les noms évidemment ici).
Donc c'est ça :
drwxr-xr-x 5 master globgrp  4096 déc 12 18:07 /partage1
drwxr-xr-x 9 master globgrp  4096 jan 24 21:28 /partage2
drwxr-xr-x 16 master globgrp  4096 jan 25 21:32 /partage3
drwxrwxrwx 6 master globgrp  4096 fév  6 07:22 /partage4
drwxrwxrwx 9 master globgrp  4096 fév  6 00:57 /partage5
drwxrwxrwx 2 master globgrp  4096 fév  1 20:53 /partage6
(j'ai supprimé des partages récemment en pensant y trouver une solution, mais non).

Merci.
Nouveautés :

J'ai essayé de monter les partages en local (ce que je n'avais pas testé avant) :
# mount -t nfs 192.168.0.1:/partage5 ./test
mount: 192.168.0.1:/partage5 failed, reason given by server: Permission denied
# mount -t nfs 127.0.0.1:/partage5 ./test
mount: 127.0.0.1:/partage5 failed, reason given by server: Permission denied
Qu'est-ce que cela pourrait signifier ?

J'avais oublié de préciser aussi que mon pare-feu est désactivé (inutile dans ma configuration réseau actuelle).


Merci.
Ton ./test est bizarre. T'as essayé de mettre le chemin de destination complet ?
Et si tu corrigeais une ligne à ton /etc/exports :
/partage5 192.168.0.0/255.255.255.0(rw) 127.0.0.1(rw)
As-tu essayé avec les options no_root_squash ou all_squash, genre :
/partage5 192.168.0.0/255.255.255.0(rw,all_squash) 127.0.0.1(rw,no_root_squash)
Penses à réexporter tes partages (exportfs -rv)puis à redémarrer les services nfs et nfslock à chaque changement dans /etc/exports.
Et si tu changeais le proprio de tes partages en root pour voir ?
Voilà en vrac quelques idées.
Merci pour les idées.

J'ai essayé avec :
/partage5 192.168.0.0/255.255.255.0(rw) 127.0.0.1(rw)
--> Pas mieux.

Et pareil en utilisant no_root_squash et all_squash.

Évidement, j'utilise abondamment exportfs et le redémarrage de nfs et nfslock après chaque modification.

J'ai même créé un partage factice en root :
# mkdir /nfs_test
# touch /nfs_test/pouet
# echo "/nfs_test 192.168.0.0/255.255.255.0(rw,all_squash) 127.0.0.1(rw,no_root_squash) " >> /etc/exports
# exportfs -rv
exporting 192.168.0.0/255.255.255.0:/nfs_test
exporting 127.0.0.1:/nfs_test
# service nfs restart; service nfslock restart
Arrêt de NFS mountd :                                      [  OK  ]
Arrêt du démon NFS :                                       [  OK  ]
Arrêt des quotas NFS :                                     [  OK  ]
Arrêt des services NFS :                                   [  OK  ]
Démarrage des services NFS :                               [  OK  ]
Démarrage du quota NFS :                                   [  OK  ]
Démarrage du démon NFS :                                   [  OK  ]
Démarrage de NFS mountd :                                  [  OK  ]
Arrêt du verrouillage de NFS :                             [  OK  ]
Arrêt de NFS statd :                                       [  OK  ]
Démarrage de NFS statd :                                   [  OK  ]
# mount -t nfs 127.0.0.1:/nfs_test /root/test/
mount: 127.0.0.1:/nfs_test failed, reason given by server: Permission denied
# ls -l /root/test/
total 0
J'avoue que je commence à désespérer...

Merci.
Rien de mieux ?

Personne ne veut/peut m'aider ?

Tous les tests que j'ai tenté ont misérablement échoués...

Un coup de main me serait bien utile...

S'il vous plait...

Je n'en peux plus de cifs...


Merci.
Vire selinux et redemarre le service pour voir.
Force le anonuid et le anongid et surtout met bien all_squash pour chaque partage.
Le but c'est de faire croire que l'utilisateur distant qui veut accéder à ton partage soit vu par NFS comme l'utilisateur master:globgrp (si j'en crois tes droits locaux sur tes partages).
SELinux est déjà en mode permissive, faut-il que je le désactive complètement ?
Je croyais qu'il n'était plus gênant quand il était en permissif...

Sinon j'ai testé en forçant all_squash, anonuid et anongid mais le serveur s'obstine avec ses "Permission denied"...

J'ai aussi essayé no_auth_nlm mais pas mieux...

Ce qui m'étonne vraiment c'est que jusque là tout marchait à merveille...


Merci.
Bon, je ne comprends plus rien...

J'ai relancé le serveur (coupure d'électricité -_-) et le NFS fonctionne à nouveau...

Peut-être le nouveau noyau...

J'en perds mon shell et mon C (mon latin étant perdu depuis longtemps)...

Merci quand même pour votre aide.
19 jours plus tard
Miracle !!! :lol::lol::lol::lol::lol::lol::lol::lol::lol::lol::lol::lol::lol:

Les voix de l'informatique sont impénétrables :-D