J'utilise les tests Debian sans aucun problème depuis environ 6 ans (je ne fais que les mettre à jour régulièrement), mais récemment, il a commencé à montrer un comportement aléatoire qui peut être résumé comme "de faibles performances d'E / S qui persistent jusqu'au redémarrage".
Le problème est que, soudainement, toutes les lectures et écritures sur disque ralentissent à ~ 5 Mo / s, ce qui se traduit par une lecture et des écritures continues. Étant donné que le taux est si bas, les disques ne sont pas sollicités ou stressés mécaniquement, mais tout ralentit jusqu'à ce que je redémarre.
Le sous-système d'E / S de l'ordinateur se compose d'un SSD OCZ Vertex 3 et de deux disques durs WD Caviar Black. Le SSD contient une partie en lecture lourde du système d'exploitation et une partition sur le disque dur contient le reste.
Pour diagnostiquer le problème, j'ai essayé sans succès ce qui suit:
top
ne montre aucune activité incontrôlée ni dans l'utilisation du processeur ni des E / S.hdparm
renvoie les notes de performances normales des disques (je n'ai vérifié-t
que cependant).smartctl
n'affiche aucun problème de performances sur les disques. De longs tests ont montré que les disques sont comme neufs.
Le système a un chipset Z77, 16 Go de RAM et un processeur Intel i7 3770K et les statistiques ne montrent aucun signe de saturation en RAM, en E / S ou en processeur, mais je n'ai pas l'habitude de déboguer des problèmes comme celui-ci (en particulier dans l'espace du noyau). Toute aide serait appréciée.
Mise à jour 1:
- J'ai exécuté (forcé) fsck sur chaque partition par mesure de précaution. Tous les FS sont propres.
- Par ailleurs, j'ai trouvé une mise à niveau du BIOS qui est sortie il y a un mois et l'ai appliquée.
- Aucune partition n'est remplie à plus de 50%.
Mise à jour 2:
Le problème ne refait pas surface pendant deux jours. Soit fsck
la mise à jour du BIOS a nettoyé certains obstructions du système. Je surveille toujours le problème et je terminerai la question par une réponse post mortem.
Mise à jour 3:
Le problème a refait surface et j'ai creusé un peu plus. Veuillez voir la réponse.
noop
.
free
)
iowait
etc. si vous collectez des données SAR. J'activerais sysstat
s'il n'est pas déjà en cours d'exécution. Vous pouvez vérifier que la sar -A
plupart des plates-formes ont des intervalles d'échantillonnage de dix minutes.
atop
vous dirait à quel point les disques sont occupés (comme lorsque vous recherchez tout le temps).