J'ai eu quelques erreurs btrfs et ext4. Après avoir décidé de tester ma RAM, j'ai eu les erreurs de répétition suivantes avec memtester
. J'obtiens toujours des erreurs similaires après un peu de fonctionnement du memtester
. Habituellement en une heure, mais cela prenait 4-5 heures en une seule fois.
La RAM de mon ordinateur est soudée. J'ai un emplacement vide supplémentaire. Il n'y a aucun paramètre dans le BIOS pour désactiver la RAM intégrée.
J'ai couru:
- Memtest86 + pour 8 passes (~ 8 heures)
- MemTest86 pour 18 passes (~ 9 heures)
memtester
etstressapptest
sur Fedora 27 par défaut, installé sur une clé USB (~ 10 heures)memtester
etstressapptest
sur Ubuntu 17.10 Live par défaut (~ 2 heures)memtester
etstressapptest
sur Ubuntu 17.10 sur clé USB (~ 8 heures)# debsums --changed
le seul fichier modifié était une image d'un thème.
Ils n'ont imprimé aucune erreur.
J'utilise Ubuntu 17.10 (mis à jour à partir de 17.04) avec le noyau par défaut. Le noyau n'est pas corrompu. C'est un ordinateur portable ASUS avec Intel Haswell i3.
- Également testé avec Linux 4.14.13 et 4.15.0-rc3, rc4, mainline.
- Également testé avec un package de microcode Intel purgé.
L'erreur est reproductible, Nouveau est désactivé ou activé, aucun pilote binaire nvidia n'est chargé.
Liste noire des modules suivants: mtd
intel_spi_platform
intel_spi
car ils ne se chargent pas lors de l'installation par défaut de Fedora 27 et ils semblent bloquer certains ordinateurs portables Lenova. Les erreurs ne se sont pas arrêtées.
uname -a
sortie
Linux hostname 4.13.0-19-generic #22-Ubuntu SMP Mon Dec 4 11:58:07 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
# lsmod
sortie
https://paste.ubuntu.com/26222245/
# lsmod
Sortie de Fedora 27
https://paste.ubuntu.com/26226473/
Situation actuelle
J'ai placé mon disque dur dans un ordinateur portable (ordinateur portable de secours) que je connais bien et j'ai effectué les tests là-bas. J'ai eu les erreurs. Maintenant, je suis presque sûr qu'il s'agit d'un problème logiciel. Je n'ai jamais pu déclencher les erreurs sur mon ordinateur portable avec un Ubuntu frais ni avec un Fedora essayant de nombreuses heures.
Que devrais-je faire?
Un échantillon des erreurs:
Loop 6:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : ok
Bit Flip : testing 262
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94000.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94008.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94010.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94018.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94020.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94028.
FAILURE: 0x00000000 != 0xfffffffeffffffff at offset 0x0ef94030.
FAILURE: 0x00000000 != 0x100000000 at offset 0x0ef94038.
Walking Ones : ok
Walking Zeroes : ok
8-bit Writes : ok
16-bit Writes : ok
Une erreur similaire avec les deux emplacements RAM est pleine:
Loop 1:
Stuck Address : ok
Random Value : ok
Compare XOR : ok
Compare SUB : ok
Compare MUL : ok
Compare DIV : ok
Compare OR : ok
Compare AND : ok
Sequential Increment: ok
Solid Bits : ok
Block Sequential : ok
Checkerboard : ok
Bit Spread : testing 4
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80000.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80008.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80010.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80018.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80020.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80028.
FAILURE: 0x00000000 != 0x00000050 at offset 0x7da80030.
FAILURE: 0x00000000 != 0xffffffffffffffaf at offset 0x7da80038.
Bit Flip : setting 141
Une erreur de stressapptest
:
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e000(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e008(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e010(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e018(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e020(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e028(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e030(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Report Error: miscompare : DIMM Unknown : 1 : 157s
Hardware Error: miscompare on CPU 2(0x2) at 0x7fcc0726e038(0xb0d18:DIMM Unknown): read:0x0000000000000000, reread:0x0000000000000000 expected:0x4a4a4a4a4a4a4a4a
Je soupçonne que la configuration d'Ubuntu combinée avec le matériel de mon ordinateur portable est à blâmer pour ces erreurs. Presque à chaque fois en paquets de huit.
Informations sans importance et vaguement liées ci-dessous
À propos des erreurs btrfs; J'utilisais le 17.04. J'ai demandé dans l'irc de btrfs. On m'a dit que cela pourrait être une erreur matérielle ou en quelque sorte une erreur de gestion de la mémoire. Une partie de la page de métadonnées des btrfs s'est remplie de zéros, comme je l'ai fait maintenant. J'ai exécuté memtester juste quelques passes, je suis passé à ext4 et j'ai mis le blâme sur le pilote binaire nvidia.
Les commandes et leurs paramètres que j'utilise:
# stressapptest -M 10000 -s 1800
10000 est la mémoire disponible que je peux tester. Je l'obtiens via free -m
-s` est en secondes.
# memtester 4096
Le processeur de l'ordinateur portable a 2 cœurs, donc je démarre généralement deux instances. 4096 est la moitié de la mémoire actuellement disponible viafree -m
memtest86+
partir de n'importe quel LiveCD d'installation d'Ubuntu.