Quelles sont les causes les plus courantes de défaillance du processeur?
Existe-t-il des états intermédiaires entre un processeur fonctionnant parfaitement et un processeur mort?
Quelles sont les causes les plus courantes de défaillance du processeur?
Existe-t-il des états intermédiaires entre un processeur fonctionnant parfaitement et un processeur mort?
Réponses:
Il peut ne nécessiter qu'un seul transistor pour tomber en panne avant qu'un CPU cesse de fonctionner - et comme il y a des millions de transistors dans un CPU moderne, vous pourriez vous demander pourquoi cela ne se produit pas plus souvent.
Et, selon l'emplacement du transistor dans le CPU, l'effet peut être différent, mais je ne pense pas que nous puissions nous attendre à une baisse graduelle des performances: une défaillance de l'ALU peut ne pas être remarquée jusqu'à ce qu'une instruction particulière soit exécutée, et certaines instructions seraient exécutées moins fréquemment.
Les CPUS meurent donc soudainement lorsqu'un transistor tombe en panne. Cela peut être dû à des défauts de la puce informatique trop sollicités, le temps peut donc être un facteur.
Une chaleur excessive peut provoquer la diffusion et la modification des paramètres de fonctionnement des impuretés infimes du silicium qui forment les transistors. La chaleur est une conséquence inévitable du simple fonctionnement des transistors, de sorte qu'un manque de refroidissement peut éventuellement provoquer des pannes.
D'autres raisons peuvent inclure une défaillance des interconnexions dans le boîtier de la puce CPU, mais les fabricants recherchent toujours des méthodes de conditionnement améliorées avec des interconnexions plus fiables et une meilleure dissipation thermique.
Honnêtement, il n'y a pas de cause commune de défaillance du processeur ... au moins par rapport aux autres parties de vos ordinateurs. Le CPU est généralement la partie la plus fiable d'un ordinateur. Ils n'échouent pas souvent.
Au lieu de cela, les choses que vous devez surveiller pour échouer sont celles avec des pièces mobiles: disques durs traditionnels, lecteurs optiques et ventilateurs. Plus récemment, nous devons également ajouter des SSD à cette liste, même s'ils n'ont pas de pièces mobiles. Les condensateurs ont également une durée de vie limitée, et les blocs d'alimentation et les cartes mères, qui utilisent tous les deux des condensateurs, peuvent donc être suspects. Parfois, vous aurez également un mauvais bâton de RAM, mais je ne suis jamais vraiment sûr qu'ils vont mal.
Et maintenant, enfin, seulement après avoir regardé presque tout le reste dans un ordinateur, nous arrivons au CPU. Même lorsqu'une panne se produit, c'est généralement parce que le ventilateur de refroidissement (pièces mobiles à nouveau) s'est mal tourné en premier et que le processeur a surchauffé en conséquence.
Parmi les autres causes mentionnées ici, il peut également y avoir une connexion interne rompue. Plusieurs techniques différentes sont utilisées pour lier les fils internes de la "puce" aux fils externes du boîtier, et tous ceux-ci sont susceptibles de tomber en panne.
Ce type de défaillance pourrait être le résultat d'une surchauffe, et la probabilité de la défaillance augmente avec les "cycles thermiques", même en l'absence de surchauffe. L'échec peut commencer par intermittence (bien que cela se traduise généralement par un crash brutal quand il se produit), mais devenir de plus en plus persistant au fur et à mesure que le système est cyclé.
Ce type d'échec imite les échecs observés à partir de mauvaises connexions paquet / socket, etc.
[Ajouté:] Et je remarque que les "moustaches" n'ont pas été mentionnées. Un gros problème avec les circuits intégrés et les très petits circuits imprimés est les "moustaches" de métal qui se développent hors du câblage plaqué et se court entre les "fils" adjacents. Cela est particulièrement problématique lorsque vous retirez tout le plomb (voir «RoHS»), car du plomb est généralement ajouté aux alliages de fil pour empêcher le grillage. Bien entendu, ce problème s'aggrave avec l'augmentation de la température.
D'après mon expérience, la chaleur. Comment Pourquoi? Trop de pâte thermique! Beaucoup (la plupart?) Savent qu'ils ont besoin de pâte thermique, mais ils ne réalisent peut-être pas le peu qu'ils devraient utiliser.
La règle est d'utiliser autant que la taille d'un grain de riz non cuit, croyez-le ou non.
Bien que la pâte soit environ 10 fois meilleure que l'air à la chaleur conductrice, le cuivre du dissipateur thermique est 10 fois meilleur que la pâte, vous devez donc la rapprocher le plus possible du CPU. La pâte est vraiment uniquement pour remplir les fissures TRÈS PETITES afin que l'air n'y soit pas.
Un article intéressant sur le sujet de «Transistor Aging» est paru dans le magazine Spectrum de l'IEEE ( http://spectrum.ieee.org/semiconductors/processors/transistor-aging ). Il énumère plusieurs mécanismes de base qui peuvent conduire à la défaillance d'un transistor individuel, ce qui peut en effet réduire la puissance de calcul de la puce entière à celle d'une pomme de terre (ou d'une brique).