2010-12-10 17:11:35 +0000 2010-12-10 17:11:35 +0000
29
29

Comment diagnostiquer les blocages et les gels d'ordinateurs ?

J'ai construit un ordinateur de bureau il y a quelques années avec les spécifications suivantes :

  • CPU: Intel Core 2 Quad Q9300 Yorkfield 2. 5GHz 6 MB L2 Cache LGA 775 95W Quad-Core Processor BX80580Q9300
  • Cartes mères: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Intel Motherboard
  • *Carte vidéo : * Deux EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 MB 128-bit GDDR3 PCI Express x16 SLI Supported Video Card
  • PSU: SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2. 3 / EPS12V V2.91 SLI Certified CrossFire Ready 80 PLUS Certified Active PFC Power Supply
  • Mémoire: Deux G.SKILL 4 GB (2 x 2 GB) 240-Pin DDR2 SDRAM DDR2 800 (PC2 6400) Dual Channel Kit Desktop Memory Modèle F2-6400CL5D-4GBPQ

Depuis sa création, la machine s'est verrouillée périodiquement, la régularité ayant varié au fil des années d'une fois par jour à une fois par mois. En règle générale, les verrouillages ont lieu une fois tous les quelques jours.

Par “verrouillage”, j'entends que mon ordinateur se bloque. L'écran se bloque, je ne peux plus bouger la souris. Les touches de mon clavier qui allument ou éteignent normalement les LED (comme le verrouillage des majuscules) n'allument ou n'éteignent plus les LED. S'il y avait de la musique au moment du verrouillage, le bruit continue à sortir des haut-parleurs, mais c'est juste la fréquence/note actuelle qui joue indéfiniment. Il n'y a pas de BSOD.

Lorsqu'un tel blocage se produit, je dois faire un redémarrage complet en éteignant l'ordinateur ou en appuyant sur le bouton de réinitialisation.

J'ai la version la plus récente des pilotes matériels NVIDIA, et je les mets à jour semi-régulièrement, mais cela n'a pas semblé m'aider. J'utilise actuellement Windows 7 x64, mais j'utilisais auparavant Windows Server 2003 x64 et j'avais les mêmes problèmes de verrouillage.

Je suppose que c'est lié d'une manière ou d'une autre au pilote vidéo ou à la carte mère, mais je ne sais pas comment diagnostiquer ce problème pour déterminer lequel des deux est le coupable.


Information supplémentaire concernant le refroidissement Concernant le refroidissement… Je n'ai pas installé de système de refroidissement après-vente, à part deux ventilateurs ordinaires que j'ai récupérés sur un vieil ordinateur. Le ventilateur situé au sommet de l'unité centrale est celui qui était livré avec l'ordinateur. L'un des deux ventilateurs récupérés que j'ai ajouté se trouve dans la tour inférieure du coin, pour essayer de créer un flux d'air d'avant en arrière. Le second ventilateur est dirigé directement vers les deux cartes vidéo.


Installation et relevés du SpeedFan Sur la suggestion du studiohack, j'ai installé SpeedFan , qui a fourni les relevés de température suivants :

  • GPU : 63C
  • GPU : 65C
  • Système : 76C
  • CPU : 64C
  • AUX : 36C
  • Core 0 : 78C
  • Core 1 : 76C
  • Core 2 : 79C
  • Core 3 : 79C

Mise à jour #3 : Un autre lockup :-(Et bien, j'ai eu un autre lockup la nuit dernière. :-( SpeedFan a rapporté que la température du CPU était de 38 C quand c'est arrivé, et il n'y a pas eu de pic de température avant le gel.

Une chose que je remarque, c'est que le gel semble plus probable si je regarde une vidéo. En fait, sur les 5 derniers gels survenus au cours du mois dernier, 4 d'entre eux ont eu lieu pendant que je regardais une vidéo sur Flickr. Pas nécessairement la même vidéo, mais une vidéo quand même. Je ne sais pas si c'est une simple coïncidence ou si cela signifie quelque chose. (Soit dit en passant, chaque soir avant de se coucher, ma fille de 2 ans s'assoit sur mes genoux et regarde quelques vidéos maison sur Flickr et, au cours du dernier mois, elle a appris la phrase “Euh oh, l'ordinateur est cassé”).


Mise à jour n°4 : Résultats des tests MemTest86 et 3DMark06 :

Selon les suggestions dans les commentaires, j'ai fait tourner le MemTest86 pendant la nuit et il a parcouru les 8 Go de mémoire 5 fois sans erreur. J'ai également effectué le test 3DMark06 sans problème (voir mes résultats sur http://3dmark.com/3dm06/15163549 ).

Alors… et maintenant ? :-)

D'autres suggestions sur ce qu'il faut vérifier ? Y a-t-il un moyen d'obtenir une trace de la pile ou quelque chose lorsque l'ordinateur se bloque comme ça ?

Résolution

Je n'ai jamais compris les problèmes particuliers, mais d'après les suggestions ici et ailleurs, je suppose que c'est un problème de carte mère. Quoi qu'il en soit, j'ai récemment mis mon système à niveau, en achetant une nouvelle carte mère, un nouveau bloc d'alimentation, un nouveau processeur et une nouvelle mémoire vive, et ce nouveau système a fonctionné à merveille ces dernières semaines. J'utilise les mêmes cartes graphiques que dans l'ancienne configuration, donc je pense qu'on peut dire sans risque de se tromper qu'elles n'étaient pas la cause du problème.

Réponses (13)

11
11
11
2010-12-10 18:07:32 +0000

À en juger par ce que vous avez affiché en matière de température et de refroidissement, votre ordinateur est en surchauffe et c'est la première chose à corriger. 64 C sur une charge au repos n'est pas acceptable et n'est pas vraiment préférable avec une charge complète. Je suis un peu paranoïaque et je flippe dès que mon processeur dépasse 35, mais 50 devrait être votre maximum sur une charge.

Investissez dans une bonne solution de refroidissement pour votre système. Un système assez décent ne vous rapportera que 20 à 30 dollars. Si vous cherchez de l'aide sur ce qu'il faut rechercher, jetez un coup d'œil à cette revue Tom’s Hardware des solutions de refroidissement à moins de 40 dollars.

Vous pouvez aussi activer votre écran bleu de la mort (aussi terrible que cela puisse paraître) pour pouvoir déboguer les verrouillages problématiques. Ceci est fait par :

–> en faisant un clic droit sur “Ordinateur” dans le menu de démarrage

–> Sélectionnez “Propriétés”

–> Sélectionnez “Paramètres système avancés”

–> Sélectionnez l'onglet “Avancé”

–> Sélectionnez “Démarrage et récupération”

–> Assurez-vous que “Ecrire un événement dans le journal système” est activé.

Parfois, il existe des nettoyeurs qui arrêtent automatiquement l'enregistrement des BSOD (Advanced System Care) et vous pourriez vouloir chercher à empêcher cela. Une fois que vous avez vérifié ce problème, je vous suggère d'utiliser NirSoft’s BlueScreenView pour voir les détails du crash/des problèmes liés au débogage.

Enfin, je vérifierais et revérifierais votre PC et Toutes vos connexions. En fait, j'ai eu une situation similaire et j'ai découvert qu'un des câbles USB de la carte mère interne était mal connecté, ce qui a causé des problèmes.

Mise à jour

J'ai rassemblé quelques questions pour le dépannage général et le diagnostic des pannes ou des blocages. Veuillez vous y référer également, car elles peuvent vous aider dans votre recherche du problème.

5
5
5
2011-05-01 01:06:33 +0000

Les gels du système (où vous ne pouvez pas utiliser les touches de raccourci comme CTRL+ALT+DEL) sont causés par l'accrochage des pilotes, donc vous devrez soit remplacer le périphérique, soit mettre à jour le pilote. Le dépannage peut être effectué : Téléchargez la configuration de Windows Performance Analysis Tools pour votre version de Windows. 2. Installez le logiciel sur votre système. 3. Ouvrez une invite de commande en tant qu'administrateur, et copiez-collez la commande suivante :

  1. Appuyez sur ENTER une fois pour lancer la commande, vous devez maintenant attendre que votre système se bloque.
    Vous pouvez faire ce que vous voulez. S'il vous plaît, pas d'activités lourdes comme les jeux ou les choses privées…

  2. **Juste après l'arrêt de votre système, allez à la console et appuyez sur ENTER.

  3. Après un certain temps d'attente, un fichier de log myTrace.etl sera produit, compressez-le dans un fichier zip.

  4. Mettez cette version compressée du fichier quelque part en ligne (peut-être 2partagé).

  5. Partagez le lien ici, je vais essayer de trouver et de vous montrer la cause de votre problème.

4
4
4
2010-12-10 18:34:50 +0000

Si l'ordinateur a été construit il y a quelques années, un nettoyage en profondeur serait une bonne solution. Enlevez toute la poussière des ventilateurs, des dissipateurs de chaleur, des planches et des coins. Les parties les plus importantes sont les dissipateurs thermiques et les ventilateurs du processeur. L'air comprimé est bon à cet effet, mais un aspirateur peut être plus sain à long terme. En procédant de la sorte, on réduit considérablement la ventilation et on diminue la chaleur.

La chaleur ne devrait pas être un problème avec un nouvel ordinateur, à moins qu'il ne soit conservé dans une pièce (ou armoire) très chaude et mal ventilée. Les fabricants d'unités centrales prévoient que leurs produits seront utilisés dans des conditions variables et même le dissipateur thermique et le ventilateur de série sont conçus pour permettre au produit de fonctionner dans la plupart des circonstances.

Comme vous avez eu des problèmes depuis que vous l'avez construit, j'ai tendance à pencher vers une défaillance d'un des composants. D'après les problèmes décrits, je penche pour une carte mère défectueuse, juste sur la base de ma propre expérience.

1
1
1
2010-12-16 05:20:37 +0000

Je soupçonnerais d'abord l'alimentation électrique. Essayez de la remplacer par une unité de puissance supérieure et voyez si les choses deviennent plus stables. Il se peut que les rails de tension chutent un peu sous la charge, ce qui explique pourquoi on le voit plus souvent en lecture vidéo.

Pour tester cette théorie, vous aurez besoin d'un voltmètre précis et de quelques connaissances de base en électricité, mais vu l'utilité d'une alimentation de rechange, je serais tenté de la remplacer et de voir.

1
1
1
2010-12-10 17:52:12 +0000

Je suis passé par ce processus l'année dernière.

La première chose à faire est de déterminer s'il s'agit de matériel ou de logiciel. Cela signifie qu'il faut utiliser deux systèmes d'exploitation différents. Dans mon cas, mon installation principale était linux, et il se figeait au hasard - comme vous le décrivez. Parfois toutes les 5 minutes, d'autres fois, cela durait plusieurs jours.

J'ai fini par y installer Windows, qui a connu les mêmes problèmes. Quand j'ai redémarré, et que ça s'est bloqué pendant le post, j'ai rendu le MB et je n'ai plus eu de problème depuis.

Dans le cadre du processus de débogage, j'ai également essayé différents pilotes vidéo - les pilotes génériques, non accélérés, ne se bloquaient pas aussi souvent. J'ai également installé des utilitaires de surveillance de la température et j'ai examiné les journaux pour voir s'il y avait quelque chose de courant avant le gel. Comme il s'agissait de matériel, et apparemment aléatoire, je n'ai jamais trouvé le moyen de causer le problème de manière fiable, mais cela devrait être votre objectif.

1
1
1
2013-06-28 00:28:20 +0000

Probablement un problème de carte vidéo, a remplacé beaucoup de 8600GTs (G84). C'était un gros flop du côté de NVIDIA, surtout dans la série des portables (8x00M).

La température du GPU de 65°C semble trop élevée s'il était au repos.

Faites un test de burn-in de cinq minutes avec Furmark ; s'il s'accroche - la carte vidéo est coupable.

Problème https://en.wikipedia.org/wiki/GeForce_8_Series#Problèmes

Furmar http://www.ozone3d.net/benchmarks/fur/

1
1
1
2010-12-17 18:10:40 +0000

D'après votre mise à jour n°3 et un blocage à 38C, la chaleur du mobo/cpu n'est pas la cause première. En supposant que seules les cartes vidéo ont été ajoutées et qu'aucune autre carte supplémentaire n'a été ajoutée (j'ai déjà eu un bon coup de main !), je fais ces recommandations dans l'ordre de ce que je pense être la cause la plus probable :

  • Remplacez les cartes vidéo par une autre carte connue pour être bonne afin de résoudre le problème. Achetez-en une, empruntez en une autre, peu importe. Si cela ne résout pas le problème, passez à la balle suivante.

  • Vous avez mentionné la mise à jour du pilote de la carte vidéo, mais rien d'autre. Assurez-vous que tous les pilotes possibles sont bien à jour. J'ai fait faire cela à une carte vidéo une fois et tout ce que j'avais à faire était de mettre à jour le pilote.

  • Si vous n'avez effectivement pas d'autres cartes d'extension (si vous en avez, retirez-les maintenant), désactivez tous les équipements optionnels dans la bios. Je veux dire par là votre son embarqué, lan et retirez tous les éléments usb. Ensuite, voyez si cela disparaît.

Je vais prendre un risque et dire que je suis sûr à 90% que ça va être réparé en faisant la première balle.

0
0
0
2010-12-21 23:15:52 +0000

D'après votre description, il semble que le problème se situe sur la carte mère. Il se peut que votre northbridge ait un problème diagramme de la carte mère ). Ce que je vérifierais également, c'est la configuration du BIOS pour le générateur d'horloge et la vitesse du CPU. (Je ne connais pas votre carte mère, mais elle a peut-être des fonctions d'overclocking.) Peut-être que les problèmes surviennent toujours quand il y a une forte charge et que le CPU essaie de fonctionner plus vite.

0
0
0
2014-06-01 12:36:52 +0000

Je vais prendre l'avion et suggérer que le coupable est un condensateur grillé qui est incapable de fournir une charge électrique pour lisser les erreurs de fluctuation du courant. Je suppose qu'une fluctuation assez importante fera geler le système mais restera en marche.

D'après mon expérience passée, je mettrais le blâme sur un condensateur grillé dans votre unité d'alimentation (PSU), mais je suggérerais de vérifier tous les condensateurs de votre ordinateur, dans et autour de la carte mère, en particulier autour du pont nord. Si vous avez fait de l'overclocking, il est probable que la carte mère ait été grillée. Bien qu'il soit peu probable que des condensateurs aient grillé sous les dissipateurs thermiques, cela peut également être une possibilité.

Si vous ne trouvez rien de grillé sur la carte mère, je garantirais votre bloc d'alimentation car certains ont une longue garantie - la mienne est de 7 ans - alors ne l'ouvrez pas pour l'inspecter à moins de savoir que vous êtes hors garantie. Une alimentation décente peut être réparée avec les bons outils s'il ne s'agit que d'un condensateur.

0
0
0
2010-12-17 19:40:51 +0000

Il semble que le matériel ou les pilotes soient en cause ici. Mais je pencherais pour le matériel puisque vous avez deux OS différents sur l'ordinateur.

En partant de cette hypothèse, commencez par les choses les plus simples. J'ai vu que vous avez lancé Memtest et même si c'est très bien, cela n'exclut pas forcément la mémoire comme étant suspecte. Essayez donc la solution suivante : retirez toutes les clés de mémoire sauf une et voyez si vous obtenez un verrouillage. Si elle fonctionne bien pendant un certain temps, ajoutez-en une autre et ainsi de suite jusqu'à ce que vous ayez à nouveau le problème. Si elle reste bloquée, essayez une autre clé dans un autre emplacement. Si elle se bloque toujours, passez à d'autres composants matériels.

Certaines personnes ont mentionné avoir essayé de remplacer leur carte vidéo et je suis d'accord. Achetez une carte bon marché ou empruntez en une à un ami et essayez-la. Faites de même avec une alimentation électrique. Votre bloc d'alimentation semble correct, mais il se détériore et il vaut la peine de l'échanger pour voir si cela résout votre problème.

Si tout cela tombe en panne, je dirais qu'il faut remplacer la carte mère. D'autant plus que vous avez dit que vous avez le problème depuis que vous avez eu l'ordinateur pour la première fois.

Une dernière chose à vérifier juste pour être sûr. Faites un test chkdsk/SMART sur vos disques durs. Ils sont probablement corrects mais valent quand même la peine d'être vérifiés.

-1
-1
-1
2013-06-27 22:13:27 +0000

J'ai géré de nombreuses situations de ce genre, et le problème le plus courant que j'ai rencontré avec les fermetures ou la congélation était la pâte pour dissipateur thermique. Votre ventilateur peut faire tout ce qu'il veut, mais si un espace d'air entre le dissipateur thermique et l'unité centrale est autorisé, le dissipateur thermique ne refroidira pas l'air entre les deux. Si cette pâte est trop sèche ou à des endroits où elle n'est pas censée l'être ou pas assez ou ne permettant pas une connexion thermique conductrice entre le processeur et le dissipateur, elle se bloque parce qu'elle met en marche un circuit de protection du processeur dans le processeur lui-même. Faites-le cinq ou six fois jusqu'à ce que ce problème disparaisse. Il finira par disparaître, ou nous jetterons votre processeur et vous en enverrons un nouveau sans même vous le dire. Nous ne voulons pas remplacer votre processeur. Nous le faisons dix fois avant de le faire.

-1
-1
-1
2013-05-11 20:56:26 +0000

Il peut s'agir d'un problème lié au conducteur - lorsqu'il est sur le point de traiter votre vidéo, il est très probable qu'il se bloque (il peut aussi faire un bruit bizarre) parce que votre écran est gelé - le processeur peut encore fonctionner - en fait, tout pourrait fonctionner - vous pourriez simplement ne pas être en mesure de voir les résultats de vos manipulations souris/clavier, parce qu'une fois que votre conducteur se bloque, il n'y a plus rien pour gérer les représentations visuelles des entrées.

Solution possible : Mettez à jour le pilote, s'il a commencé lorsque vous avez mis à jour un pilote, revenez au pilote précédent, si votre carte graphique est ancienne - essayez d'en acheter une nouvelle - parfois, lorsque d'anciennes cartes sont patchées avec de nouveaux pilotes, elles peuvent être boguées.

La surchauffe n'est vraiment un problème que lorsque votre carte fonctionne à 110% de sa puissance de fabrication ; elle peut provoquer un plantage, mais là encore, SI seulement vous l'avez fortement boostée.

-2
-2
-2
2010-12-21 08:26:27 +0000

Je suis d'accord avec Nori sur le fait de faire un test SMART. Utilisez (l'édition gratuite) HDTune pour copier les attributs SMART. Faites également un scan d'erreurs. Un seul secteur endommagé peut causer les problèmes que vous décrivez. Une surchauffe provoque généralement des BSOD et un redémarrage ou un arrêt forcé. Comme il s'agit d'un “gel”, cela ressemble plus à un problème de disque dur (même si de mauvais disques durs peuvent également causer des BSOD).

Vérifiez l'état SMART et notez les données du “Comptage des heures de mise sous tension”. Si le comptage ne s'incrémente pas après quelques heures, les attributs SMART sont probablement gelés et vous donnent un faux statut “OK”.

Vérifiez également les journaux d'événements de votre système et de vos applications Windows pour détecter les erreurs.

(panneau de contrôle -> Outils administratifs -> Gestion de l'ordinateur -> Visualiseur d'événements)

Assurez-vous d'avoir toutes vos données importantes sauvegardées.