Messages : 434
Sujets : 1
Inscription : Jan 2018
C'est en cours d’investigation ... c'est étrange, ça ne semble toucher que les GPU Ellesmere (RX570 et similaires).
Ca semble arriver très souvent sur les 13415.
P.S : le core qui bouffe un CPU, c'est pas un bug non plus, c'est certaines p1341x qui ont un comportement inexpliqué et qui tournent plus lentement. C'est aussi en cours d'investigation ...
Messages : 967
Sujets : 53
Inscription : Jan 2018
GPU "Baffin", en ce qui me concerne (RX460)
Et c'était bien des 13415.
Pour le CPU, pas nécessairement un bug ("la corrélation n'implique pas la causalité", et tout) mais les qq fois où j'ai eu cette charge cpu causée par le core, j'ai eu le crash ensuite (sans rien faire, ou au moment de mettre en pause le client, comme tout a l'heure)
Messages : 434
Sujets : 1
Inscription : Jan 2018
RX 460/ RX 470/ RX 570 ... c'est très similaire tout ça ...
Messages : 145
Sujets : 7
Inscription : May 2020
06-07-2020 18:00:23
(Modification du message : 06-07-2020 18:01:21 par Charentais49.)
Je n'avais pas vu ce fil, je signale donc un problème avec la WU 13416 sur une GTX 1660
12:19:50:WU01:FS01:0x22:Folding@home Core Shutdown: BAD_WORK_UNIT
12:19:51:WARNING:WU01:FS01:FahCore returned: BAD_WORK_UNIT (114 = 0x72)
12:19:51:WU01:FS01:Sending unit results: id:01 state:SEND error:FAULTY project:13416 run:719 clone:26 gen:0 core:0x22 unit:0x0000000012bc7d9a5f02af9c56951f0e
toTOW m'a expliqué sur Discord que ce genre de problème peut arriver avec les projets 134XX qui, même s'ils ne plantent pas son plus lents (rapportent moins de points).
Merci à lui pour ces explications, je les remets ici pour qu'elles puissent servir à tout le monde.
Messages : 967
Sujets : 53
Inscription : Jan 2018
06-07-2020 22:53:32
(Modification du message : 06-07-2020 22:55:26 par JWhy.)
Merci Charentais
A noter que ce n'est pas exactement le même problème (si j'ai tout compris)
Dans notre cas (Mikounet et moi), le core 22 plante avec un message d'erreur windows qui s'affiche dans une boite de dialogue et il faut relancer le client.
Il y a aussi dans les logs le texte du 1er message de Mikounet
Dans ton cas, la WU est détectée "mauvaise" et est renvoyée (sans crasher le client)
Donc il semble qu'on ait 3 comportements différents avec ces 134xx :
- le plantage "pur & dur" du core (Mikounet et moi), potentiellement qu'avec les GPU AMD RX 4xx et RX 5xx (?)
- la détection d'une "BAD WU", mais qui ne fait pas planter le core (ton cas)
- des "lenteurs" dans les calculs (cas mentionné par toTOW)
Que du bonheur, en somme
Messages : 262
Sujets : 4
Inscription : Oct 2019
Les "lenteurs" sont bien présentes et semblent ne pas être limitées aux GPUs AMD : j'ai deux 13416 [plus précisément les variantes (1088, 71, 0) et (991, 87, 0)] sur mes NVidia Quadro P5000 en ce moment, et le PPD est tombé à environ un tiers de la normale (215-250kPPD/GPU alors qu'en général on est plutôt sur du 600-750kPPD/GPU pour ces cartes).
Ô joie.
"Je sers la science et c'est ma grande joie." -Disciple-
Messages : 145
Sujets : 7
Inscription : May 2020
07-07-2020 06:34:02
(Modification du message : 07-07-2020 18:16:54 par Charentais49.)
Même chose pour moi, les deux 13416, celle qui a planté et celle qui est allées jusqu'au bout ensuite hier m'annonçaient un "Estimated PPD" de moins de la moitié de ce que j'ai habituellement.
La 11744 qui tourne actuellement est un peu mieux, mais quand même sensiblement inférieure au niveau habituel.
Messages : 145
Sujets : 7
Inscription : May 2020
Je ne sais pas si cela peut être utile, mais j'ai de nouveau une 13416 qui affiche un Estimated PPD de moitié inférieur a ce que j'ai habituellement.
Si je regarde le GPU Load avec GPU-Z, j'oscille entre 78 et 80% alors que c'est 96 à 98 % avec les autres projets. Cela a un effet bénéfique sur la température du GPU qui est 10° plus basse que quand il est à à pleine charge tandis que les ventilateurs de la carte graphique tournent plus lentement.
Voyons le bons côté des choses, j'économise de l'électricité
et il y a moins de bruit dans la pièce
Messages : 319
Sujets : 11
Inscription : Dec 2019
09-07-2020 16:41:14
(Modification du message : 09-07-2020 16:42:02 par GtevoOne82.)
Messages : 434
Sujets : 1
Inscription : Jan 2018
Les variations de performances sur les p134xx sont normales ... les points ont d'ailleurs été augmenter pour compenser les WUs plus lentes ...
J'ai redemandé s'il y avait une piste pour le crash étrange sur AMD ... vous aurez peut être des truc à lancer pour avoir plus d'infos sur le problème ...