Plier dans les nuages avec vast.ai
#21
Bonjour, 

J'ai mis à jour le guide  (chapitre 3 de la partie 2) pour documenter l'utilisation d'un nouveau template :
- s'appuyant sur une nouvelle image Docker que j'ai créée from scratch à partir d'un Ubuntu 24.04 "nu" (on passe de l'image Vast de 12 Go à moins de 50 Mo, donc nettement plus rapide à déployer)
- intégrant les modifications du script de lancement de Firedfly mentionnées précédemment (gestion des caractères interdits dans le nom du "compte" F@h v8, paramètres pour positionner la cause, l'activation des projets Beta ou encore le positionnement d'une PK) 
- déportant l'intégration des runtimes CUDA adaptés à l'instance dans le script  de lancement

Testé intensivement (merci encore, EmpireHell) toute cette semaine, et fonctionnel* sur CUDA 12.8/12.9/13.0 pour toutes familles (30xx/40xx/50xx) & modèles (xx60/xx70/xx80/xx90) de RTX.

Pour ceux que ça intéresse : script de lancement et Dockerfile dispo dans mon GitHub, image Docker dans mon DockerHub

Je rappelle également que, pour les plus experts, seuls 3 "Extra filters" sont réellement indispensables (cf. guide). Les autres peuvent être supprimés ou modifiés si vous souhaitez voir plus d'instances, mais à vous de faire "les bons choix" dans la page affichant les résultats.

(*) "fonctionnel" ... jusqu'à ce que ça ne le soit plus: modif chez Vast, maj de drivers/runtime nvidia, etc... 😉
Répondre
#22
Hello.

Merci JWhy, ça tourne parfaitement.

Nice job.
[Image: sigimage.php?u=1278758&c1=FFFFFF&c2=0000...&c5=FFFFFF] [Image: sigimage.php?u=837663&bg=1]
Répondre
#23
(25-08-2025 19:41:37)JWhy a écrit : A l'inverse, si vous voyez ce type d'affichage, alors 100% du système hôte sera dédié à votre instance :
[Image: dossier_gpu-cloud-xx_shared-02.png]

Ce critère gpu_frac positionné à 1 permet donc de ne trouver que les instances hébergées sur une machine qui vous est 100% dédiée.
Alors ça c'est pas forcément vrai ! Angry

Je me suis retrouvé plusieurs fois avec une instance montrant le même nombre de CPU alloués que le nombre de CPU de la machine qui avait de la charge CPU parasite, surtout avec beaucoup de CPUs ... il faut bien vérifier lorsqu'on démarre se type d'instance.
Répondre
#24
Faut pas s'énerver comme ça 😉

Il y a quand plus de risque d'avoir une instance moins performante avec 1/8 des CPU affichés de la machine , qu'avec 100% pour ton instance ... même si -certes- il peut rester des cas de parasitage, comme tu le dis.

Et donc preneur de la méthode que tu préconises pour 
Citation :bien vérifier lorsqu'on démarre se type d'instance.
🙏
Répondre
#25
Tu te connectes en Terminal Jupyter ou SSH, tu fais un top et tu vérifie que ton load average est à 0 (ou proche de 0).
Répondre
#26
Il y a eu qq retours sur le discord, mais globalement ça marche comme vous voulez ?
des trucs à améliorer ?

Pour info, suite à un échange avec EmpireHell, j'avais fait un script (dispo sur le github) qui affiche dans la log vast s'il y a un pb d'heure dans le container.
c'est pas forcément indispensable, les logs standard disent assez clairement quand il y a un pb (via les mises à jour apt qui ne se font pas), mais ce script donne plus explicitement qu'il y a un pb de synchro horaire.

si ça vous intéresse de l'utiliser, il faut juste ajouter ces 3 lignes au début  de la zone texte "Bash commands that are invoked whenever your instance starts, see FAQ/Docs for details."
Code :
curl https://raw.githubusercontent.com/JWhyFR/fah-v8/main/diff_ntp.sh -o diff_ntp.sh
chmod +x diff_ntp.sh
./diff_ntp.sh

mais vraiment pas indispensable Wink

Exemple de "instance log" , quand ça se passe bien (l'API publique renvoie souvent des erreurs, on se croirait avec les API EDF pour l'EJP Big Grin ) 
Code :
=======================================
Vérification de l'heure système...
Heure système UTC : 1758828170
API publique : Impossible de récupérer l'heure.
Serveur NTP : synchronisé (écart de 0s).
=======================================
Répondre
#27
Mise à jour du script fah-onstart.sh (vous n'avez rien à changer de votre coté) , pour qu'il récupère la derniere version disponible (la 8.5.5, à ce jour)
Répondre
#28
Hello, est-ce que sur vast il est possible de plier pour un budget précis chaque mois ? Donc un nombre d'heure spécifique ? Car 100% du temps pour une 5090 c'est 130 € par mois !
[Image: sigimage.php?u=1339323]
Sciences - Partage - Entraide  Super
Répondre
#29
Dans ce cas le plus simple au lieu de prendre une carte graphique trop chère par mois, tu en prends une qui correspond à ton budget, c'est quand même plus simple !
Répondre
#30
(03-01-2026 09:51:23)Ironman a écrit : Hello, est-ce que sur vast il est possible de plier pour un budget précis chaque mois ? Donc un nombre d'heure spécifique ? Car 100% du temps pour une 5090 c'est 130 € par mois !

C'est possible indirectement (puisque les €€€ ce ne sont que des heures VAST) et assez manuellement
donc tu regardes le prix /h , tu regardes combien tu veux mettre dedans , tu crédites ton compte vast de la somme, tu loues ton instance,  ça te dit dans combien de temps ça sera à zero => quand c'est a zero (ou qq centimes avant) tu détruis l'instance.

NB:  il y a des API et un client en ligne de commande qui permettraient d'automatiser le pilotage de la souscription/destruction d'instance, mais pas encore regardé

(03-01-2026 10:43:49)Maeda a écrit : Dans ce cas le plus simple au lieu de prendre une carte graphique trop chère par mois, tu en prends une qui correspond à ton budget, c'est quand même plus simple !
Euh, non Smile
Faut regarder aussi le PPD/€  (et https://alliancefrancophone.org/comparoGPU/ peut aider)

Si t'as (pour simplifier les calculs) 63€ à mettre par mois, mieux vaut prendre une 5090 (à 132€ / mois) pendant 2 semaines qu'une 3090 (à 63€/mois) pendant 1 mois complet : tu produiras 2x plus avec la 5090 pour le même investissement.
[Image: tiyk.png]


Exclamation Et attention à la ligne mentionnant les coûts "Internet", il y a souvent des fournisseurs qui se rattrapent là dessus (généralement des américains avec des coûts à $33 / To !! )
(merci Gtev pour le rappel)
Répondre





Utilisateur(s) parcourant ce sujet : 1 visiteur(s)