Jeedom KO suite snapshot

Bonsoir à tous,

Depuis peu, j’ai un gros souci avec la fonction snapshot de Proxmox, et mon Jeedom de prod. C’est systématique :

  • Je lance un snapshot Jeedom allumé, la tâche se déroule normalement.
  • En fin de snapshot Jeedom devient incontrôlable, la plupart des CPU sont à 100%.
  • La seule façon de s’en sortir est de redémarrer la VM, ensuite tout redevient normal.

Est-ce que l’un d’entre vous a constaté ça ?

Je suis sous Proxmox 8.2.4 :


Mes VM sont sur un stockage distribué Ceph

Ma config Jeedom 4.4.15 / Debian 11 est classique :

Voici les dégâts avant un reboot obligatoire :

Les configs des 2 VM sont identiques (à part le nombre de cpu et la taille du disque) :
image

La fonction snapshot a toujours fonctionné sans souci.

Je démarre tout juste les investigations, je pense à :

  • un bug côté Proxmox (étonnant quand même)
  • une configuration de la VM qui poserait souci (à revérifier)

nb :

  • aucun souci avec les backups classiques.
  • Je viens de tester avec Jeedom 4.5 & Debian12, pas de souci.
    (Mais cette config de test est toute neuve donc vide).

Qu’en pensent les habitués de Proxmox ?
Merci.

Hello,
Dans ton htop on voit ffmpeg au dessus, tu pourrais justement classer par cpu et puis par mem quand ça arrive ?

En fait, pour faire un snapshot, l’hyperviseur (quel qu’il soit) doit bloquer les I/O. Et je pense que tu as bcp d’I/O sur ton système… et donc c’est la file des I/O qui se vide en prenant toutes les resources (on voit vaguement ton mysql qui bouffe le cpu). Et ton stockage suit pas car mysql n’a pas été fine-tuné pour ton stockage (normal sur un système maison)

Donc l’idéal avant un snapshot c’est peut être de stopper un démon comme zwave ou zigbee ou jMQTT ou autre (qui fait beaucoup d’évent dans le log event). Avec le plugin de MIPS sur proxmox tu peux même sans doute faire un scénario qui l’automatise.

Ton snapshot, tu le fais avec la RAM ou pas ?
Perso, j’ai pas de souci de mon coté avec une config Proxmox quasi identique.
Après, sauvegarder l’état de la RAM n’est pas forcément utile car il y aura forcément une différence entre la RAM et l"état des équipements en cas de restauration du snapshot.
Autant redémarrer Jeedom.
Tu devrais avoir mois de souci lors de ton snapshot.
Screenshot_240905075829

Hello,

Et que donne le log du snapshop depuis Proxmox et la durée de celui-ci ?

Hello,

Je ne suis pas vraiment d’accord avec toi, surtout avec le cache qui va bientôt passer sur mysql… la mémoire sera importante pour la cohérence des données en db.

(Techniquement en ne prenant pas la mémoire, il aura un snapshot « crash-consistent », et avec une db c’est jamais conseillé…)

2 « J'aime »

Hello,

Question con, mais tu as installé le client qemu dans la VM ?

Bad

4 « J'aime »

camera? vu que c’est notamment ffmpeg qui sature

Non comme je disais, son htop n’est pas sorté. C’est mysql qui dequeue les io

1 « J'aime »

+1
J’ai été pris de court, et la machine ne répondait quasiment plus.
→ La prochaine fois je préparerai le htop avant le snapshot (tri).

Très intéressant !
→ Comment ferais-tu pour « fine-tuner » mysql ?

Je préfère continuer à faire comme avant (snapshot direct) pour que ce soit quasi transparent pour le système. Si je commence à stopper des démons, il y un impact sur les utilisateurs. Mais je garde l’idée ne serait-ce qu’à titre de diagnostic.

Je « snapshot » toujours avec la RAM (En phase avec la reco de @nebz). De plus, mon objectif est de continuer pour ne pas redémarrer Jeedom. Jusqu’à présent cela a toujours fonctionné sans souci, donc il faut que je trouve. Au cas où :
-Peux-tu partager onglets « Hardware » et « Options »
-Es-tu aussi sur stockage Ceph ?
-Quelle est ta version de qemu ?

root@pve1:~# qemu-system-x86_64 --version 
QEMU emulator version 9.0.2 (pve-qemu-kvm_9.0.2-2)
Copyright (c) 2003-2024 Fabrice Bellard and the QEMU Project developers

Il n’est plus dans l’historique en bas de page et je ne sais pas comment le retrouver.
Je n’avais rien vu de particulier, et la durée de l’opération était assez rapide.
→ Je garderai un screenshot la prochaine fois

Oui il est bien là et actif :

Pour info, il y a visiblement des alertes côté Proxmox en 8.2.4 :

Il y a des articles entiers et des docs sur le sujet , mais comme je disais c’est pas le besoin ici.

Oui fait le pour confirmer la théorie des io

Salut à tous,

Pour info, voici état des lieux après diverses manips et échanges avec un support Proxmox :

snapshot avec ces paramètres → KO


Deux derniers htop « sorted »
06/09

09/09

→ Curieusement le flux ffmpeg n’apparaît pas systématiquement.

En revanche, je viens de refait un snapshot après avoir désactivé le plugin caméra → OK

A noter que le snapshot s’est réalisé hyper vite → pareil chez vous ?

J’aimerais faire des snapshots sans arrêter le plugin camera, comme avant :
→ Si j’y arrive, je posterai le résultat.
→ Si vous avez des idées, ne pas hésiter !

Suite et fin :+1:

Snapshot OK en changeant le type de cpu de la VM :
« x86-64-v2-AE » → « host »

@nebz
Je pense que ta vision est la bonne (I/O); par contre le support n’a pas de VM analogue à Jeedom, et ne peut donc reproduire. Résultat : pas de fix à attendre pour « x86-64-v2-AE ».

Faute de temps, je n’ai pas testé les cpu v3 et v4 :
image

Comme « host » fonctionne parfaitement, cela me va. Je n’ai pas fait de mesures, mais d’après le support, ce serait même plus performant avec ce choix.

Je passe en résolu.

@+

2 « J'aime »

Ce sujet a été automatiquement fermé après 24 heures suivant le dernier commentaire. Aucune réponse n’est permise dorénavant.