Bonjour à tous,
Bon ça y est je craque, mon jeedom plante maintenant trop régulièrement pour ne plus les ignorer. Et j’ai besoin de vos lumières ![]()
Depuis plusieurs semaines maintenant, mon jeedom ne tient pas plus de 2 jours. J’ai en moyenne 1 à 4 plantages du système (au niveau de l’OS) par jour.
J’en ai eu 4 ce matin entre 5h et 11h, c’est trop…
(je donne en fin de post toute la configuration de mon système).
Il existe plusieurs cas : soit un plantage pur et dur de l’OS, soit un freeze. Les symptômes :
- Sur freeze : d’abord une erreur « bad gateway 502 » sur la page jeedom, avant que cela soit plus du tout accessible (timeout). Pendant cette phase, même le SSH est inaccessible, mais le monitoring proxmox m’affiche toujours une VM en vie avec un plafonnement CPU à 12/13% continu (alors que je suis en général entre 2 et 4%)
- Sur plantage dur : OS full KO, plantage du kernel. Plus rien ne répond (http, ssh etc…)
Ca fait un moment que je tente d’analyser le truc (via du monitoring charge CPU, process etc), mais rien de concluant. Ce matin, sur les 4 plantages, 3 sont des plantages du noyau linux visibles dans les journaux syslog.
Voici l’analyse de ces trois plantages par ChatGPT 4o :
Analyse des logs (résumé technique)
Cas à 08h44 (8h45.txt)
mariadbdest en lock CPU pendant >22 s →soft lockup- RCU (Read-Copy Update) détecte un blocage prolongé sur CPU 3
- Appels dans
__split_huge_pmdetzap_page_range- La VM entre dans un état instable (plus de réponse Apache/SSH)
Cas à 09h11 (9h11.txt)
- Blocage du thread
khugepaged→ tâche du noyau qui gère les pages mémoire énormes >(Transparent Huge Pages)- Suivi d’un
NULL pointer dereferencedans le kernel (erreur sérieuse)mariadbdetapache2sont impactés- Noyau Debian 5.10.0-35 (build récent)
Cas à 07h32 (7h32.txt)
- Redémarrage complet de la VM visible : probablement causé par un crash noyau antérieur ou >un redémarrage forcé
Diagnostic
Tu es face à un bug noyau sévère lié à la gestion mémoire dans un environnement virtualisé >KVM/QEMU, impliquant :
- MariaDB comme déclencheur ou aggravant,
- Les appels système
madvise,zap_page_range,flush_tlb_mm_range, etc.- Les
Transparent Huge Pages(khugepaged) qui provoquent des corruptions ou blocages.
Actions concrètes à engager
1. Désactiver les Transparent Huge Pages (THP)
C’est la priorité immédiate, car
khugepagedest impliqué dans les crashs.Dans
/etc/default/grub, ajoute ceci à la ligneGRUB_CMDLINE_LINUX_DEFAULT:bash
transparent_hugepage=neverExemple :
bash
GRUB_CMDLINE_LINUX_DEFAULT="quiet transparent_hugepage=never"Puis applique :
bash
update-grub reboot
Cela désactive
khugepaged, souvent source de crashs avec MariaDB en VM.
2. Forcer MariaDB à éviter les mmap / madvise abusifs
Ajoute dans
/etc/mysql/mariadb.conf.d/50-server.cnf:[mysqld] innodb_use_native_aio=0Et redémarre MariaDB :
bash
systemctl restart mariadb
3. Passer au noyau Debian stable (si ce n’est pas déjà le cas)
Le log indique
5.10.0-35-amd64, soit un backport récent.
Pour améliorer la stabilité, tu peux tenter de revenir au noyau standard (ex. :
5.10.0-28->amd64), ou passer à une version plus récente si stable (6.xvia backports). À confirmer selon >ton setup.
4. Désactiver THP à chaud (temporaire)
En attendant un reboot, tu peux aussi appliquer :
bash
echo never > /sys/kernel/mm/transparent_hugepage/enabledet
bash
echo never > /sys/kernel/mm/transparent_hugepage/defrag
Recommandation
Les crashs sont graves (soft lockup, NULL pointer dereference), donc il est impératif de :
- désactiver les THP,
- forcer MariaDB à éviter certains appels système dangereux,
- et si possible, tester un autre noyau plus stable ou plus récent.
ChatGPT me propose plusieurs solutions, dont notamment désactiver les THP (géré par le processus khugepaged) qui aurait une compatibilité limitée avec mariadb sous environnement virtualisé. Personnellement première fois que j’entends ça.
Il propose ensuite une modif de mariadb pour éviter les mmap / madvise abusifs. Là encore, je crois n’avoir jamais vu ça dans le forum.
Enfin, il propose d’upgrader la version du noyaux linux (actuellement 5.10.0-35-amd64, qui date du 19 mai 2025, donc récente) vers une version « backport », et donc passer sur du 5.19 ou carrément 6.1.
Je ne pense pas avoir d’historisation trop agressive pour pourrait expliquer que mariadb soit à genoux (voir fin de post pour l’analyse de l’historisation)
A noter que j’ai récemment changé le disque (nvme) de mon système proxmox par un neuf (clone disk to disk), pour écarter un problème de secteurs défectueux.
Sinon ma VM tourne sur ce proxmox depuis décembre 2023, et je n’ai ce genre de soucis que depuis quelques semaines.
Mes questions à la communauté :
- A ceux qui hébergent leur jeedom sur une VM proxmox, quelles sont vos versions de noyaux ? Certains ont-ils forcé un update noyau via repot backports ?
- Avez-vous eu des problèmes similaire avec mariadb ? Et effectué une modif de la conf comme proposé par chatgpt ? Car j’ai aussi des doutes sur certains plantage lié à des freezes de mariadb…
- Qu’est-ce que vous préconisez de monitorer pour tenter d’intercepter ce qui fait freeze mariadb ?
Merci d’avance pour votre aide ![]()
Ma configuration complète :
- Hardware : ACEMAGICIAN AM06Pro Mini PC (AMD Ryzen 7 5700U 8C/16T, DDR4 32 Go, 1To Nvme)
- VM Jeedom hébergée sous proxmox 8.4.1
- Version du noyau du noeud proxmox : Linux pve 6.8.12-11-pve (2025-05-22T09:39Z) x86_64
- OS : Debian 11, noyau 5.10.0-35-amd64 (build 5.10.237-1, daté du 19 mai 2025)
- Taille d’une sauvegarde jeedom : 190Mo
- Les services Mosquitto et zigbee2mqtt sont hébergés en dehors de la VM jeedom (sur leux propres LXC)
- Config proxmox de la VM :
agent: 1
balloon: 0
boot: order=scsi0;net0
cores: 4
cpu: host
memory: 6144
meta: creation-qemu=8.1.2,ctime=1702054780
name: jeedom
net0: virtio=BC:24:11:74:9F:9F,bridge=vmbr0,firewall=1
onboot: 1
ostype: l26
scsi0: ssdlocal:vm-103-disk-0,iothread=1,size=32G
scsihw: virtio-scsi-single
smbios1: uuid=68e28a3e-42e6-494e-8741-9810288ea162
sockets: 2
startup: order=2
tablet: 0

Analyse archivage :
Durée moyenne d’un archivage : 10sec
[2025-06-11 14:35:20][SCENARIO] -- Début : Scenario lance manuellement.
[2025-06-11 14:35:20][SCENARIO] - Exécution du sous-élément de type [action] : code
[2025-06-11 14:35:20][SCENARIO] Exécution d'un bloc code
[2025-06-11 14:35:20][SCENARIO] ┌──────────── Logs bloc code - version du 31/10/2024 07:00
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | -------- PARAMETRES
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | Seuil alerte 24h : 50
[2025-06-11 14:35:20][SCENARIO] | Seuil nb lignes archivées : 50 000
[2025-06-11 14:35:20][SCENARIO] | Seuil taille table : 200 MB
[2025-06-11 14:35:20][SCENARIO] | Seuil nb lignes table : 2 000 000
[2025-06-11 14:35:20][SCENARIO] | Nb de commandes récupérées : 5
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | -------- TACHE D'ARCHIVAGE
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | Actif : 1
[2025-06-11 14:35:20][SCENARIO] | Statut : stop
[2025-06-11 14:35:20][SCENARIO] | Last run : 2025-06-11 05:00:01
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | -------- RESUME
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | Table historyArch : Taille -> 240MB , nb lignes -> 5 830 441
[2025-06-11 14:35:20][SCENARIO] | /!\ Table Anormalement grosse, taille superieure au seuil (240MB)
[2025-06-11 14:35:20][SCENARIO] | /!\ Table Anormalement grosse, Nb de lignes superieur au seuil (5 830 441 lignes)
[2025-06-11 14:35:20][SCENARIO] | Table history : Taille -> 17MB , nb lignes -> 271 635
[2025-06-11 14:35:20][SCENARIO] | Table conso_teleinfo : Taille -> 8MB , nb lignes -> 49 850
[2025-06-11 14:35:20][SCENARIO] | Table event : Taille -> 8MB , nb lignes -> 249
[2025-06-11 14:35:20][SCENARIO] | Table cmd : Taille -> 2MB , nb lignes -> 3 531
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:20][SCENARIO] | -------- COMMANDES AVEC DONNEES VOLUMINEUSES
[2025-06-11 14:35:20][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | virtual -> #[Maison][Résumé élec][Conso totale]# (id : 6718)
[2025-06-11 14:35:21][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur archivéess trop importantes (663 055), superieur à 50 000
[2025-06-11 14:35:21][SCENARIO] | Configuration : historisé -> 1 , lissage -> avg , purge -> -2 years
[2025-06-11 14:35:21][SCENARIO] | Historique : 2006 valeurs (estimation sur 24h : 5021)
[2025-06-11 14:35:21][SCENARIO] | Archives : 663055 valeurs depuis 389 jours (1705 valeurs par jour en moyenne)
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | virtual -> #[Maison][Résumé élec][Import edf]# (id : 6719)
[2025-06-11 14:35:21][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur archivéess trop importantes (638 949), superieur à 50 000
[2025-06-11 14:35:21][SCENARIO] | Configuration : historisé -> 1 , lissage -> avg , purge -> -2 years
[2025-06-11 14:35:21][SCENARIO] | Historique : 2012 valeurs (estimation sur 24h : 5036)
[2025-06-11 14:35:21][SCENARIO] | Archives : 638949 valeurs depuis 389 jours (1643 valeurs par jour en moyenne)
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | virtual -> #[Maison][Résumé élec][Injection]# (id : 6721)
[2025-06-11 14:35:21][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur archivéess trop importantes (638 935), superieur à 50 000
[2025-06-11 14:35:21][SCENARIO] | Configuration : historisé -> 1 , lissage -> avg , purge -> -2 years
[2025-06-11 14:35:21][SCENARIO] | Historique : 2010 valeurs (estimation sur 24h : 5031)
[2025-06-11 14:35:21][SCENARIO] | Archives : 638935 valeurs depuis 389 jours (1643 valeurs par jour en moyenne)
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | teleinfo -> #[Maison][Téléinfo][BBRHCJB]# (id : 6168)
[2025-06-11 14:35:21][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur archivéess trop importantes (408 357), superieur à 50 000
[2025-06-11 14:35:21][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> -1 year
[2025-06-11 14:35:21][SCENARIO] | Historique : 2007 valeurs (estimation sur 24h : 5023)
[2025-06-11 14:35:21][SCENARIO] | Archives : 408357 valeurs depuis 365 jours (1119 valeurs par jour en moyenne)
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | teleinfo -> #[Maison][Téléinfo][BBRHPJB]# (id : 6169)
[2025-06-11 14:35:21][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur archivéess trop importantes (408 354), superieur à 50 000
[2025-06-11 14:35:21][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> -1 year
[2025-06-11 14:35:21][SCENARIO] | Historique : 2007 valeurs (estimation sur 24h : 5023)
[2025-06-11 14:35:21][SCENARIO] | Archives : 408354 valeurs depuis 365 jours (1119 valeurs par jour en moyenne)
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:21][SCENARIO] | -------- COMMANDES AVEC DONNEES ALPHANUMERIQUES
[2025-06-11 14:35:21][SCENARIO] |
[2025-06-11 14:35:23][SCENARIO] | teleinfo -> #[Maison][Téléinfo][PTEC]# (id : 1389)
[2025-06-11 14:35:23][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> -1 year
[2025-06-11 14:35:23][SCENARIO] | Historique : 8028 caractères (estimation sur 24h : 20092)
[2025-06-11 14:35:23][SCENARIO] | Archives : 4348 caractères depuis 365 jours (12 caractères par jour en moyenne)
[2025-06-11 14:35:23][SCENARIO] |
[2025-06-11 14:35:23][SCENARIO] | mode -> #[Maison][Modes][Mode]# (id : 756)
[2025-06-11 14:35:23][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> aucun
[2025-06-11 14:35:23][SCENARIO] | Historique : 0 caractères (estimation sur 24h : 0)
[2025-06-11 14:35:23][SCENARIO] | Archives : 674 caractères depuis 760 jours (1 caractères par jour en moyenne)
[2025-06-11 14:35:23][SCENARIO] |
[2025-06-11 14:35:23][SCENARIO] | teleinfo -> #[Maison][Téléinfo][DEMAIN]# (id : 6174)
[2025-06-11 14:35:23][SCENARIO] | /!\ PB DE PARAMETRAGE, nb de valeur par 24h important (20 092) et aucun lissage ni aucune purge paramétrés
[2025-06-11 14:35:23][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> aucun
[2025-06-11 14:35:23][SCENARIO] | Historique : 8028 caractères (estimation sur 24h : 20092)
[2025-06-11 14:35:23][SCENARIO] | Archives : 516 caractères depuis 411 jours (1 caractères par jour en moyenne)
[2025-06-11 14:35:23][SCENARIO] |
[2025-06-11 14:35:23][SCENARIO] | virtual -> #[Maison][Chauffage][etat]# (id : 1963)
[2025-06-11 14:35:23][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> -3 month
[2025-06-11 14:35:23][SCENARIO] | Historique : 0 caractères (estimation sur 24h : 0)
[2025-06-11 14:35:23][SCENARIO] | Archives : 395 caractères depuis 92 jours (4 caractères par jour en moyenne)
[2025-06-11 14:35:23][SCENARIO] |
[2025-06-11 14:35:23][SCENARIO] | teleinfo -> #[Maison][Téléinfo][HHPHC]# (id : 1425)
[2025-06-11 14:35:23][SCENARIO] | Configuration : historisé -> 1 , lissage -> aucun , purge -> -1 year
[2025-06-11 14:35:23][SCENARIO] | Historique : 2007 caractères (estimation sur 24h : 5023)
[2025-06-11 14:35:23][SCENARIO] | Archives : 362 caractères depuis 365 jours (1 caractères par jour en moyenne)






