Bonjour,
J’ai réalisé 4 box Jeedom sur la base de RPi 3b ou 3b+, toutes avec disque SSD, ventilateur, alim 4A et sous Debian Stretch. Elles sont destinées essentiellement à la détection d’effraction.
Elles fonctionnaient depuis plusieurs semaines voire plusieurs mois pour la première sans problème. Récemment, 2 d’entre elles se sont plantées brutalement. A chaque fois, message sur l’interface Web : « SQLSTATE[HY000] [2002] Connection refused ». Comme elles sont installées dans des résidences de vacances (que pour mes amis ), aucun accès SSH possible. Même constat une fois au chevet des malades, les 2 RPi fonctionnaient encore mais pas de Jeedom ! Une était en version 3.3.33 et l’autre en 3.3.34.
En redémarrant les box, je me suis aperçu que les logfiles (par défaut) étaient exactement les mêmes au moment du plantage (déterminé grâce aux historiques), soit
Http.error :
[Thu Nov 14 10:17:50.919126 2019] [mpm_prefork:notice] [pid 506] AH00163: Apache/2.4.25 (Raspbian) configured – resuming normal operations
[Thu Nov 14 10:17:50.922044 2019] [core:notice] [pid 506] AH00094: Command line: ‹ /usr/sbin/apache2 ›
Cron Execution :
2019-11-14 10:18:03 starting Jeedom
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now
Enable scenario : OK
Enable task : OK
Exactement la même chose sur la 2ème box, hormis la date et l’heure bien entendu (22.11, 23:17 et 23:18) ! Point commun majeur entre ces 2 box, elles gèrent également un chauffage grâce au plugin Thermostat qui avait été activé en mode « hors gel » depuis quelques jours (moteur : hystérèse). A noter que le dongle z-wave est différend entre les box (Aeotec respectivement Evergreen), idem pour les capteurs de température (Fibaro respectivement Neo Coolcam). A noter aussi que l’accès internet se fait en 4G pour l’une (modem Huawei) et via une box SFR « cuivre » pour l’autre. Pas d’erreurs IO sur les SSD. Au moment des plantages, les historiques ne m’ont rien montré de particulier. Il n’y avait pas eu d’enclenchement du chauffage à ce moment-là (réalisé dans chaque box par un Fibaro FGS-222, l’un sur un chauffage à accumulation, l’autre par climatiseur réversible).
Les 2 autres box RPi qui n’ont pas planté n’ont pas de thermostat ! Est-ce la source du problème ?
Depuis, j’ai équipé une des box (la plus éloignée) d’un watchdog hardware qui a fait l’objet d’un post sur ce forum. De plus, j’ai mis le log « Thermostat » en mode « debug » sur chacune d’elles. J’ai aussi mis en œuvre un virtuel pour éviter de polluer le thermostat de chaque box par des températures mesurées éventuellement erronées (filtrage des températures admises uniquement entre 3 et 37 degrés). Elles ont également été mises à jour avec la dernière version de Jeedom (3.3.38) et des plugins selon les recommandations reçues relatives à la sécurité.
Quelle pourrait être la cause de ces plantages bien trop similaires ? J’en saurai probablement plus après le prochain plantage mais vu le temps nécessaire pour aller sur ces 2 sites, je suis preneur d’un conseil ou d’une expérience similaire.
D’avance merci !