Plantage dans 2 box similaires

Bonjour,

J’ai réalisé 4 box Jeedom sur la base de RPi 3b ou 3b+, toutes avec disque SSD, ventilateur, alim 4A et sous Debian Stretch. Elles sont destinées essentiellement à la détection d’effraction.

Elles fonctionnaient depuis plusieurs semaines voire plusieurs mois pour la première sans problème. Récemment, 2 d’entre elles se sont plantées brutalement. A chaque fois, message sur l’interface Web : « SQLSTATE[HY000] [2002] Connection refused ». Comme elles sont installées dans des résidences de vacances (que pour mes amis :wink: ), aucun accès SSH possible. Même constat une fois au chevet des malades, les 2 RPi fonctionnaient encore mais pas de Jeedom ! Une était en version 3.3.33 et l’autre en 3.3.34.

En redémarrant les box, je me suis aperçu que les logfiles (par défaut) étaient exactement les mêmes au moment du plantage (déterminé grâce aux historiques), soit

Http.error :
[Thu Nov 14 10:17:50.919126 2019] [mpm_prefork:notice] [pid 506] AH00163: Apache/2.4.25 (Raspbian) configured – resuming normal operations
[Thu Nov 14 10:17:50.922044 2019] [core:notice] [pid 506] AH00094: Command line: ‹ /usr/sbin/apache2 ›

Cron Execution :
2019-11-14 10:18:03 starting Jeedom
gzip: stdin: unexpected end of file
tar: Child returned status 1
tar: Error is not recoverable: exiting now
Enable scenario : OK
Enable task : OK

Exactement la même chose sur la 2ème box, hormis la date et l’heure bien entendu (22.11, 23:17 et 23:18) ! Point commun majeur entre ces 2 box, elles gèrent également un chauffage grâce au plugin Thermostat qui avait été activé en mode « hors gel » depuis quelques jours (moteur : hystérèse). A noter que le dongle z-wave est différend entre les box (Aeotec respectivement Evergreen), idem pour les capteurs de température (Fibaro respectivement Neo Coolcam). A noter aussi que l’accès internet se fait en 4G pour l’une (modem Huawei) et via une box SFR « cuivre » pour l’autre. Pas d’erreurs IO sur les SSD. Au moment des plantages, les historiques ne m’ont rien montré de particulier. Il n’y avait pas eu d’enclenchement du chauffage à ce moment-là (réalisé dans chaque box par un Fibaro FGS-222, l’un sur un chauffage à accumulation, l’autre par climatiseur réversible).

Les 2 autres box RPi qui n’ont pas planté n’ont pas de thermostat ! Est-ce la source du problème ?

Depuis, j’ai équipé une des box (la plus éloignée) d’un watchdog hardware qui a fait l’objet d’un post sur ce forum. De plus, j’ai mis le log « Thermostat » en mode « debug » sur chacune d’elles. J’ai aussi mis en œuvre un virtuel pour éviter de polluer le thermostat de chaque box par des températures mesurées éventuellement erronées (filtrage des températures admises uniquement entre 3 et 37 degrés). Elles ont également été mises à jour avec la dernière version de Jeedom (3.3.38) et des plugins selon les recommandations reçues relatives à la sécurité.

Quelle pourrait être la cause de ces plantages bien trop similaires ? J’en saurai probablement plus après le prochain plantage mais vu le temps nécessaire pour aller sur ces 2 sites, je suis preneur d’un conseil ou d’une expérience similaire.

D’avance merci !

Personne n’a une idée à me soumettre, en particulier sur les lignes http.error et Cron execution ?

J’ai déjà eu des soucis qui pourraient paraître similaires, aussi bien sur mon Jeedom local, que sur 3 Jeedom distants.

A vrai dire, je ne me souviens plus exactement des logs.
Ce que je peux dire :
-J’avais aussi le souci de « SQLSLATE… »
-J’étais aussi sous SSD
-Je n’avais pas de plugin thermostat
-Les plantages se faisaient quasiment toujours la nuit (aux environs de l’heure des sauvegardes)

Ces problèmes revenaient régulièrement sur tous mes Jeedom.

Depuis, j’ai changé deux choses :

-le cable USB qui relie le Rpi au SSD (j’ai acheté des câbles de qualité)
-J’ai désactivé les sauvegardes automatiques journalières (inutiles pour moi étant donné l’utilisation de mes Jeedom - Je fais une sauvegarde manuelle à chaque grosse évolution)

Depuis, je suis tranquille. Ca fait des mois que toutes mes configs tournent comme des horloges.

Salut,

ça ressemble aux logs de mise à jour (ou de création d’un backup)… avec une erreur au niveau de l’archive…

Bonjour à tous !
Finalement, je pense avoir trouvé le problème. Après avoir tenté de multiples modifications, plus aucun plantage depuis que j’ai supprimé la sauvegarde automatique sur mes Raspberry il y a 2 mois de cela. Merci à Snoopy et à naboleo de m’avoir mis sur la bonne piste.
Je suis presque certain d’avoir résolu ce problème car en lançant une sauvegarde manuelle hier soir sur une de mes box Pi (6), elle s’est plantée et le message dans le logfile est exactement le même que celui dans mon post du mois de novembre…
A noter encore que je n’ai jamais eu ce problème avec mes Jeedom Smart…

Ce sujet a été automatiquement fermé après 24 heures suivant le dernier commentaire. Aucune réponse n’est permise dorénavant.