Restauration backup plante avec Debian 12 sous proxmox 8.4

Bonjour a tous

je suis dans un cas un peu confus meme si je vois quelques posts qui presentent une problematique proche.
Depuis que je suis monte en proxmox 8.4 sous debian 12 via l’install Jeedom (j’avais precedement un proxmox 7.x sous debian 11mais le HD m’a laché) je ne peux plus restaurer une version antérieure ( backup tous les jours sur un Syno) sans que mon proxmox ne tombe pendant cette restauration.
Je ne sais pas comment faire pour eviter cet écueil ( d’ailleurs j’ai aussi eu des plantages de mon proxmox tout au debut sans raison particulière (apres quelques heures ou quelques jours de fonctionnement).
Auriez vous une idée pour me guider? avez vous besoin de certain log?
Merci d’avance.

Bjr,

Promox installé sur quoi ?
Promox à jour 8.4.1 ?

Debian à jour ?

Ca veut dire quoi ?

Le noeud proxmox entier n’est plus joignable, plante ?

Ou la VM jeedom ?

Sans être plus précis ça va être chaud de t’orienter

1 « J'aime »

Bonjour, j’ai eu un soucis suite à la mise a jourde Proxmos en 8.4.1 sur un BEH 5. J’avais des déconnections réseau. Il me suffisait de débrancher la prise RJ45 et de la remettre pour que mes VM redeviennent accésibles.
Apparament , il y a un soucis avec les puces Realtek et le dernier noyau.
J’ai du rétrograder le noyeau à la version 6.8.4-2 pour que tout refonctionne.
je l’ai fait grace à l’aide proposé ci dessous.

Si cela peut aider.

1 « J'aime »

de quelles versions Jeedom parle-t’on ?
Version sur la save ? 4.4.19, 4.5
Version installé avant restauration de la save sur deb 12 ?

Norbert

Ah oui je vais m’expliquer un peu mieux @lperenna !

j’utilise un Nuc Intel, avec un proxmox 8.4.0, et debian est totalement a jour

En fait je ne peux plus contacter les noeuds de mon prooxmox…pas plus que le proxmox lui meme. Je ne sais pas dire si l’ensemble est plante ou simplement plus contactable.

Quand je redemarre le proxmox (coupure du NUC) celui se relance, les noeuds aussi et apres quelques interventions sur les demons (MQTT/ z2m / Zwave) l’ensemble repart gentiment.

la version de Jeedom est la 4.4.19

Ce qui me perturbe quand meme c’est la conjonction de la restauration de mon backup Jeedom avec cet etat de fait.

1 « J'aime »

Bonjour @jeedommaison59 et merci, effectivement mon NUC est un NUC8i5BEH et mon kernel 6.8.12.9. Je vais tenter de revenir en arrière mais je n’ai pas d’autre kernel dispo sur la machine.
Une mise a jour du firmware du nuc peut il être bénefique?

Salut,

Il va probablement falloir faire un downgrade du driver de la carte réseau.

J’ai galéré une paire d’heures sur ce sujet pour ce type de problème lors de la mise en service d’un nouveau mini-pc il y a quelques temps. Je te retrouve ce que j’avais noté dès que possible

2 « J'aime »

Bonjour

J’ai aussi la même machine Intel NUC8i5BEH.

  • Votre Proxmox n’est pas à jour : pve 8.4.1
    Kernel Linux 6.8.12-11-pve

Cette machine a de nombreux problèmes:

1- plantage inexpliqué si le port HDMI n’est pas connecté à un écran : résolution connecter un hdmi dummy qui simule un écran.

2- Problème de carte réseau : généralement notifié dans le journal system, faire un journalctl pour la recherche.

J’ai trouver une solution su le forum Proxmox, voici mon fichier de configuration, attention je fais une agrégation de lien ( bond) avec une carte Réseau USB, la ligne intéressante est celle-ci :
A ajouter en cli sous la première interface. Recommandation : faire une copie de votre fichier avant modification.

post-up /sbin/ethtool -K eno1 gso off gro off tso off tx off rx off rxvlan off txvlan off sg off
root@pve2:/etc/network# cat interfaces
# network interface settings; autogenerated
# Please do NOT modify this file directly, unless you know what
# you're doing.
#
# If you want to manage parts of the network configuration manually,
# please utilize the 'source' or 'source-directory' directives to do
# so.
# PVE will preserve these directives, but will NOT read its network
# configuration from sourced files, so do not attempt to move any of
# the PVE managed interfaces into external files!

auto lo
iface lo inet loopback

auto eno1
iface eno1 inet manual
	post-up /sbin/ethtool -K eno1 gso off gro off tso off tx off rx off rxvlan off txvlan off sg off

iface wlp0s20f3 inet manual

auto eth0
iface eth0 inet manual

auto enx1c697aa26e06
iface enx1c697aa26e06 inet manual

auto bond0
iface bond0 inet manual
	bond-slaves eno1 eth0 enx1c697aa26e06
	bond-miimon 100
	bond-mode balance-rr

auto vmbr0
iface vmbr0 inet static
	address 192.168.1.248/24
	gateway 192.168.1.254
	bridge-ports bond0
	bridge-stp off
	bridge-fd 0

Depuis je n’ai plus de planté à cause de la carte réseau. De nombreux posts en parlent sur le forum Proxmox, il est difficile de s’y retrouver.

  • vérifier votre SSD , le paramètre wearout est il à 0%.

Cordialement

1 « J'aime »

merci beaucoup pour toutes ces explications je vais faire le point la dessus debut de semaine , le we est trop charge :slight_smile:

Edit
je viens d’avoir un plantage …enfin juste une coupure du reseau ethernet. J’ai debranche comme propose le cable et je l’ai rebranché et miracle le tout est a nouveau joignable.
il va falloir que je travaille sur ce cher nuc.

Regarder dans le journal system, cela doit être notifié.

Si vous n’êtes pas à l’aise avec la commande journalctl, vous trouverez des exemples ici:
https://www.linuxtricks.fr/wiki/systemd-utiliser-journalctl-les-logs-de-systemd

Encore merci @echo de votre aide.

Bonjour @echo
j’ai cru l’espace d’un instant que l’ajout du dongle hdmi avait ete efficace…mais on l’instabilite du reseau est vriment la cause de mon souci.
Je viens de jeter un oeil au fichier /etc/network/interfaces avec nano:

auto lo
iface lo inet loopback

iface eno1 inet manual

auto vmbr0
iface vmbr0 inet static
        address 10.100.67.239/24
        gateway 10.100.67.1
        bridge-ports eno1
        bridge-stp off
        bridge-fd 0

iface wlp0s20f3 inet manual


source /etc/network/interfaces.d/*

j’ai ajouter votre formule :

post-up /sbin/ethtool -K eno1 gso off gro off tso off tx off rx off rxvlan off txvlan off sg off``

Mais lors de l’exit et apres avoir valider la demande de sauvegarde j’arrive sur cet ecran…et je ne sais que faire comme choix!

pourriez vous m’aiguiller ?

Merci :slight_smile:

Bonjour,

Appuyer sur la touche Entrée pour valider le nom du fichier à modifier indiqué tout en bas.

Bonjour

Merci à Madcow d’avoir répondu pour nano.

Avez-vous vérifier dans le journal système les erreurs sur la carte réseau, avant d’ajouter cette commande?

J’avais cette erreur dans le journal système:

2024-03-03T04:57:25.894803+01:00 pve-nuc kernel: [483794.501552] e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
2024-03-03T04:57:25.894814+01:00 pve-nuc kernel: [483794.501552]   TDH                  <46>
2024-03-03T04:57:25.894815+01:00 pve-nuc kernel: [483794.501552]   TDT                  <5d>
2024-03-03T04:57:25.894815+01:00 pve-nuc kernel: [483794.501552]   next_to_use          <5d>
2024-03-03T04:57:25.894815+01:00 pve-nuc kernel: [483794.501552]   next_to_clean        <45>
2024-03-03T04:57:25.894815+01:00 pve-nuc kernel: [483794.501552] buffer_info[next_to_clean]:
2024-03-03T04:57:25.894816+01:00 pve-nuc kernel: [483794.501552]   time_stamp           <107346568>
2024-03-03T04:57:25.894816+01:00 pve-nuc kernel: [483794.501552]   next_to_watch        <46>
2024-03-03T04:57:25.894817+01:00 pve-nuc kernel: [483794.501552]   jiffies              <107346ca8>
2024-03-03T04:57:25.894817+01:00 pve-nuc kernel: [483794.501552]   next_to_watch.status <0>
2024-03-03T04:57:25.894818+01:00 pve-nuc kernel: [483794.501552] MAC Status             <40080083>
2024-03-03T04:57:25.894818+01:00 pve-nuc kernel: [483794.501552] PHY Status             <796d>
2024-03-03T04:57:25.894819+01:00 pve-nuc kernel: [483794.501552] PHY 1000BASE-T Status  <3c00>
2024-03-03T04:57:25.894819+01:00 pve-nuc kernel: [483794.501552] PHY Extended Status    <3000>
2024-03-03T04:57:25.894820+01:00 pve-nuc kernel: [483794.501552] PCI Status             <10>

Vous pouvez visualiser toutes les erreurs système avec la commande suivante en cli:

sudo journalctl -p err

Cordialement

Puisque que vous avez un Proxmox, je vous conseille :

https://www.youtube.com/@AdrienLinuxtricks

Pour les débutants 3 utilitaires sont conseillés en cli:

  • htop: pour motoriser le CPU
  • mc : un explorateur de fichiers en mode semi-graphique
  • nano

Exercez-vous avec ces 3 utilitaires sur votre VM de test avant de les utiliser sur votre Jeedom.
Attention les commandes d’effacement sous linux en cli et avec les utilitaires pré-cités sont définitifs, pas de retour possible en arrière. Faire toujours une sauvegarde des fichier modifiés.

Bonjour @echo et @Madcow et merci de vos reponses precises et completes et avec les liens!

Je viens de regarder le journal mais la je ne sais rien lire de clair meme si cela a l’air bien ressemblant :slight_smile: le voici :

Jun 06 07:38:45 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <bb>
                              TDT                  <e6>
                              next_to_use          <e6>
                              next_to_clean        <ba>
                            buffer_info[next_to_clean]:
                              time_stamp           <113c468e5>
                              next_to_watch        <bb>
                              jiffies              <113c48340>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>

Pour info j’avais fait la mise a jour de la machine suite a votre remarque, ce cote est bon!

Bonjour

Oui, c’est bien les mêmes erreurs que j’avais.
Le driver de la carte réseau est bien le e1000e.

Comme dit précédemment, il y a beaucoup de sujet sur le forum Proxmox sur cette carte réseau e1000e. Différentes solutions sont proposées. Je vous ai transmis ce qui marche dans ma configuration. Malheureusement il est très difficile de rajouter une autre carte réseau au NUC pour remplacer l’interface réseau intégrée. Pour ma part j’ai ajouté un adaptateur réseau USB, sauf que les adaptateurs ethernet réseau USB change de nom (aléatoire) lors d’une réinitialisation de cette interface et comme ce nom n’est pas connu dans le fichier interface de Proxmox cela stop les échanges réseau. Il faut dans ce cas paramétrer le système de nommage de la carte réseau avec son adresse MAC. J’ai fait une agrégation de lien en mode RR, si une carte réseau tombe il y a redondance avec l’autre.
Informez nous sur la suite de vos essais.

apres un peu de lecture assidue de plein d’articles, je viens de faire quelques essais de modifications d’interfaces…j’attends quelques jours pour voir si le proxmox est plus table vis a vis de e1000e :slight_smile:
Bonne soirée et merci de l’aide