Serveur Proxmox qui plante quotidiennement

non en 8.0.3

je vais voir pour le mettre à jours

Bonjour
Tu peux laisser un écran branché sur le NUC en attendant le dongle et mettre le script bash que je t’ai proposé. Ha j’ai oublié il faut rendre exécutable le script.

chmod +x lescript.sh

un peu compliquer.

je peux attendre, les plantages sont surtout la nuit et ma maison est completement autonome meme si jeedom plante.

Ok

Fais nous un retour, c’est toujours intéressant pour le forum.

mise à jours ok
8.1.10.
je vous tiens au jus

HDMI dummy reçu et pose a 15h.
Je vous tiens au jus

1 « J'aime »

Pour le moment 48h sans coupure…mais bon je reste en encore en vigilance. Car la derniere fois il avais tenu 7 jours…puis toutes les 24h

Bonjour

Tiens nous au courant, je suis fan d’Adrien Linuxtricks, j’ai appris énormément su Linux et sur Proxmox avec lui. Sa chaine sur Youtube et son site web sont très intéressant. Je reçois aussi les messages de son wiki par mail. Adrien dispense des cours de Linux dans une école d’ingénieur en plus de son travail d’informaticien. Une référence.

7 jours et 22h sans plantage :slight_smile:

1 « J'aime »

Bonjour

Tu es sur la bonne voie. Je suis optimiste.
Je n’avais de plantés tous les 2 jours mais vu le prix du dummy hdmi je n’ai pas hésité. J’ai exactement le même Nuc qu’Adrien.

Cordialement.

Bonjour

Le support des NUC Intel comme le mien NUC8i5BEH est réalisé par la société ASUS.
Sur le site d’ASUS les ressources ( manuel, drivers, bios, etc…) n’étaient pas en ligne.
J’ai fait une demande au support le 20/03/24, Asus France m’a informé le 13/04/24:

**Customer Service Feedback**

Bonjour Monsieur,

Nous tenons à vous informer que nous les avons téléchargés dans le système, mais il faut un jour pour les synchroniser.

Nous restons à votre entière disposition.

Toute l’équipe ASUS vous souhaite une excellente journée.

Cordialement,
Dhieb_M,
SAV Asus France,
Hotline : 01.70.94.94.00 (Prix d'un appel local)
http://www.asus.com/fr/support

Je trouve le support Asus assez réactif.

Je suis allé ce matin sur le support Asus et j’ai téléchargé toutes les ressources.
Je suis étonné par la date du BIOS 2024/03/29 version 0097.

Il semblerais qu’un nouveau Bios soit disponible. Ma version serait la 0095 du 09/18/2023.

  • 2 problèmes au moins sont identifiés sur les NUC Intel avec Proxmox installé:

    1- Le HDMI : planté du Proxmox si il n’y pas d’écran de branché sur la prise hdmi, fréquence de
    planté variable ( tous les jours ou les 2 jours) solutions : laisser un écran branché sur le NUC
    ou installé un dummy hdmi à la place de l’écran.
    Source explicative : Linuxtricks.fr

    2- la carte réseau E1000: Plantage du Proxmox avec kernel panic, sur mon NUC 1 fois par mois
    différentes solutions sont proposées sur le forum Proxmox. https://forum.proxmox.com/

Je suis en cours de tests avec cette configuration:
modification du fichier /etc/network/interfaces.

auto lo
iface lo inet loopback

iface eno1 inet manual
	post-up /usr/sbin/ethtool -K $IFACE gso off tso off gro off 2> /dev/null

auto vmbr0
iface vmbr0 inet static
	address 192.168.XXX.XXX/24
	gateway 192.168.XXX.XXX
	bridge-ports eno1
	bridge-stp off
	bridge-fd 0
	post-up /usr/sbin/ethtool -K $IFACE gso off tso off gro off 2> /dev/null

Suivre le fichier /va/log/kern.log

Je vais tenter la mise à jour du bios. A voir dans le temps si cela corrige ces 2 problèmes.

2 « J'aime »

Bon a ca planté aujourd’hui. aprés 8 jours…
je n’ai toujours pas de kernel log.

une mise à jours du bios a faire?

pour info mon nuc c’est celui la

des logs différents

Apr 21 12:27:23 SVR kernel: BUG: unable to handle page fault for address: ffffffff51fede60
Apr 21 12:27:23 SVR kernel: #PF: supervisor instruction fetch in kernel mode
Apr 21 12:27:23 SVR kernel: #PF: error_code(0x0010) - not-present page
Apr 21 12:27:23 SVR kernel: PGD 746239067 P4D 746239067 PUD 0 
Apr 21 12:27:23 SVR kernel: Oops: 0010 [#1] PREEMPT SMP NOPTI
Apr 21 12:27:23 SVR kernel: CPU: 7 PID: 2039505 Comm: ffmpeg Tainted: P           O       6.5.13-5-pve #1
Apr 21 12:27:23 SVR kernel: Hardware name: Intel(R) Client Systems NUC11TNKi5/NUC11TNBi5, BIOS TNTGL357.0064.2022.0217.1550 02/17/2022
Apr 21 12:27:23 SVR kernel: RIP: 0010:0xffffffff51fede60
Apr 21 12:27:23 SVR kernel: Code: Unable to access opcode bytes at 0xffffffff51fede36.
Apr 21 12:27:23 SVR kernel: RSP: 0000:ffffa31ae6dafc80 EFLAGS: 00010202
Apr 21 12:27:23 SVR kernel: RAX: 00000000ffffffff RBX: ffffa31ae6dafca0 RCX: 0000000000000002
Apr 21 12:27:23 SVR kernel: RDX: 000000000000c90f RSI: ffffa31ae6dafd11 RDI: ffffa31ae6dafca0
Apr 21 12:27:23 SVR kernel: RBP: ffffa31ae6dafd40 R08: 0000000000000000 R09: 0000000000000000
Apr 21 12:27:23 SVR kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffffa31ae6dafca0
Apr 21 12:27:23 SVR kernel: R13: ffffa31ae6dafd50 R14: 0000000000000000 R15: 0000000000000000
Apr 21 12:27:23 SVR kernel: FS:  0000743a3baa38c0(0000) GS:ffff93d9505c0000(0000) knlGS:0000000000000000
Apr 21 12:27:23 SVR kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Apr 21 12:27:23 SVR kernel: CR2: ffffffff51fede36 CR3: 0000000638d42004 CR4: 0000000000772ee0
Apr 21 12:27:23 SVR kernel: PKRU: 55555554
Apr 21 12:27:23 SVR kernel: Call Trace:
Apr 21 12:27:23 SVR kernel:  <TASK>
Apr 21 12:27:23 SVR kernel:  ? show_regs+0x6d/0x80
Apr 21 12:27:23 SVR kernel:  ? __die+0x24/0x80
Apr 21 12:27:23 SVR kernel:  ? page_fault_oops+0x176/0x500
Apr 21 12:27:23 SVR kernel:  ? kernelmode_fixup_or_oops+0xb2/0x140
Apr 21 12:27:23 SVR kernel:  ? __bad_area_nosemaphore+0x1a5/0x280
Apr 21 12:27:23 SVR kernel:  ? bad_area_nosemaphore+0x16/0x30
Apr 21 12:27:23 SVR kernel:  ? do_kern_addr_fault+0x7b/0xa0
Apr 21 12:27:23 SVR kernel:  ? exc_page_fault+0x10d/0x1b0
Apr 21 12:27:23 SVR kernel:  ? asm_exc_page_fault+0x27/0x30
Apr 21 12:27:23 SVR kernel:  ? insn_decode+0x20/0x90
Apr 21 12:27:23 SVR kernel:  ? get_kernel_gp_address+0xab/0x130
Apr 21 12:27:23 SVR kernel:  exc_general_protection+0x283/0x460
Apr 21 12:27:23 SVR kernel:  asm_exc_general_protection+0x27/0x30
Apr 21 12:27:23 SVR kernel: RIP: 0010:unhandled_signal+0x2e/0x80
Apr 21 12:27:23 SVR kernel: Code: 00 55 83 ee 01 83 bf 9c 09 00 00 01 b8 01 00 00 00 48 89 e5 74 1a 48 63 f6 31 c0 48 83 c6 01 48 c1 e6 05 48 03 b7 f8 0b 00 00 <48> 83 3e 01 76 0c 5d 31 d2 31 f6 31 ff c3 cc cc cc cc 48 8b 17 83
Apr 21 12:27:23 SVR kernel: RSP: 0000:ffffa31ae6dafea0 EFLAGS: 00010282
Apr 21 12:27:23 SVR kernel: RAX: 0000000000000000 RBX: ffffa31ae6daff58 RCX: 0000000000000001
Apr 21 12:27:23 SVR kernel: RDX: 0000000000000000 RSI: f0ff93d1cc2e1a20 RDI: ffff93d385fe2000
Apr 21 12:27:23 SVR kernel: RBP: ffffa31ae6dafea0 R08: 0000000000000000 R09: 0000000000000000
Apr 21 12:27:23 SVR kernel: R10: 0000000000000000 R11: 0000000000000000 R12: 0000000000000000
Apr 21 12:27:23 SVR kernel: R13: 0000000000000000 R14: ffff93d385fe2000 R15: 0000000000000000
Apr 21 12:27:23 SVR kernel:  exc_general_protection+0x37c/0x460
Apr 21 12:27:23 SVR kernel:  asm_exc_general_protection+0x27/0x30
Apr 21 12:27:23 SVR kernel: RIP: 0033:0x5a205add29dc
Apr 21 12:27:23 SVR kernel: Code: 41 5f c3 66 66 2e 0f 1f 84 00 00 00 00 00 e9 7b c5 bb 00 66 66 2e 0f 1f 84 00 00 00 00 00 48 8b 47 18 48 8d 50 01 48 89 57 18 <40> 88 30 48 8b 57 18 48 3b 57 20 73 07 c3 66 0f 1f 44 00 00 53 48
Apr 21 12:27:23 SVR kernel: RSP: 002b:00007fff82ef6e48 EFLAGS: 00010206
Apr 21 12:27:23 SVR kernel: RAX: 2d005a20637cf991 RBX: 0000000000000711 RCX: 00000000ae4400b5
Apr 21 12:27:23 SVR kernel: RDX: 2d005a20637cf992 RSI: 0000000000000000 RDI: 00005a20633f3800
Apr 21 12:27:23 SVR kernel: RBP: 00005a20633f3800 R08: 00005a20634418a5 R09: 00005a2063441194
Apr 21 12:27:23 SVR kernel: R10: 0000000000001400 R11: 00007fff82ef7290 R12: 00005a20633f3800
Apr 21 12:27:23 SVR kernel: R13: 00005a20634418a5 R14: 0000000000000000 R15: 0000000000000711
Apr 21 12:27:23 SVR kernel:  </TASK>
Apr 21 12:27:23 SVR kernel: Modules linked in: dummy tcp_diag inet_diag nf_conntrack_netlink xt_nat xt_tcpudp xt_conntrack nft_chain_nat xt_MASQUERADE nf_nat nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 xfrm_user xfrm_algo xt_addrtype nft_compat overlay veth ebtable_filter ebtables ip_set ip6table_raw iptable_raw ip6table_filter ip6_tables iptable_filter bpfilter sctp ip6_udp_tunnel udp_tunnel nf_tables bonding tls softdog sunrpc nfnetlink_log nfnetlink binfmt_misc intel_rapl_msr intel_rapl_common x86_pkg_temp_thermal intel_powerclamp snd_hda_codec_hdmi coretemp snd_sof_pci_intel_tgl snd_sof_intel_hda_common iwlmvm soundwire_intel kvm_intel snd_sof_intel_hda_mlink soundwire_cadence snd_sof_intel_hda mac80211 kvm snd_sof_pci snd_sof_xtensa_dsp irqbypass libarc4 crct10dif_pclmul polyval_clmulni snd_sof polyval_generic ghash_clmulni_intel snd_sof_utils sha256_ssse3 snd_soc_hdac_hda i915 sha1_ssse3 snd_hda_ext_core aesni_intel snd_soc_acpi_intel_match snd_soc_acpi crypto_simd soundwire_generic_allocation cryptd soundwire_bus snd_soc_core
Apr 21 12:27:23 SVR kernel:  snd_compress ac97_bus snd_pcm_dmaengine btusb btrtl snd_hda_intel tps6598x mei_hdcp snd_intel_dspcfg btbcm typec mei_pxp snd_intel_sdw_acpi btintel btmtk drm_buddy snd_hda_codec rapl snd_hda_core ttm bluetooth drm_display_helper iwlwifi cmdlinepart snd_hwdep cec snd_pcm spi_nor rc_core ecdh_generic intel_cstate cdc_acm pcspkr wmi_bmof snd_timer mtd drm_kms_helper ecc cfg80211 ee1004 mei_me snd soundcore mei i2c_algo_bit igen6_edac serial_multi_instantiate acpi_tad acpi_pad mac_hid zfs(PO) spl(O) vhost_net vhost vhost_iotlb tap drm efi_pstore dmi_sysfs ip_tables x_tables autofs4 btrfs blake2b_generic xor raid6_pq simplefb dm_thin_pool dm_persistent_data dm_bio_prison dm_bufio libcrc32c nvme xhci_pci intel_lpss_pci crc32_pclmul xhci_pci_renesas igc video intel_lpss ahci i2c_i801 nvme_core thunderbolt i2c_smbus spi_intel_pci xhci_hcd spi_intel libahci idma64 nvme_common wmi pinctrl_tigerlake
Apr 21 12:27:23 SVR kernel: CR2: ffffffff51fede60
Apr 21 12:27:23 SVR kernel: ---[ end trace 0000000000000000 ]---
Apr 21 12:27:23 SVR kernel: RIP: 0010:0xffffffff51fede60
Apr 21 12:27:23 SVR kernel: Code: Unable to access opcode bytes at 0xffffffff51fede36.
Apr 21 12:27:23 SVR kernel: RSP: 0000:ffffa31ae6dafc80 EFLAGS: 00010202
Apr 21 12:27:23 SVR kernel: RAX: 00000000ffffffff RBX: ffffa31ae6dafca0 RCX: 0000000000000002
Apr 21 12:27:23 SVR kernel: RDX: 000000000000c90f RSI: ffffa31ae6dafd11 RDI: ffffa31ae6dafca0
Apr 21 12:27:23 SVR kernel: RBP: ffffa31ae6dafd40 R08: 0000000000000000 R09: 0000000000000000
Apr 21 12:27:23 SVR kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffffa31ae6dafca0
Apr 21 12:27:23 SVR kernel: R13: ffffa31ae6dafd50 R14: 0000000000000000 R15: 0000000000000000
Apr 21 12:27:23 SVR kernel: FS:  0000743a3baa38c0(0000) GS:ffff93d9505c0000(0000) knlGS:0000000000000000
Apr 21 12:27:23 SVR kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Apr 21 12:27:23 SVR kernel: CR2: ffffffff51fede36 CR3: 0000000638d42004 CR4: 0000000000772ee0
Apr 21 12:27:23 SVR kernel: PKRU: 55555554
Apr 21 12:27:23 SVR kernel: note: ffmpeg[2039505] exited with irqs di

il y a ca qui me dérrange, je cherche sur internet ce que ca veut dire

Apr 21 12:27:23 SVR kernel: BUG: unable to handle page fault for address: ffffffff51fede60
Apr 21 12:27:23 SVR kernel: #PF: supervisor instruction fetch in kernel mode
Apr 21 12:27:23 SVR kernel: #PF: error_code(0x0010) - not-present page

j’ai trouvé ca :

Bonjour

1- Lorsque tu mets un extrait d’un log, peux tu mettre le nom du log et la commande utilisée pour extraire l’extrait.

2- log

Apr 21 12:27:23 SVR kernel: BUG: unable to handle page fault for address: ffffffff51fede60

Le kernel a rencontré une erreur sur la page de mémoire virtuelle à l’adresse.

3- Dans l’extrait affiché :

Cette ligne fait apparaître : ffmpeg est un framework qui traite les flux multimédia comme les flux vidéos.ffmpeg Tainted = ffmpeg corrompu. Et je vois que tu utilises Frigate en container lxc. Le traitement de flux vidéo est gourmand en ressource 50,2% du CPU d’après ta copie d’écran, peux tu confirmer que c’est permanent. Arrête cette VM pour l’instant.

4- Peux tu mettre le petit script que je t’ai fourni pour connaitre l’heure du plantage. Ce qui permettra de se repérer plus facilement dans les journaux.

5- as tu redémarré ton NUC après avoir mis le dongle dummy hdmi?

6- as tu regardé si il existe une nouvelle version du bios et le changelog de cette nouvelle version, la mise a jour n’est pas obligatoire quand tout fonctionne bien. Mais comme j’ai aussi des plantés une fois par mois je fais la MAJ du Bios.

Bonjour

Ha! j’oubliais peux tu nous décrire les autres containers que tu as en fonctionnement et les plugins utilisés sous Jeedom.

Cordialement.

Citation
1- Lorsque tu mets un extrait d’un log, peux tu mettre le nom du log et la commande utilisée pour extraire l’extrait.

le log je l’ai trouvé ici :

Citation
Cette ligne fait apparaître : ffmpeg est un framework qui traite les flux multimédia comme les flux vidéos.ffmpeg Tainted = ffmpeg corrompu. Et je vois que tu utilises Frigate en container lxc. Le traitement de flux vidéo est gourmand en ressource 50,2% du CPU d’après ta copie d’écran, peux tu confirmer que c’est permanent. Arrête cette VM pour l’instant.

lors des 1er plantage je l’avais désactivé, mais ca planté pareil.
Frigate utilise peu de ressource.
mais bon je désactive ok

Citation
4- Peux tu mettre le petit script que je t’ai fourni pour connaitre l’heure du plantage. Ce qui permettra de se repérer plus facilement dans les journaux.

je n’avais pas réussi je re teste.

Citation
5- as tu redémarré ton NUC après avoir mis le dongle dummy hdmi?

Oui

Citation
6- as tu regardé si il existe une nouvelle version du bios et le changelog de cette nouvelle version, la mise a jour n’est pas obligatoire quand tout fonctionne bien. Mais comme j’ai aussi des plantés une fois par mois je fais la MAJ du Bios.

Je n’ai pas encore cherché.

Sur la copie d’écran je vois du docker.

Il faut installer le moins de chose possible sur le système Proxmox, le kernel est spécifique à Proxmox.
Le docker tu peux l’installer dans une VM. Sur le Proxmox j’ai installé des petits utilitaires htop et mc et c’est tout. Le reste doit être géré dans des containers ou VM.

50,2% c’est beaucoup.

Ce que tu dit c’est qu’il faut mettre portainer sur VM et non du docker?
Les lxc c’est juste pour des petites applications ?

Non, si tu as mis docker sur un container c’est ok.

Oui frigate est dans portainer sur un lxc.

Pourquoi installé le moins possible sur proxmox?