Rhasspy : Partage des settings

Bonjour,

Post pour partager nos settings concernant Rhasspy (Plugin @kiboost ici : [Plugin Tiers][Sujet Principal] JeeRhasspy).

Mes settings actuels :

MQTT/DISABLED
Intent Handling/remote
Wake Word/snowboy
Voice Detection/webrtcvad
Speech to Text/kaldi
Intent Recognition/fsticuffs
Text to Speech/picotts
Microphone/arecord
Sounds/aplay

Précisions et actualité :

Wake Word/snowboy

2 custom wakeword selon l’excellent taf de @kiboost ici : Snowboy-CustomMaker - Show Us - Rhasspy Voice Assistant
Sensibilité à 0.40.
Etat actuel : Encore quelques faux positifs lorsque la TV est allumée

Speech to Text/kaldi

model optimisé French indiqué par kookic ici : Training fails when i use $slotname in a sentence - #9 by kookic - Help - Rhasspy Voice Assistant
Le Français me semble mieux compris, pas mesuré, mais quasi aussi rapide que poscketsphinx. A éprouver sur quelques jours.

PS : Je suis passé de docker à venv (autre carte sd pour vérifier que c’est plus rapide selon kookic sur forum Rhasspy).

Regarde ici pour kaldi il faut prendre un language model plus light (tdn250)

Bonjour,

Merci.
J’ai aussi un retour de kookic sur forum Rhasspy me préconisant d’utiliser celui-ci orienté french :
GitHub

openpaas-ng/openpaas-sp5-kaldi-french-v1

Contribute to openpaas-ng/openpaas-sp5-kaldi-french-v1 development by creating an account on GitHub.

Il fait aussi ce commentaire : « and is good speed, and I use .env, not docker, .venv is more speed »
Je vais tester…

J’ai essayé de mettre en place le KALDI « tdn250 » mais cela à toujours été un échec.

l’installation de base de KALDI fonctionne bien avec une latence horrible mais dès que je tente de changer les fichiers comme indiqué dans le « Tips and Tricks » cela ne fonctionne plus. j’ai un message d’erreur systematique :

kaldi/model/graph/hclg.fst. did you train your profile?

Donc pour l’instant je laisse de coté…

Et tu a refait un train ?

Perso j’ai juste activé kaldi, changé les fichiers indiqué, re train et tout marche et au moins aussi vite que pocket sphinx

Oui, c’est en faisant l’entraînement que le message apparaît. J’ai un message à chaque entraînement.
Alors qu’avec l’installation d’origine tout se déroule bien.

Je suis en Docker sous Buster.

J’ai remplacé les fichier par WinSCP sous Windows en SSH. J’ai pas mal de problème de doit obligé de faire chmod régulièrement. C’est peut être là le soucis je ne me connecte jamais en root.

buster/docker aussi. J’ai un partage samba sur le rasp, j’utilise l’explorer de windows apres un chmod 755 sur le rep aussi.

Je retenterai une eme fois ce soir…

Je dois passer a coté d’un truc…

J’ai créé un fils pour ne pas poluer celui ci avec la résolution de mon probleme.

Ma config

MQTT/DISABLED
Intent Handling/remote
Wake Word/snowboy
Voice Detection/webrtcvad
Speech to Text/kaldi
Intent Recognition/fsticuffs
Text to Speech/picotts
Microphone/pyaudio
Sounds/aplay

Voilà !

Bonjour,
J’ai appliqué ce que m’a indiqué kookic ici : Training fails when i use $slotname in a sentence - #9 by kookic - Help - Rhasspy Voice Assistant
et cela fonctionne avec des temps normaux.

J’ai modifié le début du post avec des précisions sur mes settings Wake word et Speech to Text

Wake Word/snowboy

2 customwakeword selon l’excellent taf de @kiboost ici : Snowboy-CustomMaker - Show Us - Rhasspy Voice Assistant
Sensibilité à 0.40.
Etat actuel : Encore quelques faux positifs lorsque la TV est allumée

Speech to Text/kaldi

model optimisé French indiqué par kookic ici : https://community.rhasspy.org/t/training-fails-when-i-use-slotname-in-a-sentence/434/9?u=raqpub
Le Français me semble mieux compris, pas mesuré, mais quasi aussi rapide que poscketsphinx. A éprouver sur quelques jours.

PS : Je suis passé de docker à venv (autre carte sd pour vérifier que c’est plus rapide selon kookic sur forum Rhasspy).

Bonjour @kiboost,

Je me suis lancé sur une autre installation de test de la 2.5 de Rhasspy.
Pour le moment c’est ok sans le lien avec Jeedom.

Pourrais-tu partager tes settings Rhasspy, je me tâte si je repars sur les mêmes que ci-dessus ou, de par ton expérience 2.5, d’autres sont meilleurs pour la langue Française ?

Et à quoi peut servir le nodered vs Jeedom ?

Merci pour tes réponses