Bonjour à tous,
Un sujet pour demander des retour d’expérience sur les wakeword custom pour snowboy sur rhasspy.
Je n’ai pas trouvé des masse d’info, que ce soit ici ou sur le community de rhasspy. Je pense que c’est très lié à la langue, du coup j’ouvre ici.
=> J’ai testé quelques truc grâce à l’excellent travail de kiboost et notamment l’outil Snowboy-CustomMaker, RPI3B+ , respeaker2 et install Docker.
Je me suis mis dans la pièce qu’on appelle « dressing » chez moi pour les enregistrement, qui est un amoncellement des vêtements de la famille, donc pas loin d’une chambre anéchoïque!!
On a testé quelques mots :
-
« Hey Basile » : bien reconnus, mais un nombre de faux positifs pas croyable, un motard qui passe en mettant la poignée dans le coin, et ça réveille rhasspy. Parfois même un envoi TTS complètement anodin le réveil, et si je baisse la sensibilité suffisamment, impossible de le reconnaître.
-
« Hey Barnabé » : bien reconnus, mais plein de faux positif dès que musique ou TV
-
« Conchita » (voilà comment ma femme voit la domotique!) : difficile à reconnaître, même avec une sensibilité assez haute, mais pas de faux positifs au moins
-
« Dagobert » : le dernier en date => bien reconnu, zéro faux positif, si bien que j’ai élevé la sensibilité, et qui a arrêté la chute inexorable du WAF devant les faux positif.
J’ai l’impression qu’il faut que les syllabes attaquent : ds dagobert, la première monte, et la seconde descend avec une attaque franche, et la troisième ne meurt pas dans un decrescendo (comme basile, ou le « L » tombe sur un « e » presque muet).
J’ai eu des pbs également avec les expression en 2 mots (« Hey » « quelquechose »), la durée de la pause entre les 2 est super sensible pour la reconnaissance, et pas toujours facile à répliquer au quotidien
J’enfonce probablement des portes ouvertes, mais pas facile de trouver un bon mot.
Tout avis ou exemple est le bienvenu!