In Home Assistant zijn de Assist-pipelines opgebouwd uit verschillende componenten die samen een stemassistent vormen. De voorwaarde om dit te kunnen gebruiken is Home Assistant Operating System, aka HA-OS.
Per onderdeel zijn er verschillende opties. Er is een spraak-naar-tekst– en tekst-naar-spraak-optie die volledig lokaal draaien.
De spraak-naar-tekst-optie is Whisper. Het is een open source AI-model dat verschillende talen ondersteunt. We gebruiken een gevorkte versie genaamd ‘faster-whisper‘. Op een Raspberry Pi 4 duurt het ongeveer 8 seconden om inkomende spraakopdrachten te verwerken. Op een Intel NUC is dit binnen een seconde gedaan.
Voor tekst-naar-spraak hebben we Piper ontwikkeld. Piper is een snel, lokaal neuraal tekst-naar-spraaksysteem dat geweldig klinkt en is geoptimaliseerd voor de Raspberry Pi 4. Het ondersteunt vele talen. Op een Raspberry Pi kan hij, met modellen van gemiddelde kwaliteit, 1,6 seconde aan stem per seconde genereren.
Installatie
Installeer via de Add-Ons zowel Whisper als Piper.
om een ‘wake-word’ te gebruiken, installeer dan ook openWakeWord
Hierna worden de add-ons ook herkend in de Integrations van Home Assistant en daar kunnen ze geconfigureerd worden.
- Whisper converts speech into text.
- Piper converts text into speech.
- Wyoming is het protocol dat door beide add-ons gebruikt wordt.
Instellen voice-assistent
Ga naar Instellingen -> Spraakassistenten en voeg een nieuwe assistent toe, bijvoorbeeld HA local met de volgende instellingen:
Nu kan de Assist voice-assistant gebruikt worden in Home Assistant.
ESP32-S3-BOX
Zie deze pagina: https://www.home-assistant.io/voice_control/s3_box_voice_assistant/