O produto que escolhemos como destaque é o SLN-LOCAL-IOT Solution da NXP, fornecido pela Mouser Electronics. A solução NXP Semiconductors SLN-LOCAL2-IOT para controle de voz local aproveita o processador cruzado i.MX RT106S, permitindo que os desenvolvedores adicionem recursos de assistente de voz aos seus produtos de forma rápida e fácil. O SLN-LOCAL2-IOT apresenta um design de referência com custo otimizado e SDK pronto para produção, minimizando o tempo de lançamento no mercado, além do risco e o esforço de desenvolvimento.
Esta solução de voz local de segunda geração inclui uma ferramenta baseada em PC que permite aos desenvolvedores criar modelos de fala para mais de 100 comandos personalizados e várias palavras de ativação de entrada de texto com suporte para mais de 40 idiomas e dialetos diferentes. A solução SLN-LOCAL2-IOT visa aplicativos de voz off-line, abordando as questões de privacidade associadas a assistentes de voz baseados em nuvem.
A solução SLN-LOCAL2-IOT da NXP Semiconductors permite que os fabricantes de dispositivos integrem um assistente de voz offline em uma ampla variedade de casas inteligentes, aparelhos inteligentes, edifícios inteligentes e produtos industriais inteligentes.
Mais informações podem ser obtidas no site da Mouser Electronics em: https://br.mouser.com/new/nxp-semiconductors/nxp-sln-local2-iot-development-kit/
Na figura 1 temos o aspecto do dispositivo.
Um factsheet pode ser acessado em: https://br.mouser.com/pdfDocs/IMXRT106LLVCFS.pdf
O PROCESSADOR
- O i.MX RT106S é um EdgeReady membro da família i.MX RT1060 de MCUs crossover, visando aplicações offline de assistente de voz local incorporado a formulários. Possui implementação do Arm® Cortex®-M7 , que opera em velocidades de 600 MHz para fornecer alto desempenho a CPU e resposta em tempo real. O processador i.MX RT106S é licenciado para executar o assistente de voz turnkey do NXP - soluções de software, que incluem:
• Reconhecimento de fala baseado em fonema
- Aprendizado de máquina com ferramenta de modelagem baseada em PC
• Front-end de áudio de aprendizado de máquina para voz de campo distante
- Filtragem baseada em aprendizagem profunda e beamforming
- Cancelamento do Eco acústico
• Processamento de reprodução
• Codecs, media player / streamer
• MQTT, lwIP, TLS (opcional)
• Construído em FreeRTOS e AWS IoT Core
• Todos os drivers de hardware, incluindo Wi-Fi (opcional) e Bluetooth® (opcional)
• Compatível com MCUXpresso SDK, IDE e ferramentas de configuração
Na figura 2 temos um projeto de referência dado em blocos.