Meet Simon, the Linux Speech Recognition Engine

Conoce a Simon, el motor de reconocimiento de voz de Linux

Simon para Linux es lo que Siri es para iOS. Bueno, probablemente no lo sea, pero además de que ambos tienen nombres que comienzan con una «S», ambos escuchan lo que tienes que decir. La diferencia es que Simon es mucho más controlable. Se puede entrenar completamente para reconocer comandos de voz, lo que puede ser una ayuda útil para usuarios con discapacidades o incluso para aquellos que prefieren controlar sus sistemas con la voz.

Simón es:

  • un programa de reconocimiento de voz de código abierto y reemplaza el mouse y el teclado.
  • diseñado para ser muy flexible y permite la personalización para cualquier aplicación donde se necesite reconocimiento de voz.
  • un posible proyecto europeo de “e-inclusión” debido a la programación independiente del lenguaje.
  • en desarrollo para personas con discapacidades físicas y personas mayores para darles la posibilidad de chatear, escribir correos electrónicos, navegar por Internet, realizar operaciones bancarias por Internet y mucho más.

(de simonlistens.org)

conseguir simon

Simon está escrito en Qt y depende de phonon, por lo que probablemente sea mejor instalarlo en sistemas basados ​​en KDE (plasma), a menos que no le importe que se extraigan ~300 MB de dependencias con la instalación (en un sistema Kubuntu 15.04, Simon solo ocupa 55 Mb). Simon está en los repositorios de Ubuntu, por lo que instalarlo sería tan fácil como

sudo apt-get install simon

en cualquier distribución basada en Ubuntu. En Linux Mint (o en otras distribuciones), si encuentra que Simon no puede conectarse después de la instalación, tendrá que instalar libqt4-sql-lite

sudo apt-get install libqt4-sql-sqlite

Si quieres hacer uso de Modelos acústicos HTK, también necesita instalar el HTK. Esto es opcional, y si no sabe lo que esto significa, o simplemente no necesita usarlo, puede omitirlo con seguridad. Desafortunadamente, HTK solo está disponible como código fuente, pero estas sencillas instrucciones hará que las instalaciones sean sencillas.

Simón escucha

Simon no es fácil de configurar o usar. Para ayudarlo a que lo escuche, una configuración asistida lo saluda en la primera ejecución y lo guía a través del proceso.

Primero necesitas configurar escenarios.

simon-escenarios

Los escenarios son paquetes completos que te permitirán usar Simon para propósitos específicos. También brindan lo que se conoce como un modelo de lenguaje, que describe todas las palabras existentes y qué oraciones son gramaticalmente correctas, al menos bajo las circunstancias.

Por defecto solo tiene instalado un escenario estándar. Desde esta pantalla puede crear o cargar más e incluso descargar algunos con el instalador de complementos de Simon («Abrir -> Descargar»).

simon-complementos

A continuación, necesitará un modelo acústico o de voz. Básicamente, esto le dice a Simon cómo suenan las palabras individuales.

simon-speech-model

Si tiene HTK instalado, puede crear su propio modelo y entrenar a Simon para que reconozca la forma muy específica en que habla. Si no tiene HTK o no quiere usarlo, puede descargar modelos base estáticos («Open Model -> Download») que le proporcionarán a Simon patrones acústicos predefinidos.

simon-addons-modelos

Si elige un modelo estático, puede optar por adaptarlo con muestras de entrenamiento más adelante.

En la página de configuración del servidor, si va a instalarlo localmente y planea usarlo regularmente, puede dejar las opciones predeterminadas activadas. Si el servidor está ubicado en otro lugar, aquí es donde puede definirlo.

simon-servidor

Debe configurar dispositivos de grabación y reproducción de sonido,

dispositivos-de-reproducción-de-Simon

prueba tu micrófono,

simon-mic-volumen

y ya está listo para usar Simon.

simon-pantalla-principal

Desde la pantalla principal, puede administrar sus escenarios cargados o abrir uno específico.

simon-manage-scenarois

Después de abrir un escenario, puede ver y modificar el vocabulario y la gramática, entrenar el modelo acústico, modificar la dependencia del contexto del escenario y configurar comandos directos.

simon-editar-escenario

El asistente de formación también se puede iniciar desde la pantalla de descripción general; no necesita entrar en la configuración del escenario.

simon-gestionar-entrenamiento

simon-start-training

En la pantalla de descripción general, también tiene la oportunidad de cambiar la configuración de audio (hardware) o configurar el modelo acústico (habla), incluso agregar otros nuevos.

simon-config-otro

Más ayuda para usar Simon

El uso de Simon está lejos de ser sencillo. Se necesita una buena cantidad de aprendizaje, entrenamiento y acostumbrarse. Afortunadamente, hay una documentación bastante extensa disponible en línea. los Simón escucha blog proporciona una idea, aunque las publicaciones están bastante desactualizadas (la última entrada fue de 2013). El sitio ofrece más lecturas, y puede obtener información sobre las soluciones comerciales controladas por voz impulsadas por Simon en su página web comercial.

Aunque puede tomar algún tiempo configurarlo y dominarlo, Simon puede transformar cualquier computadora Linux (e incluso Windows) en un entorno controlado por voz, ya sea por necesidades especiales o simplemente por conveniencia para lo que desea usarlo.

Experto Geek - Tu Guía en Tendencias Tecnológicas