El teclado da paso a la voz en la empresa
En qué medida podría servir la voz para mejorar los procesos productivos en las empresas? Esa es la pregunta que se hicieron Philips y Scansoft, las dos multinacionales que venden programas de reconocimiento vocal en España. Estas aplicaciones permiten prescindir del teclado, grabar cualquier conversación o discurso, pasarlo por un diccionario con un alto porcentaje de acierto y trabajar con ella en formato de texto o de audio casi en tiempo real.
Philips, centrada en servicios para empresas, tiene dos proyectos en marcha para los servicios de radiología del Hospital Virgen del Rocío (Sevilla) y para las clínicas de la multinacional de servicios sanitarios USP. Javier Viver, director regional de Philips en España, señala que el 20% de los radiólogos en España utiliza este sistema que permite trabajar en red. 'El médico dicta el texto en su PC que se escribe a la vez y él mismo lo corrige y le da validez' o conectado al servidor, 'que permite dictar en el PC o en cualquier dispositivo digital, enviar el archivo de audio a corregir a una tercera empresa o al personal administrativo, que disponga de una base de diccionarios técnicos médicos' declara Viver.
Manuel Medrano, jefe de Radiodiagnóstico del Hospital Universitario Virgen del Rocío, asegura que desde este mes tienen 25 puestos con reconocimiento de voz conectados a un servidor (antes tan sólo tenían tres licencias) y que los 42 radiólogos del servicio están encantados con el programa.
Acceso permanente
'Hemos eliminado burocracia, al no tener que depender de personal administrativo o de terceras personas para validar el diagnóstico, puesto que el informe sobre la prueba radiológica puede colgarse o ser impreso por cualquier persona desde cualquier punto del hospital en el mismo momento en que se cuelga en la intranet'.
El jefe de servicio dice que el Hospital está en conversaciones para extender el servicio a otras especialidades, 'aunque para ello habrá que cargar o realizar los diccionarios técnicos'. Según Medrano, la realización del diccionario para su departamento tardó más de seis meses en los que se transcribieron un gran número de informes con tres equipos.
Por su parte, Scansoft también trabaja en un proyecto piloto para los servicios de Radiología y Anatomía Patológica del Hospital Carlos Haya (Málaga) y otro para el reconocimiento de voz para discapacitados físicos o sensoriales, aunque como reconoce Miguel Gómez, director general de Scansoft España, el negocio con mayor crecimiento a corto plazo es el de la tecnología ASR (reconocimiento automático de voz), generalmente identificada como un contestador que guía al cliente para la compra y reserva de billetes, directorios de teléfonos o búsqueda de pedidos. 'Uno de los últimos contratos lo firmamos con la empresa de óptica Essilor para que sus proveedores realizaran sus pedidos; el sistema tiene cargado un diccionario básico muy técnico, que permite discernir entre las palabras más utilizadas en el sector, mientras que las que no reconoce, las descarta'.
Gómez reconoce que el verdadero salto se producirá con la introducción de sistemas de búsqueda GPS en los coches o de control en los electrodomésticos, que se dirijan mediante comandos de voz. Entre los últimos clientes de la multinacional belga destaca el último contrato firmado para el servicio de atención al cliente de Vodafone o el soporte para las Páginas Blancas y Amarillas de Portugal.
Hasta un 99% de acierto
Una de las impulsoras de esta tecnología es la consultora española Speech Recognition Ware (SWR), con sede en Bruselas, que ha conseguido introducir una mejora en el motor DragonNaturally Speaking de Scansoft. Esta aplicación, que le ha valido varios contratos para los servicios de traducción de la Comisión Europea y de Naciones Unidas, permite, según Jesús María Boccio, fundador de la compañía, 'grabar en cualquier soporte digital, enviarlo a través del teléfono o de la red y mejorar desde el 94% inicial de acierto hasta el 99% con tan sólo dos horas de entrenamiento'. El programa está indicado para las secretarias y el teletrabajo, ya que puede corregir sin que la persona que ha grabado esté delante. 'Se reproduce el archivo y con la ayuda de un pedal USB se puede ir parando y reanudando la grabación y a la vez mejorando su perfil de acierto'. Boccio realizó recientemente en Madrid un par de demostraciones ante un grupo de directivos de bufetes de abogados, seguros y banca, sus principales clientes potenciales.