Máquinas que ven más allá del texto escrito
Crece el número de empresas que analizan el lenguaje automáticamente.
Los asistentes robóticos Siri de Apple o Cortana de Microsoft son un ejemplo del desarrollo del lenguaje natural, una tecnología que pretende convertir a las máquinas en auténticos hablantes, que entiendan y hablen el lenguaje humano.
En todo el mundo, en particular en España, empiezan a aparecer empresas dedicadas a esta tecnología, emparentada con la inteligencia artificial.
Las aplicaciones no siempre son tan espectaculares como un robot que habla: analizar textos en busca de emociones o las redes sociales en busca de tendencias invisibles para el ojo humano puede ser más útil.
A nivel mundial tiene cada vez más repercusión e interés. Intel acaba de comprar Saffron, una startup dedicada a la computación cognitiva que realiza funciones similares a Watson, de IBM, capaz de describir la personalidad del autor de un texto.
Los programas pueden rastrear el ‘sentimiento’ producido por una marca en las redes sociales
Facebook está probando un asistente virtual con humanos en la sombra, capaz de responder preguntas más complejas. Y Google ha creado su propio asistente, Google Now.
En España destacan las empresas Bitext y Daedalus o la startup Sisu Labs, que con su producto Sento detecta automáticamente el sentimiento provocado por una marca o persona, extrae ideas clave y clasifica los mensajes según el tema, intuye tendencias en la conversación, identifica usuarios relevantes y otras métricas útiles para los clientes de empresas, como la aseguradora Fiatc, y de sectores del marketing, gran consumo o farmacéutico.
Todo ello “en tiempo real”, apunta Jennifer Woodard, cofundadora y directora de Sisu Labs, con sede en Barcelona. Su empresa, que emplea a siete personas, surgió en el CRIC (Centre de Recerca i Innovació de Catalunya), de titularidad privada. “Llevamos seis años de investigación y dos como empresa”, explica Woodard.
Sisu Labs también trabaja con la estadounidense Pandora, la herramienta web que emite música personalizada según los gustos del usuario, y con cuerpos de policía, “no de España”, para detectar anomalías de seguridad civil en conversaciones de redes sociales.
La empresa Taiger tiene dos productos estrella: iConverse, un asistente virtual inteligente, con capacidades conversacionales, e iSearch, un buscador empresarial que permite encontrar documentos que dan respuesta a las necesidades de información de los empleados.
Taiger ha trabajado con firmas como Santander, Vodafone, Endesa, Repsol o Red.es, y con la filial del fabricante de discos de Sony, en EE UU. “Actualmente contamos con cuatro patentes y, en breve, registraremos cinco nuevos avances”, señala su fundador, Sinuhé Arroyo.
“Las empresas españolas gozan de muy buena reputación en el exterior”, afirma Luis Alfonso Ureña, presidente de la Sociedad Española para el Procesamiento del Lenguaje Natural, y que dirige su propio grupo, Sinai, en la Universidad de Jaén.
Por ahora, dice, la falta de demanda de productos mantiene a las compañías españolas del sector en unas dimensiones reducidas, pero algunas ya han abierto oficinas en América. “Hay una buena oportunidad por la existencia de un amplio mercado potencial para productos en español. Además del gran mercado latinoamericano, las estadísticas confirman el creciente aumento de hispanohablantes en EE UU”.
El origen de la mayoría de los grupos es la universidad. “No se decide de un día para otro dedicarse a esto”, dice Woodard. “Existe una barrera de entrada de conocimiento científico y técnico en nuestro caso”. Hay más de 30 grupos de investigación universitarios, que han creado al menos nueve spin-offs, con experiencia en las cuatro lenguas oficiales del Estado, y el inglés, especialmente.
Dail Software, nacida en la Universidad Politécnica de Madrid, trabaja también en ruso, francés y japonés. En un año ha conseguido 563.000 euros en dos rondas de financiación para el desarrollo de su proyecto estrella: un servicio de correo electrónico que detecta de forma automática, con gran calidad, si el lenguaje utilizado no es excesivamente rebuscado.
Uno de sus productos principales es Tesaurvai, que crea tesauros (diccionarios). Sus herramientas permiten, por ejemplo, comparar los programas electorales de los partidos o rastrear las redes sociales en busca de eufemismos sobre la bulimia.
Un plan de 90 millones en cinco años
El Gobierno ha diseñado el Plan de Impulso de las Tecnologías del Lenguaje, que invertirá 90 millones de euros en cinco años. El objetivo es aprovechar “el elevado nivel investigador de la industria del lenguaje en nuestro país, que contrasta con una cantidad enorme de información no estructurada y sin explotar que generan Administración, empresas y organizaciones”.
El plan se centrará sobre todo en la sanidad (herramientas multilenguaje para españoles desplazados y extranjeros en España), la educación online y el turismo (traducción automática, seguimiento de opiniones en redes sociales).
Guillem García, director científico de Sisu Labs, opina que el proyecto ayudará a internacionalizar empresas como la suya y a crear consorcios público-privados. Arroyo, de Taiger, recuerda que la pública Enisa, que apoya a las pymes, ayudó en su primer proyecto Imserso, de búsqueda semántica en la web para facilitar su uso a personas mayores.