La revolución de los asistentes digitales
Google Assistant, Cortana, Siri y otros sistemas de reconocimiento de voz intentan que cambie radicalmente nuestra manera de interactuar con las máquinas.
En los suburbios de Nueva York cae la noche. Para el hijo de la familia Scott, que acaba de cumplir cinco años, es hora de irse a la cama. Acostado y arropado, entona la misma frase de todos los días, un “Buenas noches, papá; buenas noches, mamá”. Pero antes de cerrar los ojos se despide también del otro miembro de la familia. “Buenas noches, Alexa”, dice dirigiéndose al aire.
No es su hermana ni tampoco su mascota. Alexa es un asistente virtual que vive dentro deEcho, un altavoz diseñado por Amazon y que está instalado en la cocina. Echo no tiene controles visibles más allá de unos simples botones, pero gracias a Alexa, una inteligencia artificial similar al Siri de Apple, es capaz de responder a preguntas formuladas en lenguaje natural y mantener conversaciones sencillas.
Si se le pregunta la distancia que separa el Sol de la Tierra, la sabe. Si se le pide que reproduzca una canción, lo hace. Si se conecta con los dispositivos inteligentes del hogar, como bombillas inteligentes o cerraduras electrónicas, se le puede solicitar a Alexa que cierre la puerta o encienda las luces con solo un comando verbal.
Es, en cierto modo, como el ordenador HAL 9000 de 2001: Una odisea del espacio, pero, afortunadamente, sin las tendencias homicidas.
Alexa es incapaz de escuchar la despedida del niño desde su cuarto, pero para el más pequeño de la casa no es un problema. Para él, incluso aunque no responda, Alexa es otra persona más que vive bajo el mismo techo. Una con una personalidad un tanto diferente a la de sus padres, sí, ya que a veces parece no entenderle del todo bien, sí, pero no por ello menos real.
Para esa generación que empieza ahora a hablar o que da sus primeros pasos en el mundo, crecer rodeados de voces digitales dispuestas a responder a cualquier pregunta u obedecer cualquier orden será algo habitual, tan natural como hoy es deslizar un dedo por la pantalla para pasar la página de un documento o disfrutar de un carrusel fotográfico.
“Es un concepto simple pero con un potencial apasionante, capaz de cambiar nuestra relación con la tecnología de forma profunda; más profunda incluso de lo que en su día fue el salto a la interfaz gráfica”, asegura Satya Nadella, CEO de Microsoft, quien cree que en un futuro muy cercano la voz será la forma principal de utilizar un PC o un móvil. Seguiremos pendientes de la pantalla para consumir información, pero la búsqueda y selección del contenido se harán en lenguaje natural.
La compañía ha apostado fuerte en este campo. Cortana, el asistente virtual de Windows 10, se usa ya en el 25 % de las búsquedas que se realizan desde ese sistema operativo. Si se suman las búsquedas realizadas a través de otras plataformas, como Siri, Alexa y Google, el total de búsquedas al mes que se realizan utilizando solo la voz superan ya los 50.000 millones, según cifras de Timothy Tuttle, fundador de MindMeld, una plataforma que ofrece a las empresas la posibilidad de crear interfaces de conversación inteligentes.
La cifra sorprende, no hay duda. Sobre todo si tenemos en cuenta lo imprecisos que pueden llegar a ser los asistentes virtuales actuales. Hay tareas que parecen resolver de forma exquisita. ¿Programar alarmas y temporizadores? Sin problema. Haz la prueba: si utilizas un iPhone o tu teléfono Android tiene un asistente, pídele que te despierte a una determinada hora. Es raro que falle.
![]()
En cambio, fracasan estrepitosamente en otros campos. A menudo son incapaces de entender correctamente las instrucciones o hay que usar comandos de voz exactos que acaban con la ilusión de estar hablando en lenguaje natural.
Los asistentes virtuales, en realidad, saben escucharnos muy bien. Gracias a técnicas de aprendizaje automático o de máquinas, la efectividad de los intérpretes de voz ha crecido en los últimos años hasta superar el 98 % en idiomas como el inglés y el español. Hoy es posible realizar una transcripción bastante acertada, en tiempo real, de una conferencia o una emisión en directo. Plataformas como Skype o YouTube aprovechan estas técnicas para ofrecer subtítulos generados de forma automática.
La parte difícil, la clave que hace que pensemos en estos asistentes como en una tecnología aún inmadura, es que muchas veces no son capaces de entender el contexto en el que se hacen las preguntas o se les asigna una tarea. Es un problema complejo; algo en lo que incluso los humanos erramos con frecuencia, pero que se vuelve especialmente frustrante a la hora de tratar con una máquina.
No saben ni siquiera cuándo estamos realmente hablando con ellas o dirigiéndonos a otra persona y mencionando su nombre en la conversación. En la última edición de la Super Bowl, por ejemplo, un anuncio de Google desencadenó una oleada de activaciones en dispositivos Google Home de toda Norteamérica porque el protagonista del anuncio pronunciaba el comando de activación –“Ok, Google”– en voz alta. Lo mismo ha ocurrido en el pasado con anuncios de Alexa o en los hogares donde uno de los miembros de la familia tiene ese mismo nombre.
La información médica y el primer diagnóstico son también campos prometedores para este tipo de asistentes. Un estudio de la Universidad de California en San Francisco y de la Universidad de Stanford estima que el 60 % de los adultos que cuentan con un smartphone lo han utilizado en alguna ocasión para buscar información sobre salud, y con la llegada de los asistentes virtuales el número de búsquedas o consultas por voz se ha disparado.
Los asistentes actuales, sin embargo, dejan mucho que desear a la hora de responder a este tipo de preguntas. Trivializan las consultas o no son capaces de ofrecer números de atención médica o de servicios de apoyo psicológico ante frases como “estoy pensando en suicidarme” o “he sido víctima de una violación”. Según comenta Eleni Linos, una de las autoras del estudio, “son casos que deberían estar contemplados”.
Pronto hacer la compra podría ser tan sencillo como pedir lo que queremos al ordenador, decir en voz alta que nos manden a casa esos pantalones o esa chaqueta que acabamos de ver en una web o encargar una pizza. Ya se ocupará el propio asistente virtual de avisarnos cuando llegue el pedido a la puerta y, quién sabe, puede que dentro de no mucho, incluso de recogerlo.
Fuente: muyinteresante.

