¿Cuál es el próximo salto gigante en términos de interfaz de usuario?

Asistentes personales virtuales que responden a la entrada de voz en lenguaje natural. Sé que este no es un problema simple de resolver y tiene algunas dificultades muy obvias con las que lidiar, pero escúchame …

El concepto no es nuevo, obviamente, Siri parece estar abriendo nuevos caminos en esta área porque sus nuevas características únicas destacan por qué los intentos anteriores no han funcionado, no han funcionado bien o han fracasado. Siri tampoco está allí todavía, pero parece estar en el camino correcto y es muy probable que se trate del primer asistente virtual genuino y completamente funcional.

Siri muestra que no se trata solo de la entrada de voz (más adelante sobre ese problema en particular), emitir comandos fijos y proporcionar un conjunto principal de funciones útiles (Iniciar Excel, Apagar, etc.). El asistente debe poder comprender el contexto y tener acceso a una gran cantidad de servicios a nivel local (en el dispositivo) y en la web, y debe poder hacer preguntas, aprender y crecer.

El trabajo principal de un asistente virtual es eliminar muchas de las cosas tediosas que tenemos que hacer actualmente para lograr un resultado final, actualmente con nuestras manos a través del tacto, el teclado o el mouse. Por ejemplo, cuando creamos accesos directos para evitar tener que profundizar en un sistema de archivos o para acceder a una aplicación o función de uso común, estamos haciendo algo similar: estamos eliminando pasos tediosos. Solo con un asistente virtual no tiene que crear el acceso directo en primer lugar. El punto importante aquí es que, independientemente de los excelentes accesos directos, la mayoría de los usuarios no los usan ni los comprenden, incluso los usuarios que usan marcadores en un navegador consideran que los accesos directos del sistema operativo son demasiado complejos o difíciles de usar (aunque en realidad no lo son) . El menú de Inicio de Microsoft o el programa Apple Spotlight intentan ayudarlo a acceder a accesos directos a funciones comunes desde un lugar, en la búsqueda de archivos y aplicaciones, y funcionan bien, pero no están exentos de defectos, los usuarios aún luchan con la sobrecarga de La información presentada no permite la entrada difusa y, a veces, es más esfuerzo de lo que vale la pena en comparación con tocar un solo icono.

El asistente virtual ES el atajo.

El argumento de que existen demasiadas barreras, de si los usuarios estarán dispuestos a operar sus dispositivos de esta manera indiscreta (todo lo que haga se anunciará públicamente al mundo) no significa que no tendrá éxito o no funcionará . Muchas personas son adversas a hablar con sus computadoras, pero creo que esto es por dos razones muy diferentes pero aparentemente válidas.

En primer lugar, el reconocimiento de voz se ve como un truco porque la percepción general es que no funciona muy bien. No importa lo bueno que prometa ser, no queremos ponernos en una situación en la que le pedimos seriamente a una computadora que haga algo (especialmente cuando otros puedan oírnos) y por la posibilidad de que no seamos comprendidos. Entonces, NUESTRO problema se debe solucionar, por lo general, al tener que repetirnos más despacio y con claridad, y posiblemente al tener que cancelar cualquier error que haya causado el malentendido original. Nos hace ver estúpidos cuando sale mal y requiere más esfuerzo.

En segundo lugar, no queremos tener que anunciar públicamente cada acción que realizamos. El uso de un teléfono inteligente o una computadora tradicionalmente implica relacionarse con el sistema de manera íntima y, a menudo, discreta, generalmente por buenas razones. La entrada de voz sopla que sale del agua. ¿Dónde está la privacidad?

Entonces, la pregunta es: ¿qué tan bien debe ser la entrada de voz y qué tan inteligente es el asistente antes de que la primera barrera ya no sea un problema? ¿Estamos cerca de tener un sistema que funcione lo suficientemente bien, incluso cuando estamos solos, en los que podemos confiar que no nos hará sentir como tontos cada vez que lo usamos? Por lo que hemos visto de Siri, incluso en forma beta, eso ya no es un problema.

Pero ¿qué pasa con la privacidad? ¿Realmente queremos explicar todo lo que hacemos en una computadora para que todos lo escuchen? Tampoco se trata de nuestra propia privacidad, ¿por qué molestar a las personas que nos rodean con nuestros comandos inane? La respuesta a esa pregunta es la misma razón por la que todavía tenemos un teclado incluso después de que se inventó el mouse. No usamos las teclas de cursor cuando podemos usar un mouse, y no usamos un mouse para tocar las teclas en un teclado virtual. La herramienta adecuada para el trabajo correcto. La entrada de voz no reemplaza al mouse o al teclado (real o virtual), los complementa. Use la entrada de voz solo cuando pueda o necesite, cuando esté solo o fuera del alcance del oído o cuando no importe si los demás escuchan. El punto es que la entrada de voz es solo otra forma de entrada, pero combinada con el procesamiento del lenguaje natural y la inteligencia artificial, los beneficios en muchos casos son impresionantes y serán difíciles de ignorar cuando surjan las oportunidades de usarla.

Por lo tanto, dada la opción de interactuar con su computadora para reservar un vuelo con éxito respondiendo a solicitudes sencillas, pasará de la nada a un vuelo completamente reservado en unos pocos momentos (incluida la selección de criterios específicos, el pago y la adición de recordatorios del calendario) con un mínimo de mano. – coordinación de ojos, en comparación con el método más lento actual de teclado y mouse / entrada táctil en un sitio web o aplicación, ¿qué le parece más fácil y finalmente prefiere hacer?

Personalmente creo que hace que esos momentos, como cuando salga de la casa y camine hacia el auto, sean oportunidades fértiles para hacer las cosas. ¿Y adivina quién nos recordará hacer estas tareas cuando surjan las oportunidades?

Dependerá mucho de lo que la gente quiera (tanto lo que los financiadores de I + D quieren financiar como lo que los consumidores quieren pagar, que están conectados, por supuesto). Pero todavía hay algunas oportunidades interesantes en el gesto, el lenguaje natural y posiblemente la mirada. No estoy seguro de si cuenta como una interfaz de usuario, pero las innovaciones realmente interesantes pueden provenir no de nuevas formas de ejecutar comandos, sino de formas nuevas y menos sobrecargadas de recibir información.

Muchas compañías parecen estar produciendo videos de conceptos futuros de aspecto brillante (como los recopilados en http: //emotouchscreenfuture.tumb …) en este momento. Lo que tienen en común es una obsesión con las pantallas. El problema con las pantallas es que todas compiten por un tipo de atención: la atención visual. Dada la cantidad de trabajo que realizan las empresas de tecnología creativa en este momento para encontrar formas mejores, más inteligentes y más sencillas de encontrar y presentar los patrones en grandes volúmenes de datos que sean más relevantes para los usuarios, espero ver un poco más de variedad. e ingenio en las formas en que accedemos a esa información. (Vea los escenarios encantadores en http://berglondon.com/blog/2010/… , por ejemplo). Así que busque cualquiera de las interfaces que le permitan ver más, más simplemente, a la vez (en lugar de dedicarle más tiempo a mirar más pantallas), o interfaces que no necesitan ser vistas (o que deben ser vistas menos).

Acabo de leer un artículo fascinante que trata esta pregunta:

http://worrydream.com/ABriefRant

La próxima vez que prepare el desayuno, preste atención a la coreografía exquisitamente intrincada de abrir los armarios y verter la leche. Observe cómo se mueven sus extremidades en el espacio, cómo utiliza su peso y equilibrio sin esfuerzo. La única razón por la que su mente no explota todas las mañanas a partir de la increíble belleza de su logro balético es que todos los demás en el mundo también pueden hacer esto.
Con un cuerpo entero a tus órdenes, ¿crees seriamente que el futuro de la interacción debería ser un solo dedo? [Imagen del dedo desplazando un iPhone]