
¡Y seguimos con las patentes de Apple! La compañía ha solicitado una nueva a la oficina de patentes y marcas de los EE.UU. en la que se describe un sistema de reconocimiento de voz y conversión de texto a voz diseñado para funcionar en entornos ruidosos basado en hardware que ampliaría notablemente las características actuales de control por voz presentes en el iPhone.
La patente describe los problemas de mantener una conversación telefónica cuando alguno de los implicados se encuentra en un lugar ruidoso (como un restaurante atestado de gente) o realizando alguna actividad que le impide hablar (como encontrarse en mitad de una reunión o en el cine disfrutando de una película). Actualmente nos limitaríamos a gritar (normalmente haciendo que la señal llegue aún más distorsionada) o a susurrar (poniendo las cosas igualmente difíciles en el otro extremo).
La solución de Apple ofrece diferentes alternativas entre las que destaca, la conversión de texto a voz en cualquier punto de la conversación, de modo que mientras que uno seguiría hablando normalmente, el otro recibiría una transcripción de sus palabras en la pantalla del iPhone a las que podría responder escribiendo mensajes de texto.

Una segunda patente relacionada indirectamente con la anterior, revela una versión mejorada del sistema por el cual rechazamos una llamada entrante en el que además del actual botón para contestar, aparecerían opciones para dirigir la llamada automáticamente a nuestro buzón de voz o para rechazarla. En este último caso, manteniendo pulsado el botón de colgar se desplegarían varias posibles respuestas que se enviarían a la otra persona en la que le daríamos un motivo: reunión, cine, conduciendo…
Sin duda, dos patentes muy interesantes que esperemos lleguen rápidamente a iOS. La primera en particular tiene un enorme número de aplicaciones que incluyen un mejor acceso universal permitiendo una comunicación telefónica más fluida con personas con discapacidades auditivas o del habla y, en un futuro, una posible puerta a la traducción simultánea automática.
Ayer mismo os hablábamos de las nuevas voces de Mac OS X Lion creadas por Nuance, una compañía especializada en el reconocimiento de voz e imágenes responsable de aplicaciones como Dragon Dictation, y pocos días atrás nos hacíamos eco de los últimos rumores acerca de los posibles frutos que la relación entre estas dos empresas podría dar en iOS 5. Crucemos los dedos para que la WWDC 2011 nos traiga más novedades en este sentido el próximo 6 de junio.
Vía | Patently Apple



Comentarios
Siento que no tenga que ver con esta entrada.... ¿pero por qué habeis eliminado el post de los fondos de Lion?
http://www.applesfera.com/mac-os/los-nuevos-fondos-de-escritorio-de-mac-os-x-lion
¿? El post sigue ahí, no se ha eliminado.
Ahora si lo veo, esta mañana me lié a buscarlo y no aparecía en la página principal ni en la segunda página, tal vez haya sido algún fallo o algo.
Gracias, saludos.
Me parece muy bien que avancen en esta dirección. Esperemos que no se sigan olvidando de los cientos de millones de hispanohablantes... (Que pongan el diccionario sólo en Inglés me parece una pena).
La diferencia está en si esos cientos de millones de hispanohablantes son, también, consumidores de tal producto.
A lo que voy es a que destinarán esfuerzos si el mercado lo compensa. No es una cuestión de exclusión o solidaridad, sino de rentabilidad. Como cualquier otra empresa, vamos.
"...de modo que mientras que uno seguiría hablando normalmente, el otro recibiría una transcripción de sus palabras en la pantalla del iPhone a las que podría responder escribiendo mensajes de texto" ----> Vale, pero el que está en un ambiente ruidoso y recibe la llamada en modo texto seguiría teniendo que gritar para hacerse entender y el otro recibiría el ruido ambiente etc... o sea no sirve de mucho! XDD
Es que precisamente es lo opuesto. El que está en el ambiente ruidoso es el que lee los mensajes transcritos a partir de la voz del que está al otro lado de la línea, respondiéndole mediante mensajes de texto que a su vez pueden convertirse a voz (evidentemente sin ruido ya que es digital).
Vale, ahora lo entiendo. Pero sigue sin convencerme; El hecho de que al menos uno de los dos tenga que teclear el texto, ralentizará mucho la conversación (es una conversación telefónica, no lo olvidemos...)
Sí, que de esta foma te siguen robando el dinero. Es una llamada.
Y no es más fácil usar el Whatsapp?
Touché
Es una patente, en principio para que otros no lo hagan, y si lo hacen amenazar con abogados, como de costumbre.
El actual reconocimiento por voz es una pena, a si que a nada que lo mejoren podrán decir que han hecho un gran trabajo.
-- editado por última vez a las 16:58
No acabo de entender como te ayuda el reconocimiento de voz en una situación en la que no puedes hablar..
Escribir un comentario
Para hacer un comentario es necesario que te identifiques: ENTRA o conéctate con FacebookConnect