Virtual Voice Computer Concepto de asistente en línea. Negocio de servicios de ayuda para el sonido de sonido de voz … [+]
En cierto modo, siempre hemos sabido que este fue el momento decisivo para la IA, cuando realmente comenzamos a conversar con estas entidades digitales, como si fueran personas reales.
En términos de la exposición de Hollywood de la vida real, las personas a menudo cita la película «ella» con Joaquin Phoenix y la voz incorpórea de Scarlett Johansson. Por supuesto, entonces, la vida luego imitó el arte con BigWigs tecnológicos tratando de usar algo similar a la voz de Johansson para equipar un LLM.
El punto es que hay algo sobre conversaciones de voz realistas que despierta nuestro sentido de familiaridad y conexión, y ahora, parece que estamos un gran paso más cerca de vivir de esta manera, donde estamos hablando con máquinas.
Hay un nuevo modelo de voz en la ciudad, y se llama Sesame. Como lo hago a menudo, obtuve mucha información sobre esta nueva tecnología de Nathaniel Whittemore en AI Daily Brief, donde cubrió el interés en esta IA conversacional.
Citado Deedy Das de Menlo Ventures Llamando a Sesame «The GP-3 Moment For Voice», Whittemore habló sobre lo que llamó una «increíble explosión» de modelos basados en la voz que suceden ahora.
«Esta es un área en la que hemos estado pensando mucho», dijo.
Señaló que el modelo de sésamo en sí es pequeño, con alrededor de mil millones de parámetros, y que también están en proceso modelos más grandes.
Algunas de las demostraciones
Whittemore nos interpretó parte de una demostración de Ethan Mollick, a quien a menudo he cubierto como una voz prominente en el análisis de IA (y alguien conectado con la comunidad del MIT).
Puedes escuchar cómo Mollick trae un cierto nivel de escepticismo a la conversación, pero lo que fue más interesante para mí fue donde se cortó el podcast, en el momento en que Mollick le pregunta a la voz de la IA que hace para ganarse la vida. A saber: este intercambio –
Mollick: «Entonces, ¿a qué te dedicas, Maya?»
Maya: «‘Vivir’ es una palabra fuerte».
Para averiguar a dónde va desde allí, navegué a la demostración de sésamo y hice una conversación con una conversación con Maya, preguntándole qué hace para ganarse la vida.
Ella quiere ver sus esfuerzos como un trabajo menos, dice, y más un «proyecto continuo».
Ella también se ofreció a ayudarme con la meditación.
Cuando se presiona, el modelo romperá la cuarta pared y le dirá que no tiene emociones humanas ni cuerpo humano. Entonces es sincero de esa manera. Pero es tan inquietantemente real, como muchos usuarios han señalado:
«Este es el primer … AGI MOME para el modo de voz AI, para mí», dice un feliz patrón, como se cita en el podcast de Whittemore. “Si este fuera el nuevo Siri o Alexa, lo trataría como un ser humano real, ya que suena muy natural. Y tenemos que recordar, este es lo peor que será ”.
«Esto es increíble», dice Murillo Periera. “La voz suena tan natural, y las respuestas son muy rápidas, tal vez demasiado rápidas. Incluso pudo pronunciar mi nombre, que es … súper genial, (a) mejor conversador que muchos humanos «.
Y luego está esto del desarrollador Adil Mania:
“Es mucho más humano que el modo de voz avanzado de Chatgpt. Claramente preferiría hablar con tal voz sobre mis problemas que con un psicólogo. Claramente preferiría practicar mi inglés con ella que una maestra o duolingo «.
Esa fuerte preferencia es algo que millones de personas podrían compartir, y luego, supondrá que esta tecnología se va a las carreras.
Otros ejemplos: uso de casos más allá de la conversación
Whittemore, al cubrir el sésamo, habla sobre modelos de voz para ventas, reclutamiento de talentos y mucho más.
Puedes ver alguna entrada adicional de Olivia Moore de A16Z Al hablar sobre modelos para recursos humanos y contratación, y otros usos.
Esencialmente, el sésamo parece estar atravesando el extraño valle, y haciéndonos sentir más como si estuviéramos hablando con una persona real cuando interactuamos con su modelo.
Y la idea de que podría ponerlos en dispositivos en el borde es bastante intrigante, por decir lo menos.
La tecnología se combina con un conjunto de gafas que le permitirían llevar a su compañero de IA elegido con usted donde quiera que vaya, y recibir comentarios sobre todo sobre su vida.
Entonces, ¿qué te parece? ¿Es esto un cambio de juego? ¿Estamos en ese momento donde tenemos que reevaluar el impacto de la IA en nuestras vidas?
Mira la demostración.







