Ayer, Publicación comercial de Silicon Valley La información lanzada Titvun programa de noticias de transmisión en vivo. Para su primer episodio, la fundadora de la compañía, Jessica Lessin, entrevistó a Mark Zuckerberg sobre sus recientes intentos de contratar ejecutivos de IA de otras compañías por grandes sumas de dinero.

Sin embargo, es imposible decir lo que realmente sucedió en la entrevista, porque hubo problemas de audio con la transmisión en vivo: el segmento de Zuckerberg estaba completamente en silencio, dándonos un minuto y 50 segundos de video de la cara de Zuckerberg que se movía sin salir.

En las últimas semanas, sin embargo, Zuckerberg realmente ha aumentado su retórica sobre la «superinteligencia», lanzando cientos de millones de dólares en investigadores de IA en intentos de contratarlos en meta, y comenzar a trabajar en centros de datos masivos alrededor del país para alimentar su IA. Zuckerberg y Meta han hablado sin cesar sobre la IA como un cambio de juego, mientras que no pueden o no desean mantener la información errónea generada por la IA y se despliegan fuera de las plataformas meta.

https://www.youtube.com/watch?v=f2cz4igs0oa

Mientras tanto, ha habido una mayor discusión sobre el posible poder de usar IA para periodismoque hemos escrito extensamente. Vi la entrevista silenciosa con Zuckerberg como una oportunidad para ver las increíbles habilidades de la IA de Meta y probar Herramientas de IA en una tarea Algunos de ellos supuestamente son buenas—Reciendo labios. Si estas tecnologías funcionaron tan bien como sus creadores han prometido, es posible proporcionar al mundo información de la entrevista perdida de Mark Zuckerberg.

Así es como fue mi experimento.

Debido a que Zuckerberg obviamente estaba hablando de Meta Ai, pensé que probaría su herramienta primero. Tomé un video de la entrevista y le pedí a Meta Ai que lo leyera para decirlo para decirme lo que estaban diciendo:

«¡Me encantaría ayudar! Sin embargo, soy una IA basada en texto y no tengo la capacidad de los videos de lectura visualmente de labios», dijo Meta Ai. Luego sugirió que «encuentre un lector de labios profesional o un servicio de transcripción que se especialice en videos de lectura de labios» o «utilice un software automatizado de lectura de labios».

Luego intenté subir imágenes fijas para ver si Meta AI podría analizarlas:

Cuando subí imágenes adicionales, Meta AI tampoco pudo proporcionar información sobre lo que se decía.

Luego fui a chatgpt, porque Zuckerberg es Según se informa, ofreciendo paquetes de pago de hasta $ 300 millones a los empleados de OpenAi para que vengan a trabajar en Meta. Subí el video 1:50 y ChatGPT me dijo: «El procesamiento de video tardó demasiado y se agotó». Luego subí un clip de 25 segundos y me dijo: «El sistema todavía se agota mientras intenta extraer marcos». Luego le pedí que hiciera los primeros cinco segundos y dijo «incluso con el clip más corto y el alcance más pequeño (primeros 5 segundos), el sistema se agotó». Luego pedí que extraiga un solo cuadro, y dijo: «Parece que el sistema actualmente no puede extraer ni un solo cuadro del archivo de video». Chatgpt me pidió que tomara una captura de pantalla de Zuckerberg. Lo envié esto:

Y ChatGPT dijo que «la persona parece estar produciendo un sonido como ‘F’ o ‘V’ (como en ‘Video’ o ‘Muy’)», pero que «Posiblemente ‘M’ o ‘B’, dependiendo de la siguiente moción». Luego compartí los 10 cuadros alrededor de esa captura de pantalla única, y ChatGPT dijo «Después de analizar de cerca la progresión de las formas de los labios y el movimiento facial», la «frase probable de lectura de labios» fue «Esta es la versión». Luego subí 10 cuadros más y decía la «frase completa hasta ahora (alta confianza): ‘Esta versión es justa'».



Source link

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí