El CEO de Open AI, Sam Altman, habla en la Cumbre Anual de Snowflake en San Francisco, California, el 02 de junio de 2025.

Justin Sullivan | Getty Images News | Getty Images

Openai lanzó el martes dos modelos de idiomas de peso abierto por primera vez desde que lanzó GPT-2 en 2019.

Los modelos de solo texto se llaman GPT-OSS-20B y GPT-OSS-20B, y están diseñados para servir como opciones de menor costo que los desarrolladores, investigadores y empresas pueden ejecutar y personalizar fácilmente, dijo OpenAI.

Un modelo de inteligencia artificial se considera de peso abierto si sus parámetros, o los elementos que mejoran sus resultados y predicciones durante la capacitación, están disponibles públicamente. Los modelos de peso abierto pueden ofrecer transparencia y control, pero son diferentes de los modelos de código abierto, cuyo código fuente completo está disponible para que las personas los usen y modifiquen.

Varias otras compañías tecnológicas, incluida Meta, Microsoft-La AI Mistral respaldada y la startup china Deepseek, también han lanzado modelos de peso abierto en los últimos años.

«Ha sido emocionante ver cómo se desarrolla un ecosistema, y estamos entusiasmados de contribuir a eso y realmente empujar la frontera y luego ver qué sucede desde allí», dijo el presidente de Operai, Greg Brockman, a los periodistas durante una sesión informativa.

La empresa colaboró con Nvidia, Micro dispositivos avanzadosCerebras y groq para garantizar que los modelos funcionen bien en una variedad de chips.

«Operai mostró al mundo lo que podría construirse en Nvidia AI, y ahora están avanzando la innovación en el software de código abierto», CEO de NVIDIA Jensen Huang dijo en un comunicado.

El lanzamiento de los modelos de peso abierto de Openai ha sido muy esperado, en parte porque la compañía retrasó repetidamente el lanzamiento.

En una publicación sobre X en julio, el CEO de OpenAI, Sam Altman, dijo que la compañía necesitaba más tiempo para «ejecutar pruebas de seguridad adicionales y revisar áreas de alto riesgo». Eso se produjo después de un puesto separado semanas antes, donde Altman dijo que los modelos no serían lanzados en junio.

Openai dijo el martes que llevó a cabo una extensa capacitación en seguridad y pruebas en sus modelos de peso abierto.

Filtró los datos químicos, biológicos, biológicos y nucleares nocivos durante la pre-entrenamiento, e imitó cómo los malos actores podrían tratar de ajustar los modelos con fines maliciosos. A través de esta prueba, OpenAi dijo que determinó que los modelos maliciosamente ajustados no podían alcanzar el umbral de «alta capacidad» en su marco de preparación, que es su método para medir y proteger contra el daño.

La compañía también trabajó con tres grupos de expertos independientes que proporcionaron comentarios sobre su evaluación maliciosa de ajuste fino, dijo OpenAI.

Operai dijo que las personas pueden descargar los pesos para GPT-OSS-120B y GPT-OSS-20B en plataformas como abrazar Face y GitHub bajo una licencia Apache 2.0. Los modelos estarán disponibles para ejecutarse en PC a través de programas como LM Studio y Ollama. Los proveedores de la nube Amazon, Baseten y Microsoft también están poniendo a disposición los modelos.

Ambos modelos pueden manejar el razonamiento avanzado, el uso de la herramienta y el procesamiento de cadena de pensamiento, y están diseñados para ejecutarse en cualquier lugar, desde hardware de consumo hasta la nube hasta aplicaciones en el dispositivo.

Los usuarios pueden ejecutar GPT-OSS-20B en una computadora portátil, por ejemplo, y usarla como un asistente personal que puede buscar en archivos y escribir, dijo OpenAI.

«Estamos entusiasmados de hacer de este modelo, el resultado de miles de millones de dólares de investigación, disponibles para el mundo para poner a la IA en manos de la mayoría de las personas posibles», dijo Altman en un comunicado el martes.

-Jordan Novet de CNBC contribuyó a este informe

No te pierdas estas ideas de CNBC Pro



Source link

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí