Saturday , 20 May 2024
Tecnología

Su modelo no solo es poderoso y libre, sino que ha costado mucho menos – Tinta clara

  • agosto 6, 2025
  • 0

Operai lanzó ayer sus primeros modelos con pesas abiertas desde 2019: GPT-OSS-120B y GPT-OSS-20B. Dos sistemas de razonamiento que marcan un cambio radical en la estrategia de la

Su modelo no solo es poderoso y libre, sino que ha costado mucho menos

 – Tinta clara

Operai lanzó ayer sus primeros modelos con pesas abiertas desde 2019: GPT-OSS-120B y GPT-OSS-20B. Dos sistemas de razonamiento que marcan un cambio radical en la estrategia de la compañía después del éxito de Deepseek R1 a principios de año.

¿Por qué es importante?. Operai ha pasado de defender la seguridad de los modelos cerrados para reconocer que «estaba en el lado equivocado de la historia» con modelos abiertos. El terremoto que causó Speedseek en enero los obligó a repensar toda su estrategia.

El contexto. Hasta ahora, Operai había mantenido todos sus modelos cerrados de GPT-2, justificándolo por razones de seguridad. Pero los rivales como objetivo con las empresas de llama y especialmente chinas con Depseek, Qwen y Kimi han ganado terreno en el ecosistema abierto.

El punto de inflexión se produjo cuando Depseek R1 demostró que era posible crear modelos de razonamiento avanzados con una fracción del costo de los estadounidenses. Sam Altman luego admitió que OpenAi necesitaba «encontrar una estrategia de código abierto diferente». Y aquí está.

En figuras:

  • El modelo principal, GPT-OSS-120BFunciona con un solo GPU de 80 GB con solo 5,100 millones de parámetros activos de su total de 117,000 millones.
  • Su hermano pequeño, GPT-OSS-20BSe puede ejecutar en una computadora portátil con 16 GB de memoria (aunque la velocidad parece ser muy lenta con dicha configuración, en ausencia que podamos probarlo más a fondo).

La situación actual. El Puntos de referencia independiente Colocan GPT-OSS-20B con una puntuación de 58 en el índice de inteligenciasuperando a O3-Mini pero está por debajo de O3 y O4-Mini.

En tareas de programación competitiva, alcanza 2622 puntos en CodeForcs, mientras que Depseek R1 logra menos puntaje con un modelo mucho más pesado.

En detalle. La arquitectura utiliza un sistema de mezcla de expertos (Moe, Mezcla de expertos) que activa solo una fracción de los parámetros totales para cada consulta. Esto permite que el modelo de parámetros de 120,000 millones active solo el 4.4% en cada consulta, mientras que los 20,000 millones activan el 17.2%.

Ambos modelos mantienen la capacidad de razonamiento de la cadena sin supervisión directa, siguiendo el principio de que el razonamiento visible es necesario para detectar comportamientos indebidos.

Si, pero. Operai no ha realizado datos de capacitación pública, manteniendo parte del secreto. Tampoco incluye capacidades multimodales, limitadas solo al texto.

  • Las alucinaciones son significativamente más altas que en sus propios modelos: 49% y 53% respectivamente en comparación con el 16% de O1.

Entre líneas. Este lanzamiento responde tanto a la presión competitiva china como a la nueva administración Trump, que ha instado a las compañías estadounidenses a liberar más tecnología para «promover la adopción global de alineados con los valores estadounidenses».

La compañía ha trabajado con socios como Orange, Snowflake y AI Suecia para casos de uso real, buscando validar si las ventajas justifican continuar invirtiendo en modelos abiertos.

Profundizar. Los modelos están disponibles bajo la licencia Apache 2.0 en plataformas como Cara abrazadacon soporte nativo en herramientas como Ollama, LM Studio y Servicios Nube de los principales proveedores. Operai ha organizado un desafío de equipo de red con $ 500,000 en premios para identificar riesgos de seguridad.

Esta es la respuesta de OpenAI a su momento profundo: reconocer que la innovación abierta no solo es inevitable, sino necesaria para mantenerse competitivo en un panorama donde el costo y la accesibilidad importan tanto como el rendimiento.

En | La paradoja GPT-5: OpenAi necesita el mayor salto en la historia de la IA justo cuando parece más imposible

Imagen excepcional | Solen FeyissabDima solominia