OpenAI lanzó dos potentes modelos de IA de peso abierto, su primer lanzamiento gratuito desde GPT-2 en 2019. Los modelos gpt-oss-120b y gpt-oss-20b se pueden descargar libremente, son totalmente personalizables y lo suficientemente potentes como para rivalizar con las ofertas premium de la compañía, mientras se ejecutan completamente en su propio hardware.
Dos tamaños se ajustan a diferentes necesidades
El gpt-oss-120b más grande incluye 117 mil millones de parámetros, pero utiliza tecnología de mezcla inteligente de expertos para activar solo 5,1 mil millones por tarea, lo que le permite funcionar de manera eficiente en una sola GPU de 80 GB. Su hermano menor, gpt-oss-20b, es el verdadero cambio de juego, funciona cómodamente en cualquier portátil con 16 GB de RAM mientras ofrece un rendimiento comparable al modelo o3-mini de OpenAI.
Ambos modelos brillan en las tareas de razonamiento, pueden navegar por la web, ejecutar código Python e incluso conectarse a los modelos en la nube de OpenAI cuando necesitan capacidades adicionales como el procesamiento de imágenes.
Son esencialmente versiones mini de los modelos de razonamiento insignia de la compañía, completos con un procesamiento de cadena de pensamiento ajustable que puede subir o bajar según sus necesidades.
Funciona Prácticamente En Cualquier Lugar
Los modelos están diseñados para ser flexibles sobre dónde se ejecutan, su computadora portátil, servidores de la empresa o plataformas en la nube como Azure y AWS. OpenAI trabajó con Microsoft para obtener versiones optimizadas ejecutándose en dispositivos Windows, y ya están en vivo en Hugging Face y otras plataformas importantes.
A diferencia de las versiones totalmente de código abierto, estos modelos solo proporcionan pesos, los parámetros aprendidos que permiten la funcionalidad, al tiempo que mantienen la propiedad de los datos de entrenamiento y el código fuente. Sin embargo, los modelos admiten el razonamiento completo de la cadena de pensamiento, el uso de herramientas como la búsqueda web y la ejecución de Python, y pueden integrarse sin problemas con los servicios basados en la nube de OpenAI para tareas que requieren capacidades multimodales.
OpenAI también los sometió a algunas pruebas de seguridad serias, incluso tratando de romperlos deliberadamente para ver qué malos actores podrían lograr. Bajo la licencia Apache 2.0, los desarrolladores pueden modificarlos como quieran.
El fin del Artículo