A OpenAI lançou nesta terça-feira (5) dois novos modelos de inteligência artificial (IA) de uso livre. Batizados de gpt-oss-120b e gpt-oss-20b, eles já estão disponíveis para download no Hugging Face.
E o detalhe que chama atenção é que essas IAs são as primeiras “abertas” da empresa desde o GPT-2.
📦 O que tem de novo?
A versão mais robusta, o gpt-oss-120b, pode rodar com uma única GPU Nvidia. A menor, o gpt-oss-20b, roda até em laptops com 16GB de memória.
Na prática, isso permite que desenvolvedores usem os modelos em tarefas locais e, quando necessário, conectem a modelos mais completos da OpenAI na nuvem, como o GPT-4, para resolver funções mais complexas, como entender imagens.
Essa arquitetura híbrida, que combina autonomia local com suporte em nuvem, é vuma forma de tornar os modelos mais versáteis e acessíveis para testes e customizações.
🏁 Corrida aberta contra China e Meta
A OpenAI tem sido criticada por manter grande parte de sua tecnologia fechada. Sam Altman, CEO da empresa, chegou a admitir em janeiro que a empresa “ficou do lado errado da história”.
Enquanto isso, laboratórios chineses como DeepSeek, Qwen (Alibaba) e Moonshot AI ganharam espaço com modelos abertos de alto desempenho.
⚔️ Testes, benchmarks e… alucinações?
Os modelos gpt-oss se saíram bem em testes de raciocínio, como o Codeforces, superando modelos populares da DeepSeek.
Mas ainda estão atrás dos modelos fechados da própria OpenAI, como o o3 e o o4-mini.
Outro ponto é que os novos modelos alucinam bastante. No benchmark PersonQA, que testa o conhecimento sobre pessoas reais, o gpt-oss-120b errou em 49% das respostas, três vezes mais do que o modelo o1.
A empresa reconhece o problema e atribui a taxa de erro ao fato de modelos menores carregarem menos “conhecimento de mundo”.
🧪 Como foram treinados?
Ambos os modelos usam a técnica Mixture of Experts (MoE), que ativa só uma parte dos parâmetros por pergunta. Isso ajuda a economizar processamento, mesmo com a enorme quantidade de parâmetros disponíveis.
Além disso, passaram por treinamento com reforço por aprendizado (RL), o mesmo processo usado na linha fechada da OpenAI, permitindo que o modelo siga raciocínios mais longos e interaja com ferramentas externas, como buscas na web ou execução de código.
Mas é importante que você saiba que eles são apenas de texto. Nada de imagens ou áudios como nos modelos multimodais da empresa.
🔓 E dá para usar comercialmente?
Sim. Os dois modelos estão sob a licença Apache 2.0, uma das mais permissivas. Sendo assim, empresas podem monetizar soluções baseadas neles sem pagar royalties ou pedir permissão à OpenAI.
Mas o código de treinamento dos modelos não será publicado, o que limita a transparência total. A decisão se apoia nas disputas judiciais em andamento que questionam o uso de obras protegidas por direitos autorais em bases de treino de inteligência artificial.
🧬 IA de uso livre é realmente segura?
A OpenAI fez testes para avaliar se criminosos poderiam adaptar os modelos para fins perigosos, como ciberataques ou criação de armas biológicas. O resultado, segundo a empresa, é que os riscos não atingem o limite de alta periculosidade.
📌 Leia também:
Google lança IA que cria mundos 3D com memória visual
Tesla é condenada a pagar US$ 243 mi por acidente fatal
Neuralink testa chip para ajudar cegos a enxergar com inteligência artificial
Fique por dentro das notícias mais quentes do mundo: entre no nosso canal no WhatsApp.