OpenAI libera dois modelos de IA gratuitos para download

OpenAI libera dois modelos de IA gratuitos para download
Imagem destaque: Pexels/ Andrew Neel

A OpenAI lançou nesta terça-feira (5) dois novos modelos de inteligência artificial (IA) de uso livre. Batizados de gpt-oss-120b e gpt-oss-20b, eles já estão disponíveis para download no Hugging Face.

E o detalhe que chama atenção é que essas IAs são as primeiras “abertas” da empresa desde o GPT-2.

📦 O que tem de novo?

A versão mais robusta, o gpt-oss-120b, pode rodar com uma única GPU Nvidia. A menor, o gpt-oss-20b, roda até em laptops com 16GB de memória.

Na prática, isso permite que desenvolvedores usem os modelos em tarefas locais e, quando necessário, conectem a modelos mais completos da OpenAI na nuvem, como o GPT-4, para resolver funções mais complexas, como entender imagens.

Essa arquitetura híbrida, que combina autonomia local com suporte em nuvem, é vuma forma de tornar os modelos mais versáteis e acessíveis para testes e customizações.

🏁 Corrida aberta contra China e Meta

A OpenAI tem sido criticada por manter grande parte de sua tecnologia fechada. Sam Altman, CEO da empresa, chegou a admitir em janeiro que a empresa “ficou do lado errado da história”.

Enquanto isso, laboratórios chineses como DeepSeek, Qwen (Alibaba) e Moonshot AI ganharam espaço com modelos abertos de alto desempenho.

⚔️ Testes, benchmarks e… alucinações?

Os modelos gpt-oss se saíram bem em testes de raciocínio, como o Codeforces, superando modelos populares da DeepSeek.

Mas ainda estão atrás dos modelos fechados da própria OpenAI, como o o3 e o o4-mini.

Outro ponto é que os novos modelos alucinam bastante. No benchmark PersonQA, que testa o conhecimento sobre pessoas reais, o gpt-oss-120b errou em 49% das respostas, três vezes mais do que o modelo o1.

A empresa reconhece o problema e atribui a taxa de erro ao fato de modelos menores carregarem menos “conhecimento de mundo”.

🧪 Como foram treinados?

Ambos os modelos usam a técnica Mixture of Experts (MoE), que ativa só uma parte dos parâmetros por pergunta. Isso ajuda a economizar processamento, mesmo com a enorme quantidade de parâmetros disponíveis.

Além disso, passaram por treinamento com reforço por aprendizado (RL), o mesmo processo usado na linha fechada da OpenAI, permitindo que o modelo siga raciocínios mais longos e interaja com ferramentas externas, como buscas na web ou execução de código.

Mas é importante que você saiba que eles são apenas de texto. Nada de imagens ou áudios como nos modelos multimodais da empresa.

🔓 E dá para usar comercialmente?

Sim. Os dois modelos estão sob a licença Apache 2.0, uma das mais permissivas. Sendo assim, empresas podem monetizar soluções baseadas neles sem pagar royalties ou pedir permissão à OpenAI.

Mas o código de treinamento dos modelos não será publicado, o que limita a transparência total. A decisão se apoia nas disputas judiciais em andamento que questionam o uso de obras protegidas por direitos autorais em bases de treino de inteligência artificial.

🧬 IA de uso livre é realmente segura?

A OpenAI fez testes para avaliar se criminosos poderiam adaptar os modelos para fins perigosos, como ciberataques ou criação de armas biológicas. O resultado, segundo a empresa, é que os riscos não atingem o limite de alta periculosidade.

📌 Leia também:

Google lança IA que cria mundos 3D com memória visual

Tesla é condenada a pagar US$ 243 mi por acidente fatal

Neuralink testa chip para ajudar cegos a enxergar com inteligência artificial

Fique por dentro das notícias mais quentes do mundo: entre no nosso canal no WhatsApp.

Deixe seu comentário: