OpenAI lança o3-mini para tentar competir com o DeepSeek

OpenAI lança o3-mini para tentar competir com o DeepSeek
VietNamNet

Na última sexta-feira, a OpenAI anunciou o lançamento do modelo o3-mini, esforço para se manter competitiva no mercado de inteligência artificial (IA) após o impacto causado pela startup chinesa DeepSeek com o seu modelo R1. 

A DeepSeek chamou a atenção do universo das IAs ao oferecer um desempenho de alto nível, utilizando uma fração dos recursos computacionais necessários para alcançar tais resultados.

Em post oficial, a OpenAI disse: 

“Estamos lançando o o3-mini, o modelo mais eficiente da nossa série de raciocínio, disponível tanto no ChatGPT quanto na API a partir de hoje”. 

Diferenças do novo modelo

A empresa destacou que a tecnologia foi apresentada em dezembro de 2024 e tem o intuito de expandir os limites do que modelos pequenos podem alcançar, mantendo um custo baixo e latência reduzida, características também presentes no modelo o1-mini.

O diferencial do o3-mini está em suas capacidades de raciocínio. A linha “o” de modelos da OpenAI é especializada em tarefas complexas de lógica e resolução de problemas, contrastando com os modelos GPT, mais voltados para criatividade, como criação de textos e conversação. O o3-mini, por exemplo, não é tão bom em tarefas criativas, mas se destaca em programação e resolução de problemas matemáticos.

Disponível em três versões—baixa, média e alta—o o3-mini oferece respostas mais precisas à medida que se aumenta o uso de inferências, algo mais caro para desenvolvedores, pois eles pagam por token processado. 

Comparado ao o1-mini, o o3-mini se sai melhor em tarefas de codificação e precisão factual, embora tenha uma performance inferior em áreas de conhecimento geral e em raciocínio multilingue.

Apesar de o OpenAI o3-mini ter preços mais elevados do que o modelo R1 da DeepSeek—US$ 0,55 por milhão de tokens de entrada contra US$ 0,14 da chinesa—os preços do o3-mini são mais competitivos em comparação com o o1-mini e prometem ser mais atraentes para os usuários que buscam soluções acessíveis sem abrir mão de desempenho.

DeepSeek ainda na frente 

Nos testes de benchmark realizados pelo Decrypt, o o3-mini médio obteve uma pontuação de 79,6 no teste AIME de problemas matemáticos, ficando atrás do R1 da DeepSeek, que alcançou 79,8, mas superando o o1-mini. 

O desempenho do o3-mini também foi positivo no Codeforces, onde sua versão mais avançada ficou entre os melhores resultados.

No entanto, em tarefas que exigem raciocínio mais complexo, como um jogo de espionagem utilizando o dataset BIG-bench, o o3-mini falhou em uma das perguntas, apontando a resposta errada em uma situação que o R1 da DeepSeek resolveu corretamente. 

Por outro lado, quando se tratou de cálculos matemáticos complexos, o o3-mini se mostrou extremamente eficiente, resolvendo problemas que levariam minutos para o R1 da DeepSeek em uma fração do tempo.

Leia mais: Site Bitcoin.org competa 16 anos

Deixe seu comentário: