A OpenAI lançou um recurso no ChatGPT que oferece a capacidade de analisar vídeos em tempo real. A novidade permite que os usuários utilizem as câmeras de seus smartphones para interagir com o modelo de inteligência artificial, recebendo respostas instantâneas a partir do que é capturado pela lente.
O novo modo foi batizado de “Advanced Voice Mode with Vision” e permite que seus usuários ativem a câmera e obtenham feedback em tempo real de maneira natural e interativa.

Durante os testes, o recurso mostrou capacidade de resolver problemas matemáticos, sugerir receitas culinárias, contar histórias e até engajar crianças em jogos educativos, tudo enquanto interagia visualmente com os cenários capturados.
Exclusividade para assinantes
O recurso não está disponível para todos. Apenas assinantes dos planos Plus, Team e Pro do ChatGPT, com mensalidades de US$ 20 e US$ 200, respectivamente, têm acesso ao modo avançado.
“Estamos trazendo a possibilidade de compartilhar vídeos ao vivo e até mesmo a tela do dispositivo em tempo real, tornando as interações ainda mais dinâmicas”, afirmou Kevin Weil, Chief Product Officer da OpenAI.
Competição acirrada no mercado
Um dia antes do anúncio da empresa por trás do ChatGPT, o Google apresentou o Gemini 2.0, sua nova abordagem de assistente com suporte a vídeo, disponível em testes limitados para dispositivos Android.
Além disso, a Meta está buscando espaço nesse mercado com o Meta AI, assistente que combina inteligência visual com realidade aumentada, como demonstrado em seus óculos inteligentes do Projeto Orion.
Enquanto a OpenAI se concentra na integração de vídeo e voz em uma única interface, o Google pretende ir além, prometendo assistentes com habilidades em múltiplos idiomas, integração com mapas e execução de tarefas mais complexas em tempo real.
Leia mais: OpenAI lança Modo de Voz Avançado no ChatGPT com novas vozes e melhorias em sotaques