fbpx
Compartilhe

Abram alas que a OpenAI está com um novo modelo de linguagem de IA. Para suceder o GPT-4, lançado no ano passado, a empresa de Sam Altman anunciou o GPT-4o – e este “o” quer dizer “omni”. Ou seja, com seu novo modelo de inteligência artificial, a OpenAI está dobrando a sua aposta na multimodalidade, com capacidades generativas de texto, vídeo e áudio.

“O GPT-4o é capaz de pensar por meio de voz, texto e visão, e isso é incrivelmente importante, porque estamos olhando para o futuro das interações entre as máquinas e nós”, disse a CTO da OpenAI, Mira Murati, durante a apresentação da nova tecnologia.

O GPT-4 Turbo – a última versão do GPT-4 – já era capaz de analisar imagens e traduzí-las em texto. Entretanto, o GPT-4o agora também é capaz de analisar falas de forma nativa, permitindo aos usuários utilizar o ChatGPT quase como um assistente pessoal. Por exemplo, o modelo é capaz de responder em tempo real a comandos de voz, e até ser interrompido pelo usuário em meio a uma resposta, caso ela não seja a esperada.

“Sabemos que esses modelos [estão ficando] cada vez mais complexos, mas queremos que a experiência de interação se torne realmente mais natural, fácil, e que você não se concentre na UI, mas apenas na colaboração com [o modelo]”, comentou Mira.

O CEO da OpenAI, Sam Altman, também se pronunciou sobre o lançamento, afirmando que o GPT-4o é o “melhor modelo já feito” pela empresa. “É rápido, é nativamente multimodal e disponível para todos os usuários do ChatGPT. Modelos de nível GPT-4 estavam apenas disponíveis para quem pagava mensalidade, e isso é importante para nossa missão, de colocar ótimas ferramentas de IA nas mãos de todos”, afirmou Sam, em post no X.

O GPT-4o está disponível no nível gratuito do ChatGPT a partir desta segunda (13) e para assinantes dos planos premium ChatGPT Plus e Team da OpenAI com limites de mensagens “5x maiores”. Segundo a OpenAI, uma experiência de voz aprimorada sustentada pelo GPT-4o será lançada em alfa para usuários Plus nos próximos meses, junto com opções de nível enterprise com GPT-4o.

LEIA MAIS