Google lança Gemini – um poderoso modelo de IA que pode superar o GPT-4

Photo of author

By Sohaib


Prolongar / O logotipo do Google Gêmeos.

Google

Na quarta-feira, o Google anunciou Gêmeos, uma família de modelos de IA multimodal que espera rivalizar com o GPT-4 da OpenAI, que alimenta a versão paga do ChatGPT. O Google afirma que a maior versão do Gemini excede “os resultados atuais do estado da arte em 30 dos 32 benchmarks acadêmicos amplamente utilizados em pesquisa e desenvolvimento de modelos de linguagem grande (LLM).” É uma continuação do PaLM 2, um modelo anterior de IA que o Google esperava que correspondesse à capacidade do GPT-4.

Uma versão em inglês especialmente ajustada de seu modelo Gemini de nível médio é disponível agora em mais de 170 países como parte do chatbot do Google Bard, embora não na UE ou no Reino Unido devido a possíveis problemas de regulamentação.

Assim como o GPT-4, o Gemini pode lidar com vários tipos (ou “modos”) de entrada, tornando-o multimodal. Isso significa que ele pode processar texto, código, imagens e até áudio. O objetivo é criar um tipo de inteligência artificial que possa resolver problemas com precisão, dar conselhos e responder perguntas em vários campos – do mundano ao científico. O Google afirma que isso impulsionará uma nova era na computação e espera integrar totalmente a tecnologia em seus produtos.

“Os sofisticados recursos de raciocínio multimodal do Gemini 1.0 podem ajudar a compreender informações escritas e visuais complexas”, escreve o Google. “Sua notável capacidade de extrair insights de centenas de milhares de documentos por meio da leitura, filtragem e compreensão de informações ajudará a fornecer novos avanços em velocidades digitais em muitos campos, da ciência às finanças.”

O Google afirma que o Gemini estará disponível em três tamanhos: Gemini Ultra (“para tarefas altamente complexas”), Gemini Pro (“para escalar em uma ampla gama de tarefas”) e Gemini Nano (“para tarefas no dispositivo”, como Smartphone Pixel 8 Pro do Google). Cada um provavelmente está separado em complexidade pela contagem de parâmetros. Mais parâmetros significam uma rede neural maior que geralmente é mais capaz de executar tarefas mais complexas, mas requer mais poder computacional para ser executada. Isso significa que o Nano, o menor, foi projetado para rodar localmente em dispositivos de consumo, enquanto o Ultra só pode rodar em hardware de data center.

Vídeo promocional do Google Gemini do Google.

“Estes são os primeiros modelos da era Gemini e a primeira concretização da visão que tínhamos quando formamos o Google DeepMind no início deste ano”, escreveu O CEO do Google, Sundar Pichai, em um comunicado. “Esta nova era de modelos representa um dos maiores esforços científicos e de engenharia que empreendemos como empresa. Estou genuinamente entusiasmado com o que está por vir e com as oportunidades que a Gemini abrirá para as pessoas em todos os lugares.”

Embora o Gemini venha em três tamanhos, apenas o modelo de nível médio está disponível para uso público. Como mencionado acima, o Google Bard agora corre uma versão especialmente ajustada do Gemini Pro. Dos nossos testes informais até agora, o Gemini Pro parece ter um desempenho muito melhor do que a versão anterior do Bard, que era baseada no modelo de linguagem PaLM 2 do Google.

O Google também afirma que o Gemini é mais escalonável e eficiente do que seus modelos anteriores de IA quando executado em sistemas personalizados do Google. Unidades de processamento de tensores (TPU). “Em TPUs”, diz o Google, “o Gemini funciona significativamente mais rápido do que os modelos anteriores, menores e com menos capacidade”.

E é supostamente ótimo em codificação. O Google treinou uma versão especial do Gemni centrada em codificação chamada Código Alfa 2, que “é excelente na solução de problemas de programação competitivos que vão além da codificação e envolvem matemática complexa e ciência da computação teórica”, segundo o Google. Gemini também é excelente em inflar a linguagem de relações públicas do Google – se os modelos fossem menos capazes e revolucionários, o texto de marketing seria menos ofegante? É duvidoso.

Leave a Comment