O Google deposita suas esperanças no Gemini para ultrapassar o GPT-4

Photo of author

By Sohaib


Desbloqueie o Editor’s Digest gratuitamente

Demorou um ano, mas o Google finalmente deu uma resposta coerente ao desafio surpresa ao seu domínio na inteligência artificial que surgiu com o lançamento do ChatGPT.

O lançamento desta semana do Gemini, uma família de grandes modelos de linguagem, proporcionará uma plataforma mais forte para lutar contra a OpenAI, a empresa por trás do ChatGPT, e a Microsoft, que usou os modelos da OpenAI para turbinar todos os seus softwares e serviços em nuvem este ano.

A questão agora é se o Gemini pode fazer uma diferença significativa nos serviços existentes do Google – e, talvez ainda mais importante, se pode tornar-se uma base para uma nova gama de serviços que levam a IA muito mais profundamente para a vida quotidiana.

Com os três “sabores” do Gemini anunciados esta semana, o Google está finalmente imprimindo a sua marca numa tecnologia que os seus próprios investigadores fizeram muito para ser pioneira, mas que o ChatGPT da OpenAI levou para o mainstream. A versão Pro, por exemplo, está posicionada diretamente contra o GPT-3.5 da OpenAI, o modelo por trás da versão gratuita do ChatGPT e o carro-chefe de muitos dos primeiros aplicativos generativos de IA de outras empresas que chegaram ao mercado este ano.

O menor Gemini Nano é compatível com sistemas como a versão menor do LLaMa 2, o modelo de código aberto do Facebook, tornando-o capaz de ser executado em um dispositivo móvel. A Apple, como sempre, está adotando uma abordagem ponderada antes de trazer IA generativa para o iPhone, mas o aparecimento do Gemini no mais recente aparelho Pixel do Google é um sinal de que não pode esperar muito.

É o Gemini Ultra topo de linha, que será lançado no início do próximo ano, que carrega as principais esperanças do Google de igualar ou ultrapassar o GPT-4 da OpenAI na corrida para transformar a IA generativa em uma ferramenta diária mais útil. A empresa ficou para trás este ano, mas tem algumas vantagens claras que podem ajudar a levar a Gemini a um grande mercado em 2024.

Uma delas é a distribuição. O Google disse esta semana, por exemplo, que o Gemini será adicionado ao Chrome, que detém mais de 60% do mercado de navegadores, dando a bilhões de usuários da web acesso instantâneo a ferramentas capazes de fazer coisas como analisar o conteúdo da web. Páginas.

À medida que a Google flexibiliza o seu poder de mercado existente para impulsionar as suas ambições de IA, os reguladores da concorrência estarão atentos.

Outra vantagem para o Google é a incerteza em torno do OpenAI. Após a surpreendente demissão e reintegração do presidente-executivo Sam Altman no mês passado, as muitas empresas que construíram seus próprios planos de IA generativa com base nos modelos da OpenAI procurarão proteger suas apostas.

A empresa de busca também espera que seu chatbot Bard faça um trabalho melhor para rivalizar com o ChatGPT, agora que tem um modelo de linguagem melhor por trás dele. Mas a sua maior esperança de recuperar uma vantagem pode residir em ser o primeiro a criar os próximos serviços inovadores alimentados por IA generativa. Algumas das capacidades reivindicadas para o Gemini apontam para onde o Google pensa que elas podem estar.

Deu muita importância, por exemplo, ao facto de o Gemini ter sido concebido desde o início para ser “multimodal” – isto é, capaz de compreender não apenas texto, mas também imagens, vídeo e áudio. Segundo o Google, isso o torna mais adequado do que modelos como o GPT-4 para lidar com situações cotidianas que dependem de sentidos como visão e audição.

Isso pode ser um passo em direção a sistemas de IA mais capazes de operar no mundo real. Mas é muito cedo para dizer quais aplicações isso poderia tornar possíveis, ou se o Google realmente alcançou a superioridade técnica que afirma.

Outro caminho para o desenvolvimento reside no que o Google afirma ser a capacidade de raciocínio e planejamento do Gemini. Este é o tipo de competências que podem preparar o terreno para assistentes pessoais capazes de resolver problemas complexos e definir um plano de acção.

Se esses assistentes estiverem ligados a outros serviços Internet, também poderão tornar-se agentes, agindo em nome dos seus utilizadores. Imagine um agente de compras, por exemplo, que não apenas procura os produtos que você deseja, mas também paga por eles.

Esta já parece ser uma das principais batalhas de IA de 2024 e além. A OpenAI deu o primeiro passo nessa direção no mês passado, quando disse que seus usuários seriam capazes de construir agentes rudimentares em cima de seus modelos e depois oferecê-los para venda em uma loja de aplicativos OpenAI. Isso pode apontar para o próximo grande avanço da IA ​​além do ChatGPT – e desta vez, o Google não tem intenção de ficar para trás.

richard.waters@ft.com

Leave a Comment