GPT-5 pode chegar neste verão como uma atualização “materialmente melhor” para ChatGPT

Quando a OpenAI lançou seu modelo GPT-4 AI há um ano, criou uma onda de imenso entusiasmo e pânico existencial devido à sua capacidade de imitar a comunicação e composição humana. Desde então, a maior questão em IA permanece a mesma: quando o GPT-5 será lançado? Durante entrevistas e aparições na mídia em todo o mundo, Sam Altman, CEO da OpenAI, frequentemente ouve essa pergunta, e ele geralmente dá uma resposta tímida ou evasivaàs vezes associado a promessas de coisas incríveis que estão por vir.

De acordo com um novo relatório da Insider de negócios, espera-se que a OpenAI lance o GPT-5, uma versão melhorada do modelo de linguagem de IA que alimenta o ChatGPT, em meados de 2024 – e provavelmente durante o verão. Duas fontes anônimas familiarizadas com a empresa revelaram que alguns clientes corporativos receberam recentemente demonstrações do GPT-5 e melhorias relacionadas ao ChatGPT.

Um CEO que viu recentemente uma versão do GPT-5 descreveu-o como “muito bom” e “materialmente melhor”, com a OpenAI demonstrando o novo modelo usando casos de uso e dados exclusivos de sua empresa. O CEO também sugeriu outras capacidades não lançadas do modelo, como a capacidade de lançar agentes de IA que estão sendo desenvolvidos pela OpenAI para executar tarefas automaticamente.

Perguntamos aos representantes da OpenAI sobre a data de lançamento do GPT-5 e o relatório do Business Insider. Eles responderam que não tinham nenhum comentário específico, mas incluíram um trecho de uma transcrição do livro de Altman. aparição recente no podcast Lex Fridman.

Lex Fridman (01:06:13) Então, quando o GPT-5 será lançado novamente?
Sam Altman(01:06:15) Não sei. Essa é a resposta honesta.
Lex Fridman (01:06:18) Ah, essa é a resposta honesta. Pisque duas vezes se for este ano.
Sam Altman(01:06:30) Lançaremos um novo modelo incrível este ano. Não sei como vamos chamá-lo.
Lex Fridman (01:06:36) Então isso leva à questão de como liberamos essa coisa?
Sam Altman(01:06:41) Lançaremos nos próximos meses muitas coisas diferentes. Eu acho que seria muito legal. Acho que antes de falarmos sobre um modelo semelhante ao GPT-5 chamado assim, ou não chamado assim, ou um pouco pior ou um pouco melhor do que você esperaria de um GPT-5, acho que temos muitos outras coisas importantes para liberar primeiro.

Nesta conversa, Altman parece sugerir que a empresa está preparada para lançar um grande modelo de IA este ano, mas se será chamado de “GPT-5” ou será considerado uma grande atualização para o GPT-4 Turbo (ou talvez uma atualização incremental como GPT-4.5) está no ar.

Como seu antecessor, espera-se que o GPT-5 (ou como será chamado) seja um modelo multimodal de linguagem grande (LLM) que pode aceitar texto ou entrada visual codificada (chamada de “prompt”). E como o GPT-4, o GPT-5 será um modelo de previsão do próximo token, o que significa que ele produzirá sua melhor estimativa do próximo token mais provável (um fragmento de uma palavra) em uma sequência, o que permite tarefas como como completar uma frase ou escrever um código. Quando configurados de uma maneira específica, os modelos GPT podem potencializar aplicativos de chatbot conversacionais como o ChatGPT.

A OpenAI lançou o GPT-4 em março de 2023 como uma atualização de seu antecessor mais importante, o GPT-3, que surgiu em 2020 (com o GPT-3.5 chegando no final de 2022). Em novembro passado, a OpenAI lançou o GPT-4 Turbo, que reduziu drasticamente os custos de inferência (execução) do melhor modelo de IA da OpenAI, mas foi atormentado por acusações de “preguiça”, onde o modelo às vezes se recusa a responder a solicitações ou concluir projetos de codificação conforme solicitado. A OpenAI tentou corrigir o problema da preguiça várias vezes.

LLMs como os desenvolvidos pela OpenAI são treinados em enormes conjuntos de dados extraídos da Internet e licenciado por empresas de mídia, permitindo que eles respondam às solicitações do usuário de maneira humana. Porém, a qualidade da informação fornecida pelo modelo pode variar dependendo dos dados de treinamento utilizados, e também com base na tendência do modelo em confabular informações. Se o GPT-5 puder melhorar a generalização (sua capacidade de realizar novas tarefas) e ao mesmo tempo reduzir o que é comumente chamado de “alucinações” na indústria, provavelmente representará um avanço notável para a empresa.

De acordo com o relatório, a OpenAI ainda está treinando o GPT-5 e, após a conclusão, o modelo passará por testes internos de segurança e mais “red teaming” para identificar e resolver quaisquer problemas antes de seu lançamento público. A data de lançamento pode ser adiada dependendo da duração do processo de testes de segurança.

É claro que as fontes do relatório podem estar erradas e o GPT-5 pode ser lançado mais tarde por motivos que não sejam testes. Portanto, considere isso um forte boato, mas esta é a primeira vez que vemos uma possível data de lançamento do GPT-5 de uma fonte confiável. Além disso, sabemos agora que o GPT-5 está completo o suficiente para ser testado, o que significa que seu principal treinamento provavelmente está concluído. Provavelmente ocorrerão mais refinamentos.

Alguma coisa pode impedir Jensen Huang da Nvidia?

EUA de volta à Lua, com pouso difícil para a primeira nave do setor privado

Leave a Comment Cancel reply