OpenAI diz que é “impossível” criar modelos úteis de IA sem material protegido por direitos autorais

Photo of author

By Sohaib


OpenAI

O desenvolvedor do ChatGPT, OpenAI, reconheceu recentemente a necessidade de usar material protegido por direitos autorais no desenvolvimento de ferramentas de IA como ChatGPT, O telégrafo relatórios, dizendo que seriam “impossíveis” sem ele. A declaração veio como parte de uma submissão às comunicações da Câmara dos Lordes do Reino Unido e ao inquérito do comitê selecionado digital sobre grandes modelos de linguagem.

Modelos de IA como ChatGPT e o gerador de imagens DALL-E ganham suas habilidades a partir de sessões de treinamento alimentadas, em parte, por grandes quantidades de conteúdo extraído da Internet pública sem a permissão dos detentores de direitos (no caso do OpenAI, parte do conteúdo de treinamento é licenciado, no entanto). Esse tipo de raspagem gratuita faz parte de uma tradição de longa data na pesquisa acadêmica de aprendizado de máquina, mas como os modelos de IA de aprendizado profundo se tornaram comerciais recentemente, a prática está sob intenso escrutínio.

“Como os direitos autorais hoje cobrem praticamente todo tipo de expressão humana – incluindo postagens em blogs, fotografias, postagens em fóruns, fragmentos de código de software e documentos governamentais – seria impossível treinar os principais modelos de IA da atualidade sem usar materiais protegidos por direitos autorais”, escreveu OpenAI na Câmara. da submissão do Senhor.

Além disso, a OpenAI escreve que limitar os dados de treinamento a livros e desenhos de domínio público “criados há mais de um século” não forneceria sistemas de IA que “atendam às necessidades dos cidadãos de hoje”.

Esta declaração segue uma ação movida no mês passado pelo The New York Times contra a OpenAI e a Microsoft, um investidor significativo na OpenAI, por supostamente usarem o conteúdo do jornal ilegalmente em seus produtos. OpenAI respondeu ao processo em seu site na segunda-feira, alegando que a ação carece de mérito e afirmando seu apoio ao jornalismo e às parcerias com organizações de notícias.

A defesa da OpenAI baseia-se em grande parte no princípio legal de uso justo, que permite o uso limitado de conteúdo protegido por direitos autorais sem a permissão do proprietário em circunstâncias específicas. A empresa afirma que a lei de direitos autorais não proíbe o treinamento de modelos de IA com tal material.

“Treinar modelos de IA usando materiais da Internet disponíveis publicamente é um uso justo, conforme apoiado por precedentes de longa data e amplamente aceitos”, escreveu a OpenAI em sua postagem no blog de segunda-feira. “Vemos este princípio como justo para os criadores, necessário para os inovadores e crítico para Competitividade dos EUA.”

Esta não é a primeira vez que a OpenAI reivindica o uso justo de seus dados de treinamento de IA. Em agosto, relatamos uma situação semelhante em que a OpenAI defendeu o uso de materiais disponíveis publicamente como uso justo em resposta a um processo de direitos autorais envolvendo a comediante Sarah Silverman.

A OpenAI alegou que os autores desse processo “interpretam mal[d] o âmbito dos direitos de autor, não tendo em conta as limitações e excepções (incluindo a utilização justa) que deixam espaço para inovações como os grandes modelos de linguagem que estão agora na vanguarda da inteligência artificial.”

Leave a Comment