Lar Notícias O OpenAI suspeita de dados usados ilegalmente na IA chinesa

O OpenAI suspeita de dados usados ilegalmente na IA chinesa

Autor : Aurora Feb 19,2025

Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido treinados usando dados do OpenAI. Essa revelação, após a enorme estoque da NVIDIA, foi denominada um "alerta" para a indústria de tecnologia dos EUA por Donald Trump.

O modelo R1 da DeepSeek, construído com o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) e requisitos computacionais em comparação com modelos ocidentais como o ChatGPT. Embora essa reivindicação seja contestada, ele alimentou as preocupações dos investidores sobre os bilhões investidos na IA por gigantes da tecnologia americana, causando uma desaceleração do mercado que afeta empresas como NVIDIA, Microsoft, Meta, Alphabet e Dell. O aplicativo da Deepseek chegou a liderar os gráficos de download dos EUA em meio à controvérsia.

O OpenAI e a Microsoft estão investigando se Deepseek violou os termos de serviço da OpenAI, empregando "destilação", uma técnica para extrair dados de modelos maiores, potencialmente usando a API do OpenAI. O OpenAI reconhece que as empresas chinesas freqüentemente tentam replicar os principais modelos de IA dos EUA e estão colaborando com o governo dos EUA para proteger sua propriedade intelectual.

David Sacks, Czar de AI do presidente Trump, apóia a alegação de que a Deepseek empregou a destilação de dados dos modelos Openai. Ele antecipa medidas adicionais de liderar as empresas de IA para evitar tais práticas.

A situação destaca uma ironia significativa: o Openai, acusado de utilizar conteúdo da Internet protegido por direitos autorais para treinar o ChatGPT, agora está protestando contra as supostas ações de Deepseek. Essa hipocrisia tem sido amplamente observada nas mídias sociais. O Openai argumentou anteriormente à Câmara dos Lordes do Reino Unido que o treinamento de grandes modelos de idiomas sem material protegido por direitos autorais é impossível, uma posição mais destacada pelos processos em andamento do New York Times e 17 autores alegando violação de direitos autorais. Esses processos, juntamente com um escritório de direitos autorais de direitos autorais dos EUA em 2018 contra direitos autorais de arte gerados pela IA, destacam o complexo cenário legal em torno dos dados de treinamento da IA.

Deepseek é acusado de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.

Últimos artigos

Jogos do PlayStation Plus de julho de 2025 revelados pela Sony

Para celebrar o 15.º aniversário do PlayStation Plus, a Sony revelou a lista mensal de jogos do PlayStation Plus para julho de 2025. Lançado originalmente a 29 de junho de 2010, o PlayStation Plus atinge este importante marco este verão. Num post no

by Ryan Mar 16,2026
Capcom Testou Jogo de Mundo Aberto de Resident Evil Antes de Desistir do Plano

A Capcom confirmou que explorou a possibilidade de transformar Resident Evil: Requiem num título de mundo aberto com componentes multiplayer online antes de, finalmente, mudar de direção. Num vídeo de diário de desenvolvedor, o diretor de Requiem, Ko

by Sadie Mar 16,2026