Openai nghi ngờ rằng các mô hình AI Deepseek của Trung Quốc, rẻ hơn đáng kể so với các đối tác phương Tây, có thể đã được đào tạo bằng cách sử dụng dữ liệu OpenAI. Sự tiết lộ này, sau khi giảm mạnh cổ phiếu khổng lồ của Nvidia, đã được Donald Trump gọi là "lời cảnh tỉnh" cho ngành công nghệ công nghệ Hoa Kỳ bởi Donald Trump.
Mô hình R1 của Deepseek, được xây dựng trên Deepseek-V3 nguồn mở, tự hào có chi phí đào tạo thấp hơn đáng kể (ước tính khoảng 6 triệu đô la) và các yêu cầu tính toán so với các mô hình phương Tây như Chatgpt. Mặc dù tuyên bố này đang bị tranh cãi, nó đã thúc đẩy các nhà đầu tư lo ngại về hàng tỷ người được đầu tư vào AI bởi những người khổng lồ công nghệ Mỹ, gây ra suy thoái thị trường ảnh hưởng đến các công ty như Nvidia, Microsoft, Meta, Alphabet và Dell. Ứng dụng của Deepseek thậm chí đã đứng đầu các biểu đồ tải xuống của Hoa Kỳ giữa những tranh cãi.
Openai và Microsoft đang điều tra xem liệu Deepseek có vi phạm các điều khoản dịch vụ của Openai hay không bằng cách sử dụng "chưng cất", một kỹ thuật trích xuất dữ liệu từ các mô hình lớn hơn, có khả năng sử dụng API của Openai. Openai thừa nhận rằng các công ty Trung Quốc thường cố gắng tái tạo các mô hình AI hàng đầu của Hoa Kỳ và đang hợp tác với chính phủ Hoa Kỳ để bảo vệ tài sản trí tuệ của mình.
David Sacks, AI của Tổng thống Trump, ủng hộ tuyên bố rằng Deepseek đã sử dụng chưng cất dữ liệu từ các mô hình Openai. Ông dự đoán các biện pháp tiếp theo từ việc lãnh đạo các công ty AI để ngăn chặn các thực tiễn đó.
Tình huống nêu bật một sự trớ trêu đáng kể: Openai, bản thân bị cáo buộc sử dụng nội dung internet có bản quyền để đào tạo Chats, hiện đang phản đối các hành động bị cáo buộc của Deepseek. Sự giả hình này đã được ghi nhận rộng rãi trên phương tiện truyền thông xã hội. Openai trước đây đã lập luận với House of Lords của Vương quốc Anh rằng đào tạo các mô hình ngôn ngữ lớn mà không có tài liệu có bản quyền là không thể, một vị trí được nhấn mạnh thêm bởi các vụ kiện đang diễn ra từ New York Times và 17 tác giả cáo buộc vi phạm bản quyền. Những vụ kiện này, cùng với phán quyết của Văn phòng Bản quyền Hoa Kỳ năm 2018 chống lại bản quyền nghệ thuật do AI tạo ra, nêu bật bối cảnh pháp lý phức tạp xung quanh dữ liệu đào tạo AI.