OpenAI soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, peuvent avoir été formés à l'aide de données OpenAI. Cette révélation, associée à la popularité rapide de Deepseek, a déclenché un ralentissement boursier pour les principaux acteurs de l'IA. Nvidia a subi sa plus grande perte d'une journée en histoire, tandis que Microsoft, Meta, Alphabet et Dell ont également subi des baisses importantes.
Le modèle R1 de Deepseek, basé sur l'open source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport aux modèles occidentaux. Bien que cette réclamation soit contestée, elle met en évidence la rentabilité potentielle du développement alternatif de l'IA, des investisseurs troublants.
OpenAI et Microsoft examinent si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant la «distillation», une technique de formation des modèles d'IA utilisant des données de modèles plus grands. OpenAI a confirmé sa conscience de telles tentatives de chinois et d'autres sociétés de reproduire la technologie de l'IA en tête et a déclaré qu'elle prenait des contre-mesures pour protéger sa propriété intellectuelle. David Sacks, le tsar de l'IA du président Donald Trump, soutient cette affirmation, suggérant que les actions de Deepseek constituent la distillation des connaissances des modèles Openai.
La situation est encore compliquée par l'ironie des accusations d'Openai, étant donné les affirmations précédentes selon lesquelles la création de modèles d'IA comme Chatgpt est impossible sans utiliser de matériel protégé par le droit d'auteur. Openai a précédemment fait valoir à la Chambre des Lords du Royaume-Uni selon laquelle la formation de modèles de grands langues nécessite l'accès aux œuvres protégées par des droits d'auteur, une position faisant écho à sa défense contre un procès du New York Times pour une "utilisation illégale" de son contenu. Des poursuites similaires ont été déposées par des auteurs, mettant en évidence le débat en cours entourant les données de formation des droits d'auteur et de l'IA. La situation est encore compliquée par un bureau de droit d'auteur américain de 2018 selon lequel l'art généré par l'IA ne peut pas être protégé par le droit d'auteur, soulignant les complexités juridiques entourant le développement de l'IA et les droits de propriété intellectuelle.