jen 2017, Pékin dévoilé une feuille de route ambitieuse pour dominer le développement de l’intelligence artificielle, visant à assurer le leadership mondial d’ici 2030. D’ici 2020, le plan appelait à des « avancées emblématiques » dans l’IA pour démontrer ses progrès. Puis, fin 2022, la sortie de ChatGPT par OpenAI a pris le monde par surprise et a pris la Chine au dépourvu.
À l’époque, les principales entreprises technologiques chinoises étaient encore sous le choc d’une répression gouvernementale de 18 mois qui a amputé environ 1 000 milliards de dollars du secteur technologique chinois. Il a fallu près d’un an avant qu’une poignée de chatbots d’IA chinois ne reçoivent l’approbation du gouvernement pour leur diffusion publique. Certains se demandent si la position de la Chine en matière de censure pourrait entraver les ambitions du pays en matière d’IA. Pendant ce temps, les contrôles à l’exportation de l’administration Biden, dévoilés juste un mois avant les débuts de ChatGPT, visaient à couper la Chine des semi-conducteurs avancés essentiels à la formation de modèles d’IA à grande échelle. Sans puces de pointe, l’objectif de Pékin de suprématie de l’IA d’ici 2030 semblait de plus en plus hors de portée.
Mais aujourd’hui, une série de publications chinoises impressionnantes suggère que l’avance des États-Unis en matière d’IA a diminué. En novembre, Alibaba et développeur chinois d’IA Recherche profonde a publié des modèles de raisonnement qui, à certains égards, rivalisent avec l’o1-preview d’OpenAI. Le même mois, le géant chinois du jeu vidéo Tencent a dévoilé Hunyuan-Large, un modèle open source que le tests de l’entreprise trouvé surperformé les meilleurs modèles open source développés aux États-Unis sur plusieurs critères de référence. Puis, dans les derniers jours de 2024, DeepSeek a publié DeepSeek-v3, qui se classe désormais au premier rang parmi les IA open source dans un classement en ligne populaire et tient tête à systèmes fermés les plus performants d’OpenAI et d’Anthropic.
En savoir plus: Comment les avantages et les inconvénients de l’IA ont augmenté en 2024
Avant la sortie de DeepSeek-v3, la tendance avait déjà attiré l’attention d’Eric Schmidt, ancien PDG de Google et l’une des voix les plus influentes sur la politique américaine en matière d’IA. En mai 2024, Schmidt avait affirmé avec assurance que les États-Unis maintenaient une avance de deux à trois ans en IA« ce qui est une éternité dans mes livres. » Pourtant, en novembre, dans un parler à la Harvard Kennedy School, Schmidt avait changé d’avis. Il a cité les avancées d’Alibaba et de Tencent comme preuve que la Chine était en train de réduire l’écart. « Cela me choque », a-t-il déclaré. « Je pensais que les restrictions que nous imposions aux puces les retiendraient. »
Au-delà d’une source de prestige national, le leadership en matière d’IA aura probablement des conséquences sur l’équilibre des pouvoirs mondial. Si les agents de l’IA parviennent à automatiser une grande partie de la main-d’œuvre, ils pourraient stimuler l’économie des pays. Et les futurs systèmes, capables de diriger des armes ou de pirater des adversaires, pourraient apporter un avantage militaire décisif. Alors que les nations prises entre les deux superpuissances sont obligées de choisir entre les systèmes d’IA chinois ou américains, l’intelligence artificielle pourrait émerger comme un puissant outil d’influence mondiale. Les progrès rapides de la Chine soulèvent la question de savoir si les contrôles américains sur les exportations de semi-conducteurs suffiront à maintenir l’avantage américain.
En savoir plus: Comment Israël utilise l’IA à Gaza – et ce que cela pourrait signifier pour l’avenir de la guerre
Construire une IA plus puissante dépend de trois ingrédients essentiels : les données, les algorithmes innovants et la puissance de calcul brute, ou calcul. Les données de formation pour les grands modèles de langage tels que GPT-4o sont généralement supprimées d’Internet, ce qui signifie qu’elles sont disponibles pour les développeurs du monde entier. De même, les algorithmes, ou les nouvelles idées sur la manière d’améliorer les systèmes d’IA, franchissent facilement les frontières, car les nouvelles techniques sont souvent partagées dans les articles universitaires. Même si ce n’était pas le cas, la Chine possède une multitude de talents en IA, produisant plus de chercheurs de haut niveau en IA que les États-Unis. En revanche, les puces avancées sont incroyablement difficiles à fabriquer et, contrairement aux algorithmes ou aux données, elles constituent un bien physique qui peut être arrêté à la frontière.
La chaîne d’approvisionnement des semi-conducteurs avancés est dominée par l’Amérique et ses alliés. Les sociétés américaines Nvidia et AMD disposent d’un duopole efficace sur les GPU des centres de données utilisés pour l’IA. Leurs conceptions sont si complexes – avec des transistors mesurés en nanomètres à un chiffre – qu’actuellement, seule la société taïwanaise TSMC fabrique ces puces haut de gamme. Pour ce faire, TSMC s’appuie sur des machines valant plusieurs millions de dollars que seule la société néerlandaise ASML peut construire.
Les États-Unis ont cherché à tirer parti de cette situation à leur avantage. En 2022, l’administration Biden a introduit des contrôles à l’exportation, des lois qui empêchent la vente de puces de pointe à la Chine. Cette décision fait suite à une série de mesures commencées sous La première administration de Trumpqui cherchait à restreindre l’accès de la Chine aux technologies de fabrication de puces. Ces efforts ont non seulement restreint le flux de puces avancées vers la Chine, mais ont également entravé le développement du pays. industrie nationale des puces. Les puces chinoises sont à la traîne « de plusieurs années », a déclaré la secrétaire américaine au Commerce, Gina Raimondo. 60 minutes en avril.
En savoir plus: Une recherche révèle une division mondiale marquée dans la propriété de puissantes puces d’IA
Pourtant, les contrôles à l’exportation de 2022 ont rencontré leur premier obstacle avant d’être annoncés, car les développeurs chinois auraient stocké des puces qui seront bientôt restreintes. DeepSeek, le développeur chinois à l’origine d’un modèle de raisonnement d’IA appelé R1, qui rivalise avec l’aperçu O1 d’OpenAI, assemblé un groupe de 10 000 Les GPU Nvidia A100 seront bientôt interdits un an avant l’introduction des contrôles à l’exportation.
Contrebande aurait également pu nuire à l’efficacité du contrôle des exportations. En octobre, Reuters signalé que des puces TSMC restreintes ont été trouvées sur un produit fabriqué par la société chinoise Huawei. Des entreprises chinoises auraient également acquis des puces restreintes en utilisant sociétés écrans en dehors de la Chine. D’autres ont contourné les contrôles à l’exportation en louant un accès GPU auprès de fournisseurs de cloud offshore. En décembre, Le Wall Street Journal signalé que les États-Unis préparent de nouvelles mesures qui limiteraient la capacité de la Chine à accéder aux puces via d’autres pays.
En savoir plus: Les progrès de l’IA ont-ils vraiment ralenti ?
Même si les contrôles américains à l’exportation restreignent l’accès de la Chine aux semi-conducteurs les plus avancés, ils autorisent toujours la vente de puces moins puissantes. Décider quels jetons devraient ou ne devraient pas être autorisés s’est avéré difficile. En 2022, Nvidia peaufiné le design de son produit phare puce pour créer une version pour le marché chinois qui respectait les seuils de restrictions. La puce était toujours utile pour le développement de l’IA, ce qui a incité les États-Unis à resserrer les restrictions en octobre 2023. « Nous avons eu une année où (la Chine) pouvait simplement acheter des puces qui étaient fondamentalement aussi bonnes », explique Lennart Heim, responsable de l’IA et du calcul chez le centre de politique de technologie et de sécurité de la société RAND. Il dit que cette faille, associée au temps nécessaire pour que de nouvelles puces trouvent leur chemin dans l’infrastructure des développeurs d’IA, est la raison pour laquelle nous n’avons pas encore vu les contrôles à l’exportation avoir un impact complet sur le développement de l’IA en Chine.
Il reste à voir si le seuil actuel constitue le bon équilibre. En novembre, Tencent a publié un modèle de langage appelé Hunyuan-Large qui surpasse La variante la plus puissante de Meta de Llama 3.1 dans plusieurs benchmarks. Bien que les benchmarks soient une mesure imparfaite pour comparer l’intelligence globale des modèles d’IA, les performances de Hunyuan-Large sont impressionnantes car il a été formé à l’aide des GPU Nvidia H20 moins puissants et sans restriction, selon recherche par le Berkeley Risk and Security Lab. «Ils obtiennent clairement une bien meilleure utilisation du matériel grâce à de meilleurs logiciels», déclare Ritwik Gupta, l’auteur de la recherche, qui conseille également l’unité d’innovation de défense du ministère de la Défense. DeepSeek-v3 du laboratoire chinois rival, considéré comme le modèle ouvert le plus puissant disponiblea également été formé en utilisant étonnamment peu de calcul. Bien qu’il existe une grande incertitude quant à la manière dont le président élu Donald Trump abordera la politique en matière d’IA, plusieurs experts ont déclaré au TIME en novembre qu’ils s’attendaient à ce que les contrôles à l’exportation persistent – et même soient étendus.
Avant nouvelles restrictions ont été introduits en décembre, les entreprises chinoises une fois de plus stocké puces qui seront bientôt bloquées. « Toute cette stratégie doit être repensée », déclare Gupta. « Arrêtez de jouer à la taupe avec ces puces matérielles. » Il suggère qu’au lieu d’essayer de ralentir le développement de grands modèles de langage en restreignant l’accès aux puces, les États-Unis devraient se concentrer sur la prévention du développement de systèmes d’IA militaires, qui, selon lui, nécessitent souvent moins de puissance de calcul pour être entraînés. Il reconnaît toutefois que les restrictions imposées à d’autres parties de la chaîne d’approvisionnement des puces, comme les machines ASML utilisées pour fabriquer des puces, ont joué un rôle crucial dans le ralentissement de l’industrie nationale des puces en Chine.
Heim dit qu’au cours de l’année dernière, l’avance des États-Unis a diminué, mais il note que même si la Chine peut désormais rivaliser avec les meilleurs modèles open source des États-Unis, ceux-ci sont en retard d’environ un an par rapport aux meilleurs modèles fermés. Il ajoute que la réduction de l’écart ne signifie pas nécessairement l’échec des contrôles à l’exportation. « Éloignons-nous de cette logique binaire entre les contrôles à l’exportation qui fonctionnent ou qui ne fonctionnent pas », dit-il, ajoutant qu’il faudra peut-être plus de temps à la Chine pour les sentir mordre.
La dernière décennie a vu une augmentation vertigineuse du calcul utilisé pour entraîner les modèles d’IA. Par exemple, le GPT-4 d’OpenAI, sorti en 2023, est estimé avoir été formé en utilisant environ 10 000 fois plus de calcul que GPT-2, publié en 2019. Certains éléments indiquent que la tendance est appelée à se poursuivre, alors que des entreprises américaines comme X et Amazone construire des supercalculateurs massifs dotés de centaines de milliers de GPU, dépassant de loin la puissance de calcul utilisée pour former les principaux modèles d’IA actuels. Si tel est le cas, Heim prédit que les restrictions américaines à l’exportation de puces entraveront la capacité de la Chine à suivre le rythme du développement de l’IA. « Les contrôles à l’exportation portent principalement sur la quantité », explique Heim, ajoutant que même si certaines puces restreintes se retrouvent entre les mains de développeurs chinois, en réduisant leur nombre, les contrôles à l’exportation rendent plus difficile la formation et le déploiement de modèles à grande échelle. «Je m’attends à ce que les contrôles à l’exportation soient généralement plus durs au fil du temps, tant que l’informatique reste aussi importante», dit-il.
À Washington, « à l’heure actuelle, on hésite à amener la Chine à la table (des négociations) », déclare Scott Singer, chercheur invité au programme Technologie et affaires internationales du Carnegie Endowment for International Peace. Le raisonnement implicite : « (Si les États-Unis sont en avance), pourquoi partagerions-nous quoi que ce soit ? »
Mais il note qu’il existe des raisons impérieuses de négocier avec la Chine sur l’IA. « La Chine n’a pas besoin d’être leader pour être une source de risque catastrophique », dit-il, ajoutant que ses progrès continus malgré les restrictions informatiques signifient qu’elle pourrait un jour produire une IA dotée de capacités dangereuses. « Si la Chine est beaucoup plus proche, réfléchissez aux types de conversations que vous souhaitez avoir avec elle pour garantir la sécurité des systèmes des deux parties », a déclaré Singer.