Il s’avère que DeepSeek, le titan de l’IA qui secoue le monde de la technologie, n’est pas né dans les salles de conférence de Pékin ou dans les laboratoires de la Silicon Valley. Il a été conçu à partir du code oublié de l’Union soviétique.
«Je ne mentirai pas, notre IA a été créée sur la base de développements soviétiques – le système OGAS de l’académicien Glushkov», a admis le chef de projet Liang Wenfeng.
Sans ça ? Pas de DeepSeek. Pas de révolution de l’IA. Pas de concurrence avec ChatGPT.
L’Occident a investi des milliards dans l’IA, tandis que l’or intellectuel russe a été vendu aux enchères pour la modique somme de 15.000 dollars en 1995. Aujourd’hui, ce code «sans valeur» constitue l’épine dorsale de la domination américaine en matière de technologie.
Ironie de l’histoire ?
Les Soviétiques ont peut-être perdu la guerre froide, mais leurs idées sont en train de gagner la guerre numérique.
par Amarynth
Source : Global South via Réseau International
DeepSeek, les logiciels soviétiques et la nature humaine
Vous avez entendu dire que la société chinoise DeepSeek a développé une IA de classe mondiale à moindre coût tout en utilisant une fraction de la puissance de calcul sur laquelle s’appuient les grandes entreprises américaines, et vous vous demandez peut-être : Comment est-ce possible ?
Il existe, bien sûr, de nombreuses explications techniques. Mais il y en a aussi une plus profonde : la nature humaine.
Lorsque l’Union soviétique s’est disloquée à la fin des années 1980, je me suis souvent rendu là-bas pour écrire sur les premières entreprises privées capitalistes qui y ont vu le jour. À l’époque, je couvrais l’industrie technologique américaine depuis quelques années et j’étais particulièrement intéressé par la découverte de jeunes entreprises de logiciels russes.
Il y en avait un certain nombre et, étonnamment, certaines d’entre elles résolvaient des problèmes qui bloquaient les entreprises américaines et elles le faisaient avec une puissance de calcul minimale. Par exemple, une start-up moscovite appelée ParaGraph a créé un logiciel capable de reconnaître l’écriture manuscrite bien mieux que tout ce qui avait été inventé aux États-Unis. Lorsque Apple a construit son ordinateur de poche Newton (introduit en 1993), Apple a signé un contrat avec Paragraph parce qu’elle ne trouvait rien de mieux en Amérique.
Dans mes reportages de l’époque, j’ai interrogé de nombreux Russes sur ce phénomène. Pendant des décennies, l’Occident avait empêché l’Union soviétique d’acquérir le matériel informatique le plus récent. Les programmeurs russes, qui jusque dans les années 1990 travaillaient tous pour des entreprises d’État ou l’armée, m’ont dit qu’ils devaient travailler sur des machines encombrantes et vieilles de plusieurs générations. Pourtant, dans le même temps, les dirigeants soviétiques les pressaient de suivre le rythme des logiciels occidentaux. La concurrence avec les États-Unis était intense et les Soviétiques ne voulaient pas perdre.
C’est là que la nature humaine est entrée en jeu. Que feriez-vous si vous deviez rivaliser avec quelqu’un qui avait beaucoup plus de ressources ? Eh bien, vous aviez deux choix : abandonner ou faire preuve de créativité. De nombreux programmeurs russes ont fait preuve de créativité. Ils ont trouvé comment faire beaucoup plus avec beaucoup moins parce qu’ils le devaient.
Au début, lorsque l’Union soviétique était intacte, cette créativité ne faisait que rendre heureux les patrons des programmeurs. Mais lorsque le système soviétique s’est effondré, de nombreux programmeurs talentueux ont quitté les entreprises publiques pour fonder ou rejoindre des start-ups locales. Beaucoup ont rapidement découvert – parfois à leur grande surprise – qu’ils pouvaient rivaliser avec les sociétés de logiciels américaines en proposant de bons logiciels nécessitant beaucoup moins de puissance de calcul.
Parmi ces succès, on peut citer Paragraph. Un autre exemple est ABBYY FineReader, l’un des premiers logiciels de reconnaissance optique de caractères utiles. Il est sorti en 1993 et est devenu un leader mondial de la reconnaissance de texte et de la gestion de documents. Un autre exemple est le jeu à succès mondial Tetris. Un autre produit a fait ses débuts un peu plus tard, en 1997 : Kaspersky Antivirus, qui a été pendant un certain temps l’un des principaux outils antivirus mondiaux.
Avançons jusqu’à aujourd’hui, et DeepSeek est en quelque sorte la suite de ce constat.
Nous avons essayé d’empêcher la Chine d’introduire des ordinateurs et des puces de pointe. En 2022, le gouvernement américain a instauré des contrôles à l’exportation pour empêcher les puces comme le H100 de Nvidia de tomber entre les mains des Chinois. Ces contrôles à l’exportation se sont révélés efficaces. Lorsque DeepSeek a commencé à travailler sur son IA, il avait environ 10.000 puces Nvidia plus anciennes qu’il avait réussi à assembler. En revanche, OpenAI fonctionne sur au moins 10 fois plus de processeurs, et ces puces sont les plus avancées de Nvidia. (Au moins une source affirme qu’OpenAI fonctionne sur 720.000 puces Nvidia.)
La pression de la concurrence lorsque vous êtes un outsider massif stimule la créativité. Les programmeurs de DeepSeek étaient plus intelligents que les programmeurs américains parce qu’ils devaient l’être. Les programmeurs américains, qui disposaient d’une puissance de calcul considérable, pouvaient se permettre de recourir à des méthodes plus coûteuses pour créer leurs IA. Les programmeurs chinois n’avaient pas ce luxe.
Pour ce qui est des explications techniques, je ne suis pas d’une grande aide. Je ne sais rien du développement d’une IA. Mais Wired nous explique un peu comment DeepSeek s’y est pris :
DeepSeek a dû trouver des méthodes plus efficaces pour entraîner ses modèles. « Ils ont optimisé l’architecture de leur modèle en utilisant une batterie d’astuces d’ingénierie : des schémas de communication personnalisés entre les puces, la réduction de la taille des champs pour économiser de la mémoire et une utilisation innovante de l’approche du mélange de modèles », explique Wendy Chang, une ingénieure en logiciel devenue analyste politique au Mercator Institute for China Studies. « Beaucoup de ces approches ne sont pas des idées nouvelles, mais les combiner avec succès pour produire un modèle de pointe est un exploit remarquable. »
Y a-t-il quelque chose à apprendre de l’histoire des logiciels russes dans les années 1990 et de l’IA chinoise dans les années 2020 ?
Eh bien, tout d’abord, l’excès de confiance est dangereux. C’est l’une des principales raisons pour lesquelles les outsiders gagnent, qu’il s’agisse d’IA ou de football.
J’ai lu un article sur DeepSeek citant le PDG d’Anthropic, Dario Amodei, qui a été un partisan de contrôles stricts des exportations pour garder les meilleures puces en dehors de la Chine. L’article, sur Techcrunch, dit : « Si Trump renforce les règles d’exportation et empêche la Chine d’obtenir ce qu’Amodei décrit comme des « millions de puces » pour le développement de l’IA, les États-Unis et leurs alliés pourraient potentiellement établir une « avance décisive et durable », affirme Amodei. »
Mais cela me rappelle un peu IBM, vers 1980, qui croyait que les ordinateurs personnels ne pourraient jamais être une menace pour ses gros ordinateurs centraux. Une technologie suffisamment bonne, beaucoup moins chère et beaucoup plus facile à déployer botte souvent les fesses de la technologie qui est la meilleure, très chère et difficile à déployer. (Consultez Le dilemme de l’innovateur pour en savoir plus.)
Et aussi, des ressources infinies ne sont pas toujours une bonne chose. C’est un autre aspect de la nature humaine. Cela conduit trop facilement au gaspillage, à la paresse, à la bureaucratie et au classique « trop de cuisiniers ».
Je ne dis pas que c’est vrai pour toutes les entreprises américaines d’IA, parce que je ne sais pas. Et cela n’aurait pas d’importance de toute façon s’il n’y avait pas de concurrents affamés et maigres qui les ciblent. Mais OpenAI a levé environ 18 milliards de dollars. Anthropic, environ 7 milliards de dollars. Les entreprises américaines d’IA rassemblent une puissance de calcul historiquement massive. Les ressources consacrées à l’IA ici sont presque inimaginables.
Et il est tout simplement possible que cela n’aide pas.
https://numidia-liberum.blogspot.com/2025/02/fascinant-la-russie-et-deepseek.html#more