Qui est est Liang Wenfeng CEO de DEEPSEEK ( l'IA chinoise )

28 Jan 2025

Qui est est Liang Wenfeng CEO de DEEPSEEK ( l’IA chinoise )

DeepSeek, une entreprise chinoise spécialisée dans les grands modèles d’intelligence artificielle (IA), a récemment attiré l’attention mondiale grâce à ses innovations technologiques et ses stratégies commerciales audacieuses. Fondée par Liang Wenfeng, un ingénieur discret mais visionnaire, DeepSeek a su se démarquer dans un marché dominé par des géants technologiques tels que ByteDance, Tencent, Baidu et Alibaba. Cette entreprise, bien que moins médiatisée, a réussi à initier une guerre des prix dans le secteur des grands modèles d’IA en Chine, tout en maintenant une rentabilité impressionnante. Cet article explore en profondeur l’histoire de DeepSeek, ses innovations technologiques, ses défis et ses perspectives d’avenir.

Les débuts discrets de DeepSeek

DeepSeek a émergé sur la scène de l’IA chinoise il y a environ un an, soutenue par le géant des fonds spéculatifs quantitatifs, Fantasia. Fantasia est la seule entreprise en dehors des grandes entreprises technologiques à posséder une réserve de 10 000 cartes A100, des puces graphiques de pointe utilisées pour l’entraînement des modèles d’IA. Cette ressource massive a permis à DeepSeek de se lancer dans des projets ambitieux sans les contraintes matérielles auxquelles sont souvent confrontées les startups.

Qui est est Liang Wenfeng CEO de DEEPSEEK interview IA chinoise ).jpg

L’impact de DeepSeek V2

Le véritable tournant pour DeepSeek est survenu en mai dernier, lorsqu’ils ont lancé DeepSeek V2, un modèle open source offrant un rapport qualité-prix sans précédent. Le coût d’inférence de ce modèle a été réduit à seulement 1 yuan par million de tokens, soit environ sept fois moins cher que Llama3 70B et soixante-dix fois moins cher que GPT-4 Turbo. Cette réduction drastique des coûts a immédiatement positionné DeepSeek comme un acteur majeur dans le domaine des grands modèles d’IA, déclenchant une guerre des prix parmi les grandes entreprises technologiques chinoises.

La réaction du marché

La sortie de DeepSeek V2 a rapidement valu à l’entreprise le surnom de « Pinduoduo de l’IA », en référence à la plateforme de commerce électronique chinoise connue pour ses prix extrêmement compétitifs. En réponse, des géants comme ByteDance, Tencent, Baidu et Alibaba ont tous baissé leurs prix, intensifiant ainsi la concurrence sur le marché. Cependant, contrairement à ces grandes entreprises qui subventionnent souvent leurs produits pour gagner des parts de marché, DeepSeek a réussi à maintenir une rentabilité grâce à ses innovations technologiques.

Les innovations technologiques de DeepSeek

L’architecture MLA

L’une des principales innovations de DeepSeek réside dans son architecture MLA (Multi-Head Latent Attention), une nouvelle méthode d’attention multi-têtes qui réduit considérablement l’utilisation de la mémoire par rapport à l’architecture MHA (Multi-Head Attention) traditionnellement utilisée. Cette innovation a permis de réduire l’utilisation de la mémoire à seulement 5% à 13% de celle de l’architecture MHA, tout en optimisant les calculs grâce à la structure DeepSeekMoESparse. Ces améliorations ont directement contribué à la réduction des coûts, rendant les modèles d’IA plus accessibles et abordables.

La reconnaissance internationale

Les innovations de DeepSeek n’ont pas échappé à l’attention de la communauté internationale. Dans la Silicon Valley, DeepSeek est souvent décrite comme une « force mystérieuse venue de l’Est ». Le premier analyste de SemiAnalysis a qualifié le document sur DeepSeek V2 de « potentiellement le meilleur de l’année ». Andrew Carr, ancien employé d’OpenAI, a salué la « sagesse surprenante » du document et a même appliqué ses paramètres d’entraînement à ses propres modèles. Jack Clark, ancien responsable politique d’OpenAI et cofondateur d’Anthropic, a également reconnu le talent exceptionnel de l’équipe de DeepSeek, affirmant que les grands modèles chinois deviendraient une force incontournable, comparable aux drones et aux voitures électriques.

La philosophie et la culture de DeepSeek

L’engagement envers l’innovation

DeepSeek se distingue par son engagement envers l’innovation technologique plutôt que la simple application des technologies existantes. Contrairement à de nombreuses entreprises chinoises qui se contentent de suivre les tendances technologiques mondiales, DeepSeek a choisi de se concentrer sur la recherche et le développement de nouvelles architectures de modèles. Cette approche va à l’encontre de la croyance largement répandue selon laquelle la Chine excelle dans l’application des technologies (de 1 à 10) plutôt que dans l’innovation technologique (de 0 à 1).

L’équipe derrière DeepSeek

L’équipe de DeepSeek est composée de jeunes talents issus des meilleures universités chinoises. Contrairement à de nombreuses entreprises qui recrutent activement à l’étranger, DeepSeek a réussi à former ses propres experts en interne. Liang Wenfeng, le fondateur de DeepSeek, est lui-même un ingénieur discret mais extrêmement compétent, diplômé de l’université de Zhejiang en génie électronique avec une spécialisation en intelligence artificielle. Ses collègues le décrivent comme une personne possédant une « capacité d’apprentissage terrifiante » et une « passion pour la technologie », tout en étant « complètement différent d’un patron typique, plus proche d’un geek ».

La culture organisationnelle

DeepSeek fonctionne avec une structure organisationnelle très flexible, permettant à chaque membre de l’équipe de proposer des idées et de mobiliser des ressources sans approbation préalable. Cette culture d’innovation et de collaboration a permis à DeepSeek de réaliser des percées technologiques significatives. Par exemple, l’idée de l’architecture MLA est née de l’intérêt personnel d’un jeune chercheur, qui a ensuite été développée par une équipe dédiée pendant plusieurs mois.

Les défis et les perspectives d’avenir

La concurrence avec les grandes entreprises

Bien que DeepSeek ait réussi à initier une guerre des prix et à attirer l’attention internationale, la concurrence avec les grandes entreprises technologiques reste féroce. Ces géants disposent de ressources financières et technologiques considérables, ce qui leur permet de suivre rapidement les innovations de DeepSeek. Cependant, DeepSeek reste confiant dans sa capacité à innover et à maintenir son avantage technologique.

L’avenir de l’AGI

Liang Wenfeng estime que l’intelligence artificielle générale (AGI) pourrait être réalisée dans les 2, 5 ou 10 prochaines années. DeepSeek explore plusieurs voies pour atteindre cet objectif, notamment les modèles mathématiques et de codage, les modèles multimodaux et les modèles de langage naturel. L’équipe de DeepSeek reste ouverte à toutes les possibilités et continue de repousser les limites de l’IA.

La vision à long terme

DeepSeek envisage un avenir où des entreprises spécialisées fourniront des modèles de base et des services de base, tandis que d’autres entreprises construiront des applications spécifiques sur ces fondations. Cette spécialisation permettrait de répondre aux besoins diversifiés de la société de manière plus efficace. DeepSeek se positionne comme un acteur clé dans cette chaîne de valeur, se concentrant sur l’innovation technologique et la recherche de pointe.

Pour finir…

DeepSeek, sous la direction de Liang Wenfeng, a réussi à se tailler une place de choix dans le paysage de l’IA chinoise grâce à ses innovations technologiques et sa philosophie centrée sur la recherche. En défiant les conventions et en se concentrant sur l’innovation plutôt que sur la simple application des technologies existantes, DeepSeek a prouvé que la Chine pouvait être un acteur majeur dans le domaine de l’IA. Alors que la concurrence reste féroce et que les défis technologiques persistent, DeepSeek continue de repousser les limites de ce qui est possible, ouvrant la voie à un avenir où l’IA jouera un rôle central dans la société.

4.9/5 - (28 votes)