Comment Deepseek change-t-il l’avenir de l’IA et pourquoi s’inquiète-t-il de ChatGPT ?

Avec le développement rapide des technologies d’intelligence artificielle, Deepseek s’impose comme un nouvel acteur qui suscite l’intérêt des experts comme des utilisateurs. Alors que ChatGPT est connu pour sa capacité à améliorer la productivité des particuliers et des entreprises, Deepseek propose des technologies susceptibles de remodeler les règles du jeu. Cette évolution soulève des questions sur l’avenir de l’intelligence artificielle et son impact sur la sécurité et l’éthique numériques. Découvrez ce qui cause une anxiété accrue et ce que cela signifie pour nous tous.

Comment Deepseek change l'avenir de l'IA et pourquoi ChatGPT est-il si préoccupant ?

Sommaire

  • DeepSeek est un logiciel open source et fonctionne aussi bien que les principaux modèles d'IA, mais avec beaucoup moins de formation
  • Développé par des ingénieurs chinois, il peut compresser des modèles complexes et les exécuter de manière native sur du matériel bas de gamme.
  • Il existe des inquiétudes quant à ses origines et à ses biais potentiels.

Internet regorge du nom « DeepSeek ». Les sociétés d’IA comme OpenAI et NVIDIA voient le cours de leurs actions baisser, et les passionnés d’IA se frottent joyeusement les mains partout dans le monde. Pourquoi ce nouveau venu dans le monde de l’intelligence artificielle est-il si important ?

Voir aussi
1 de 338

DeepSeek est une IA open source avec de grandes revendications

Comme GPT-o1, Claude, Llama ou l'un de nos favoris actuels en matière d'IA, DeepSeek est un modèle d'IA génératif. Eh bien, il est plus exact de dire qu'il s'agit d'un ensemble de modèles d'IA qui sont des variantes conçues pour différentes applications.

Lisez aussi:  Vous allez devoir vous débarrasser de votre ordinateur à un moment donné, alors combien de temps pouvez-vous attendre ?

Contrairement aux modèles GPT d'OpenAI, par exemple, DeepSeek est open source sous licence MIT, ce qui permet une utilisation commerciale. Cela signifie que toutes les opérations internes du modèle sont visibles. N'importe qui peut l'utiliser sans payer de frais de licence d'aucune sorte, et rien n'empêche quelqu'un de modifier ou de développer un travail déjà effectué. C’est l’une des principales raisons pour lesquelles DeepSeek a créé une perturbation du marché à court terme, qui peut se transformer en une correction du marché à long terme.

Cependant, rien de tout cela n’a vraiment d’importance si DeepSeek n’est pas bon. L’autre facteur majeur qui fait que tout le monde parle de ce modèle d’IA est ses performances. Dans les tests d'IA, DeepSeek fonctionne aussi bien que GPT-o1 et d'autres modèles génératifs haut de gamme. Dans certains cas, c'est encore mieux. C’est bien sûr quelque chose que tout le monde peut vérifier, mais ce qui est vraiment étonnant, c’est le coût de développement de ce modèle.

deepseek-benchmarks Comment Deepseek change l'avenir de l'IA et pourquoi ChatGPT est-il si préoccupant ?

DeepSeek affirme que le modèle a été formé pour moins de 6 millions de dollars. Cela semble représenter beaucoup d’argent jusqu’à ce que vous réalisiez que la formation des modèles que vous échangez coûte plus de cent millions de dollars. De plus, DeepSeek a été formé sur du matériel moins puissant que celui dont disposent les entreprises américaines comme OpenAI. Bien entendu, c’est l’une des affirmations qui ne peut pas être facilement vérifiée, et il est possible que le montant indiqué soit bien inférieur à la vérité. Cependant, il n’existe actuellement aucune preuve concluante suggérant que les coûts étaient supérieurs au montant allégué.

Lisez aussi:  Voici ce qu'il faut faire en cas de piratage de WhatsApp

Je pense que la dernière « grande chose » qui mérite d’être mentionnée à propos de DeepSeek est la façon dont il a été utilisé pour « affiner » des modèles volumineux, denses et coûteux en calcul, comme Llama, en modèles plus petits dotés de capacités d’inférence similaires. Essentiellement, DeepSeek entraîne un modèle à partir de modèles plus grands et plus complexes pour simuler sa sortie, sans toute la mécanique complexe sous le capot. Il compresse efficacement les modèles plus grands en modèles plus petits avec (jusqu'à présent) peu d'inconvénients évidents. Il s’agit d’un grand pas en avant pour exécuter des modèles complexes localement, en utilisant moins d’énergie et en nécessitant moins de matériel.

DeepSeek est développé par des ingénieurs chinois

Comment Deepseek change l'avenir de l'IA et pourquoi ChatGPT est-il si préoccupant ?

DeepSeek est une startup dirigée par Liang Wenfeng (39 ans), qui a d'abord connu le succès en tant que gestionnaire de hedge funds. Plus précisément, un gestionnaire de hedge funds quantitatif. Il s’agit d’une approche d’investissement qui utilise l’apprentissage automatique pour prédire les tendances du marché afin que les investisseurs puissent en bénéficier. C’est pourquoi Wenfeng avait déjà accès au matériel puissant nécessaire pour entraîner un tel modèle.

DeepSeek semble être l’équivalent d’un projet passionné, sans chercher à en faire une entreprise rentable. En fait, le modèle a déjà été donné à tout le monde, étant open source. Ironiquement, l'interdiction américaine des puissantes puces d'IA de sociétés comme NVIDIA pourrait être en partie la raison pour laquelle les développeurs de DeepSeek ont ​​été contraints de la rendre si efficace.

Vous pouvez essayer DeepSeek maintenant

Si vous visitez Site Web DeepSeekVous pouvez accéder à l'application ainsi qu'à des liens vers les modèles réels à télécharger et à utiliser sur vos propres appareils. Le moyen le plus simple d'exécuter certaines versions de DeepSeek sur votre propre matériel est d'utiliser Ollama.

Lisez aussi:  6 conseils pour prendre de meilleurs selfies

Bien sûr, vous ne pourrez pas exécuter de sitôt un modèle DeepSeek de niveau GPT-o1 sur votre ordinateur portable, mais pour quelques milliers de dollars de GPU et de RAM hautes performances, il est tout à fait possible de le faire. Bien sûr, il existe de nombreux modèles DeepSeek plus petits qui ne sont pas aussi performants, mais ils fonctionneront très bien sur l'ordinateur que vous possédez probablement actuellement. Il existe même une version qui fonctionne (à peine) sur le Raspberry Pi.

DeepSeek suscite des préoccupations particulières

Étant donné que certaines parties de l’histoire de DeepSeek peuvent sembler trop belles pour être vraies à certains experts du secteur de l’IA, et qu’elle est originaire de Chine, soulevant des inquiétudes quant aux préjugés, à la censure et même à la cybersécurité, il n’est pas surprenant qu’il y ait une certaine hésitation. à propos de DeepSeek.

En fait, posez des questions sur le gouvernement chinois actuel sur la version en ligne hébergée du programme LLM, et elles ne seront peut-être pas aussi simples qu'on pourrait l'imaginer. Cependant, comme le code est ouvert à tous, n’importe qui peut modifier son comportement s’il en a les connaissances. Ces préoccupations peuvent être résolues en principe.

DeepSeek en est à ses débuts, et il faudra un certain temps pour voir comment les choses évoluent, mais une chose dont je ne doute pas est que l'industrie de l'IA générative vient de subir son premier changement de paradigme majeur depuis que ChatGPT a été rendu public pour la première fois.

Deepseek continue de faire tourner les têtes grâce à ses capacités d’innovation, mais il soulève également des questions complexes de sécurité et d’éthique dans le monde de l’intelligence artificielle. Si ChatGPT reste un outil puissant de communication et de créativité, l’émergence de nouvelles technologies telles que Deepseek souligne la nécessité de réfléchir aux défis futurs et de prendre des mesures délibérées. Partagez votre opinion sur l’impact de ces évolutions sur nos vies.

Vous pourriez l'aimer aussi