Quand il est question d’IA générative et de grands modèles de langage, difficile de ne pas évoquer Nvidia. Le concepteur fabless d’accélérateurs de calcul est devenu la coqueluche des marchés ...
Les géants américains de la tech pivotent de l'entraînement de l'IA vers l'inférence pour accélérer la démocratisation et la ...
Evoquer l'intelligence artificielle revient souvent à porter l'attention sur l'entraînement d'énormes modèles de deep learning, mobilisant des milliers de GPU pendant plusieurs semaines. Pourtant, la ...
Keysight Technologies, Inc. a présenté Keysight AI Inference Builder , une plateforme d'émulation et d'analyse conçue pour ...
NVIDIA dévoile NVIDIADynamo, un logiciel d'inférence open-source pour accélérer et mettre à l'échelle les modèles de raisonnement de l'IA dans les usines d'IA au coût le plus bas et avec la plus ...
L'essor de l'IA redistribue calcul, données et énergie entre hubs centralisés et datacenters edge, avec l'hybride comme ...
Cette année, Nvidia a renouvelé ses offres d'infrastructures pour répondre aux besoins des traitements IA avec un focus ...
Le fournisseur de cloud français menait aujourd’hui sa conférence annuelle, OVHcloud Summit 2025. L’occasion pour présenter sa stratégie en matière d’IA. Selon Octave Klaba, cofondateur et PDG du ...
À l’occasion du Red Hat Summit 2025, l’éditeur open source met en avant son Red Hat AI Inference Server, de nouveaux modèles validés par des tiers, et l’intégration des API Llama Stack (Meta) et MCP ...
Lors du lancement des produits et solutions Huawei pendant le MWC Barcelona 2026, Yuan Yuan, président de la ligne de produits de stockage de données Huawei, a officiellement lancé la plateforme de do ...
L’absorption de Groq a redéfini les priorités de Nvidia. Sa puce Rubin CPX, annoncée l’année dernière comme un facteur ...
Mistral Small 4 réunit vision, code et raisonnement dans un modèle open weight pensé pour réduire coûts, latence et ...