Étude de cas · Qwant x Shadow GPU
Comment Qwant fait tourner 100 % de son IA de production sur les GPU Shadow — avec ~50 % de coût en moins
Qwant, moteur de recherche français qui protège la vie privée, devait intégrer de l'IA générative dans ses résultats sans exposer les données utilisateurs ni exploser son budget. En passant des GTX 1080 aux RTX A4500 sur la plateforme OpenStack de Shadow, l'équipe exécute désormais tous ses workloads IA de production sur les GPU Shadow tout en divisant presque par deux ses coûts.
Couverture production
100%
Tous les modèles IA de production tournent sur les GPU Shadow.
GPU actifs
90+
Grappes RTX A4500 pour NER, embeddings, catégorisation, réécriture de requêtes.
Réduction de coût
~50%
GPU moins chers que les tarifs du marché à performance équivalente.
Injecter de l'IA générative dans la recherche — sans sacrifier la confidentialité ni le budget.
Comme beaucoup d'équipes produit, Qwant devait aller vite sur l'IA tout en restant conforme à son ADN « privacy by design ». Les modèles à entraîner, les pipelines de crawl et l'indexation web augmentaient fortement la demande en calcul GPU. Face à ces besoins technologiques croissants, Shadow Pro est apparu comme le partenaire capable de fournir une puissance de calcul fiable, accessible et économique.
Le défi : transformer l'expérience de recherche. Fondé en 2013, Qwant refuse la monétisation des données personnelles. La feuille de route mêle refonte de l'affichage et moteur de recherche avancé capable de servir des résumés génératifs pertinents.
Cette ambition crée un besoin clair : une infrastructure GPU souveraine, disponible en quelques minutes, capable d'encaisser entraînement, inférence et indexing sans compromettre la confidentialité.
Passage à l'échelle : des GTX 1080 aux RTX A4500
Qwant a démarré sur l'infrastructure Shadow avec des GTX 1080 pour lancer rapidement des crawls massifs (tests sur des millions de documents). Une façon économique de valider la stack IA sans immobiliser du capital.
Pour la production, l'équipe a migré vers des RTX A4500 afin d'absorber des modèles plus complexes. Aujourd'hui plus de 90 GPU exécutent des workloads variés :
- Reconnaissance d'entités nommées (NER)
- Embeddings
- Catégorisation
- Réécriture de requêtes
Impact : 100 % de l'IA de production sur les GPU Shadow
Résultat : toute l'IA de production Qwant tourne sur Shadow. Les équipes provisionnent via OpenStack en quelques clics et se connectent en SSH sécurisé. Les pics de charge sont absorbés en temps réel sans refonte d'architecture.
« Avec Shadow, on répond immédiatement aux pics de charge. C'est vital pour nous. » — Ludovic Logiou, Lead SRE chez Qwant
Maîtrise des coûts et support expert
Les GPU Shadow coûtent environ 50 % moins cher que des offres équivalentes : là où le marché facture souvent 500 à 600 € pour la configuration Qwant, Shadow fournit la même puissance autour de 250 €. Sans engagement, sans surcoût bande passante ou IOPS : seules les ressources commandées sont facturées.
Cette transparence a permis de déployer une flotte massive tout en gardant le budget sous contrôle. L'équipe bénéficie en plus d'un support réactif : Shadow a aidé à résoudre rapidement des incidents drivers Nvidia et à optimiser les profils machines.
À propos de Qwant & Shadow
Qwant
Moteur de recherche français axé sur la confidentialité, Qwant refuse l'exploitation des données personnelles. L'équipe y ajoute l'IA générative pour délivrer des réponses fiables et synthétiques directement dans les résultats.
Shadow Cloud
Shadow Cloud fournit une infrastructure GPU optimisée pour l'IA et le rendu, avec un accès flexible aux GPU NVIDIA adaptés via une plateforme OpenStack et une tarification transparente à l'usage.