[parole d’expert] l’IA au-delà du buzzword

L’intelligence artificielle envahit toutes les conversations d’entreprise, souvent avec plus de marketing que de substance réelle. Ici, nous choisissons de mettre l’expertise au premier plan. Cet article s’adresse particulièrement aux spécialistes, quand chacun y découvrira l’excellence et la rigueur qui nourrissent nos projets au quotidien.

une approche test-and-learn assumée

Dans le cadre de notre initiative AI composée de 7 piliers (Former nos collaborateurs, Adapter nos services, …), nous avons lancé plusieurs études et pilotes sur l’utilisation de l’IA dans notre quotidien de consultants.

L’une de ces études s’est portée sur la mise en place d’une architecture « IA » dédiée nous permettant de travailler sur des données confidentielles tout en comprenant les rouages technologiques de bout en bout, du hardware à l’interface utilisateur sans dépendance externe.

L’objectif étant à terme de pouvoir accompagner nos clients sur ces thématiques et sur les challenges d’architecture IA autohébergées au sein du Système d’Information.

premiers émois

Nos premières expérimentations nous ont amenés à implémenter une infrastructure hébergée chez un infogérant « local ».

Cette infrastructure nous a permis de déployer des modèles LLM Opensource mis à disposition de collaborateurs dans le cadre de challenges et use-cases internes.

Principaux lessons-learned :

limitation des temps de réponse,
limitation des modèles déployables,
dépendance du fournisseur pour adapter l’infrastructure (entendable et appréciable pour une infrastructure déployée et opérée, mais par contre plus délicat en phase d’expérimentation)

nouvelle étape

Afin d’adresser également les problématiques opérationnelles (LMOps), nous avons décidé d’investir dans du matériel professionnel adapté aux charges de travail IA avec des serveurs DGX Spark puis DGX Station de NVIDIA.

Le DGX Spark, équipé du superchip NVIDIA GB10 Grace Blackwell, délivre jusqu’à 1 pétaflop de performance IA dans un format compact avec 128 Go de mémoire unifiée (nous nous intéressons également de près à la DGX Station, et attendons la sortie des puces GB300, les détails de leur fonctionnement et la dépendance à GPU externe).

Ces infrastructures nous permettront ainsi de développer et tester des modèles d’IA jusqu’à 200 milliards de paramètres localement, avec la possibilité de connecter plusieurs systèmes pour traiter des modèles encore plus importants.

Nous avons choisi de nous concentrer sur des architectures basées sur les superchips Grace Blackwell, comme le DGX Spark (1 pétaflop, 128 Go de mémoire unifiée), afin de bénéficier d’une convergence CPU/GPU unique et d’optimiser le traitement massif de modèles IA. Nous privilégions les matériels NVIDIA unifié en raison des facilités d’intégration offertes par CUDA, anticipant ainsi une réelle rupture technologique auxquelles nous croyons.

NB : notre choix aurait également pu se porter sur une architecture basée sur AMD / Ryzen AI Max+. Néanmoins, elle nécessite d’être adossées à des backend FastFlowLM au lieu d’Ollama.

backend

Nos tests portent sur plusieurs modèles open source de pointe notamment Mistral AI (modèles multimodaux haute capacité), Llama 4 (architecture Mixture of Experts supportant jusqu’à plusieurs millions de tokens), GPT-OSS d’OpenAI optimisé pour l’auto-hébergement, ainsi que le modèle suisse Apertus développé par le partenariat EPFL – ETH Zurich – CSCS. Nous ne visons pas à construire nos propres modèles, mais à approfondir continuellement notre expertise au contact des innovations de la communauté open source.

frontend

Nous recherchons des solutions qui permettent, au-delà d’un portail utilisateur ergonomique, une gestion aisée des différents utilisateurs et de leurs droits.

Nous attendons également d’un frontend la possibilité d’exploiter des modèles on-premise ou cloud et une gestion fine des accès par API ainsi que la construction de RAG sur des corpus documentaires importants sans avoir à les exposer.

Nous avons commencé nos tests avec Ollama Web UI mais nous testons activement les alternatives telles que LibreChat, AnythingLLM, LobeChat, Text Generation Web UI.

pourquoi cette approche

Cette approche nous permet de :

Comprendre la technologie : nous continuons à développer une expertise réelle. Nous nous imposons de suivre les nombreuses évolutions chaque semaine
Maîtriser nos données : tout reste dans nos infrastructures pour les manipulations de données confidentielles ou sensibles.
Tester sans risque : les expérimentations se font sur nos propres environnements.
Comprendre les limites : savoir évaluer les limites des outils d’IA sur le marché et leurs réels coûts d’exploitation. Certains processus ne nécessitent pas forcément d’IA. Nous développons des méthodologies et outils pour mesurer rigoureusement la valeur ajoutée de l’IA par rapport à une simple automatisation, afin d’éviter la surqualification
Et enfin offrir à nos collaborateurs un environnement dédié sur lequel apprendre, et expérimenter sans risque.

la suite du programme

Préparer l’avenir : cette expérimentation nous permettra de vous apporter notre expertise et vous accompagner dans votre stratégie IA et son implémentation dans vos processus métiers.

Notre objectif est ainsi double :

vous aider à choisir les meilleurs modèles selon les cas d’usage, et la façon de les intégrer.
vous présenter des retours d’expérimentations concrets, portés sur la réelle valeur générée pour l’entreprise.

Pas de promesses marketing, juste du concret basé sur notre expertise.

Tags:

plus d'insights

tous les insights

enjeux et bénéfices liés à la mise en œuvre d’un assistant IA conversationnel

digital solutions

November 13, 2025

chatbots IA et agents intelligents

digital solutions

November 13, 2025

managed services : flexibilité, qualité et confiance swiss made

digital solutions

November 12, 2025

Cookie	Durée	Description
IDE	1 an 24 jours	Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
test_cookie	15 minutes	Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur accepte les cookies.
VISITOR_INFO1_LIVE	5 mois 27 jours	Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC	Session	Le cookie YSC est défini par Youtube et est utilisé pour suivre les vues des vidéos intégrées dans les pages Youtube.

Cookie	Durée	Description
__hstc	1 an 24 jours	Il s'agit du principal cookie défini par Hubspot, pour le suivi des visiteurs. Il contient le domaine, l'horodatage initial (première visite), le dernier horodatage (dernière visite), l'horodatage actuel (cette visite) et le numéro de session (qui s'incrémente pour chaque session suivante).
_ga	2 ans	Le cookie _ga, installé par Google Analytics, calcule les données relatives aux visiteurs, aux sessions et aux campagnes et assure également le suivi de l'utilisation du site pour le rapport d'analyse du site. Le cookie stocke les informations de manière anonyme et attribue un numéro généré de manière aléatoire pour reconnaître les visiteurs uniques.
_ga_JYCPSB48B8	2 ans	Ce cookie est installé par Google Analytics.
CONSENT	16 ans 2 mois 25 jours 10 heures	YouTube place ce cookie par le biais des vidéos youtube intégrées et enregistre des données statistiques anonymes.
hubspotutk	1 an 24 jours	Ce cookie est utilisé par HubSpot pour garder une trace des visiteurs du site web. Ce cookie est transmis à Hubspot lors de la soumission du formulaire et utilisé lors de la déduplication des contacts.

Cookie	Durée	Description
__cf_bm	30 minutes	Ce cookie, défini par Cloudflare, est utilisé pour prendre en charge la gestion des robots Cloudflare.
__hssc	30 minutes	HubSpot définit ce cookie pour assurer le suivi des sessions et pour déterminer si HubSpot doit incrémenter le numéro de session et les horodatages dans le cookie __hstc.

Cookie	Durée	Description
__hssrc	Session	Ce cookie est défini par Hubspot chaque fois qu'il modifie le cookie de session. Le cookie __hssrc défini à 1 indique que l'utilisateur a redémarré le navigateur, et si le cookie n'existe pas, on suppose qu'il s'agit d'une nouvelle session.
_GRECAPTCHA	5 mois 27 jours	Ce cookie est défini par le service recaptcha de Google pour identifier les bots afin de protéger le site Web contre les attaques malveillantes de spam.
cookielawinfo-checkbox-advertisement	11 mois	Défini par le plugin GDPR Cookie Consent, ce cookie est utilisé pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie " Publicité " .
cookielawinfo-checkbox-analytics	11 mois	Ce cookie est défini par le plugin de consentement aux cookies GDPR. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Analytics".
cookielawinfo-checkbox-functional	11 mois	Le cookie est défini par le consentement aux cookies GDPR pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie "Fonctionnel".
cookielawinfo-checkbox-necessary	11 mois	Ce cookie est défini par le plugin de consentement aux cookies du GDPR. Il est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Nécessaire".
cookielawinfo-checkbox-others	11 mois	Ce cookie est défini par le plugin de consentement aux cookies GDPR. Ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie " Autre ".
cookielawinfo-checkbox-performance	11 mois	Ce cookie est défini par le plugin de consentement aux cookies du GDPR. Ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Performance".
viewed_cookie_policy	11 mois	Ce cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke pas de données personnelles.