David Kossovsky, Senior Consultant Itecor · November 12, 2025
L’intelligence artificielle envahit toutes les conversations d’entreprise, souvent avec plus de marketing que de substance réelle. Ici, nous choisissons de mettre l’expertise au premier plan. Cet article s’adresse particulièrement aux spécialistes, quand chacun y découvrira l’excellence et la rigueur qui nourrissent nos projets au quotidien.
une approche test-and-learn assumée
Dans le cadre de notre initiative AI composée de 7 piliers (Former nos collaborateurs, Adapter nos services, …), nous avons lancé plusieurs études et pilotes sur l’utilisation de l’IA dans notre quotidien de consultants.
L’une de ces études s’est portée sur la mise en place d’une architecture « IA » dédiée nous permettant de travailler sur des données confidentielles tout en comprenant les rouages technologiques de bout en bout, du hardware à l’interface utilisateur sans dépendance externe.
L’objectif étant à terme de pouvoir accompagner nos clients sur ces thématiques et sur les challenges d’architecture IA autohébergées au sein du Système d’Information.
premiers émois
Nos premières expérimentations nous ont amenés à implémenter une infrastructure hébergée chez un infogérant « local ».
Cette infrastructure nous a permis de déployer des modèles LLM Opensource mis à disposition de collaborateurs dans le cadre de challenges et use-cases internes.
Principaux lessons-learned :
limitation des temps de réponse,
limitation des modèles déployables,
dépendance du fournisseur pour adapter l’infrastructure (entendable et appréciable pour une infrastructure déployée et opérée, mais par contre plus délicat en phase d’expérimentation)
nouvelle étape
Afin d’adresser également les problématiques opérationnelles (LMOps), nous avons décidé d’investir dans du matériel professionnel adapté aux charges de travail IA avec des serveurs DGX Spark puis DGX Station de NVIDIA.
Le DGX Spark, équipé du superchip NVIDIA GB10 Grace Blackwell, délivre jusqu’à 1 pétaflop de performance IA dans un format compact avec 128 Go de mémoire unifiée (nous nous intéressons également de près à la DGX Station, et attendons la sortie des puces GB300, les détails de leur fonctionnement et la dépendance à GPU externe).
Ces infrastructures nous permettront ainsi de développer et tester des modèles d’IA jusqu’à 200 milliards de paramètres localement, avec la possibilité de connecter plusieurs systèmes pour traiter des modèles encore plus importants.
Nous avons choisi de nous concentrer sur des architectures basées sur les superchips Grace Blackwell, comme le DGX Spark (1 pétaflop, 128 Go de mémoire unifiée), afin de bénéficier d’une convergence CPU/GPU unique et d’optimiser le traitement massif de modèles IA. Nous privilégions les matériels NVIDIA unifié en raison des facilités d’intégration offertes par CUDA, anticipant ainsi une réelle rupture technologique auxquelles nous croyons.
NB : notre choix aurait également pu se porter sur une architecture basée sur AMD / Ryzen AI Max+. Néanmoins, elle nécessite d’être adossées à des backend FastFlowLM au lieu d’Ollama.
backend
Nos tests portent sur plusieurs modèles open source de pointe notamment Mistral AI (modèles multimodaux haute capacité), Llama 4 (architecture Mixture of Experts supportant jusqu’à plusieurs millions de tokens), GPT-OSS d’OpenAI optimisé pour l’auto-hébergement, ainsi que le modèle suisse Apertus développé par le partenariat EPFL – ETH Zurich – CSCS. Nous ne visons pas à construire nos propres modèles, mais à approfondir continuellement notre expertise au contact des innovations de la communauté open source.
frontend
Nous recherchons des solutions qui permettent, au-delà d’un portail utilisateur ergonomique, une gestion aisée des différents utilisateurs et de leurs droits.
Nous attendons également d’un frontend la possibilité d’exploiter des modèles on-premise ou cloud et une gestion fine des accès par API ainsi que la construction de RAG sur des corpus documentaires importants sans avoir à les exposer.
Nous avons commencé nos tests avec Ollama Web UI mais nous testons activement les alternatives telles que LibreChat, AnythingLLM, LobeChat, Text Generation Web UI.
pourquoi cette approche
Cette approche nous permet de :
Comprendre la technologie : nous continuons à développer une expertise réelle. Nous nous imposons de suivre les nombreuses évolutions chaque semaine
Maîtriser nos données : tout reste dans nos infrastructures pour les manipulations de données confidentielles ou sensibles.
Tester sans risque : les expérimentations se font sur nos propres environnements.
Comprendre les limites : savoir évaluer les limites des outils d’IA sur le marché et leurs réels coûts d’exploitation. Certains processus ne nécessitent pas forcément d’IA. Nous développons des méthodologies et outils pour mesurer rigoureusement la valeur ajoutée de l’IA par rapport à une simple automatisation, afin d’éviter la surqualification
Et enfin offrir à nos collaborateurs un environnement dédié sur lequel apprendre, et expérimenter sans risque.
la suite du programme
Préparer l’avenir : cette expérimentation nous permettra de vous apporter notre expertise et vous accompagner dans votre stratégie IA et son implémentation dans vos processus métiers.
Notre objectif est ainsi double :
vous aider à choisir les meilleurs modèles selon les cas d’usage, et la façon de les intégrer.
vous présenter des retours d’expérimentations concrets, portés sur la réelle valeur générée pour l’entreprise.
Pas de promesses marketing, juste du concret basé sur notre expertise.
Nous utilisons des cookies sur notre site web pour vous offrir l'expérience la plus pertinente en mémorisant vos préférences et vos visites répétées. En cliquant sur "Accepter tout", vous consentez à l'utilisation de TOUS les cookies. Toutefois, vous pouvez visiter "Paramètres des cookies" pour fournir un consentement contrôlé.
Ce site web utilise des cookies pour améliorer votre expérience lorsque vous naviguez sur le site. Parmi ceux-ci, les cookies qui sont catégorisés comme nécessaires sont stockés sur votre navigateur car ils sont essentiels pour le fonctionnement des fonctionnalités de base du site web. Nous utilisons également des cookies tiers qui nous aident à analyser et à comprendre comment vous utilisez ce site web. Ces cookies ne seront stockés dans votre navigateur qu'avec votre consentement. Vous avez également la possibilité de refuser ces cookies. Mais la désactivation de certains de ces cookies peut affecter votre expérience de navigation.
Les cookies publicitaires sont utilisés pour fournir aux visiteurs des annonces et des campagnes de marketing pertinentes. Ces cookies suivent les visiteurs à travers les sites web et collectent des informations pour fournir des annonces personnalisées.
Cookie
Durée
Description
IDE
1 an 24 jours
Les cookies Google DoubleClick IDE sont utilisés pour stocker des informations sur la façon dont l'utilisateur utilise le site web afin de lui présenter des annonces pertinentes et en fonction de son profil.
test_cookie
15 minutes
Le test_cookie est défini par doubleclick.net et est utilisé pour déterminer si le navigateur de l'utilisateur accepte les cookies.
VISITOR_INFO1_LIVE
5 mois 27 jours
Un cookie défini par YouTube pour mesurer la bande passante qui détermine si l'utilisateur obtient la nouvelle ou l'ancienne interface du lecteur.
YSC
Session
Le cookie YSC est défini par Youtube et est utilisé pour suivre les vues des vidéos intégrées dans les pages Youtube.
Les cookies analytiques sont utilisés pour comprendre comment les visiteurs interagissent avec le site web. Ces cookies permettent de fournir des informations sur les métriques le nombre de visiteurs, le taux de rebond, la source de trafic, etc.
Cookie
Durée
Description
__hstc
1 an 24 jours
Il s'agit du principal cookie défini par Hubspot, pour le suivi des visiteurs. Il contient le domaine, l'horodatage initial (première visite), le dernier horodatage (dernière visite), l'horodatage actuel (cette visite) et le numéro de session (qui s'incrémente pour chaque session suivante).
_ga
2 ans
Le cookie _ga, installé par Google Analytics, calcule les données relatives aux visiteurs, aux sessions et aux campagnes et assure également le suivi de l'utilisation du site pour le rapport d'analyse du site. Le cookie stocke les informations de manière anonyme et attribue un numéro généré de manière aléatoire pour reconnaître les visiteurs uniques.
_ga_JYCPSB48B8
2 ans
Ce cookie est installé par Google Analytics.
CONSENT
16 ans 2 mois 25 jours 10 heures
YouTube place ce cookie par le biais des vidéos youtube intégrées et enregistre des données statistiques anonymes.
hubspotutk
1 an 24 jours
Ce cookie est utilisé par HubSpot pour garder une trace des visiteurs du site web. Ce cookie est transmis à Hubspot lors de la soumission du formulaire et utilisé lors de la déduplication des contacts.
Les cookies fonctionnels aident à réaliser certaines fonctionnalités comme le partage du contenu du site web sur les plateformes de médias sociaux, la collecte de commentaires et d'autres fonctionnalités tierces.
Cookie
Durée
Description
__cf_bm
30 minutes
Ce cookie, défini par Cloudflare, est utilisé pour prendre en charge la gestion des robots Cloudflare.
__hssc
30 minutes
HubSpot définit ce cookie pour assurer le suivi des sessions et pour déterminer si HubSpot doit incrémenter le numéro de session et les horodatages dans le cookie __hstc.
Les cookies nécessaires sont absolument indispensables au bon fonctionnement du site web. Ces cookies assurent les fonctionnalités de base et les caractéristiques de sécurité du site web, de manière anonyme.
Cookie
Durée
Description
__hssrc
Session
Ce cookie est défini par Hubspot chaque fois qu'il modifie le cookie de session. Le cookie __hssrc défini à 1 indique que l'utilisateur a redémarré le navigateur, et si le cookie n'existe pas, on suppose qu'il s'agit d'une nouvelle session.
_GRECAPTCHA
5 mois 27 jours
Ce cookie est défini par le service recaptcha de Google pour identifier les bots afin de protéger le site Web contre les attaques malveillantes de spam.
cookielawinfo-checkbox-advertisement
11 mois
Défini par le plugin GDPR Cookie Consent, ce cookie est utilisé pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie " Publicité " .
cookielawinfo-checkbox-analytics
11 mois
Ce cookie est défini par le plugin de consentement aux cookies GDPR. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Analytics".
cookielawinfo-checkbox-functional
11 mois
Le cookie est défini par le consentement aux cookies GDPR pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie "Fonctionnel".
cookielawinfo-checkbox-necessary
11 mois
Ce cookie est défini par le plugin de consentement aux cookies du GDPR. Il est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Nécessaire".
cookielawinfo-checkbox-others
11 mois
Ce cookie est défini par le plugin de consentement aux cookies GDPR. Ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie " Autre ".
cookielawinfo-checkbox-performance
11 mois
Ce cookie est défini par le plugin de consentement aux cookies du GDPR. Ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie "Performance".
viewed_cookie_policy
11 mois
Ce cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke pas de données personnelles.
Les cookies de performance sont utilisés pour comprendre et analyser les indices de performance clés du site Web, ce qui permet d'offrir une meilleure expérience utilisateur aux visiteurs.