Coding IA

Formation Déploiement LLM Local : Ollama, Open WebUI et Stack Souveraine en 1 Jour

Déployez et opérez des LLM en local ou sur cloud souverain avec Ollama et Open WebUI. La formation de référence pour les organisations qui veulent garder le contrôle de leurs données et de leur infrastructure IA.

Vous saurez déployer, configurer et optimiser une stack LLM locale complète — du choix du modèle au monitoring en production — sans envoyer une seule donnée vers un cloud américain.

1 jour Maîtrise Hybride 3-8 participants 80% pratique Finançable OPCO

Demander un devis Télécharger le programme

Finançable OPCO

80% pratique

3-8 participants

Présentiel ou distanciel

Exercices disponibles en :PythonJavaScript / TypeScript

Prérequis

Ce que vous devez savoir

Connaissances Linux et Docker
Terminal et CLI maîtrisés
Compréhension basique des LLM et de l'IA générative
Un serveur ou VM avec GPU recommandé (pas obligatoire — CPU possible)

Public cible

À qui s'adresse cette formation

DevOps, SRE, architectes et développeurs seniors dans des organisations soucieuses de la souveraineté des données, de la conformité RGPD ou ayant des contraintes de sécurité empêchant l'utilisation de clouds publics.

Programme

Programme détaillé

Jour 1

Déployer et Opérer des LLM en Local

Panorama LLM local

Pourquoi déployer en local — RGPD, coûts, latence, offline
Modèles disponibles — Llama 3, Mistral, Phi, Gemma, Qwen — comparatif
Hardware requirements — GPU vs CPU, VRAM, quantization
Benchmarking — performances locales vs API cloud

Exercice : Benchmark 3 modèles sur votre hardware — comparer latence, qualité et coûts

Ollama deep dive

Installation et configuration avancée
Gestion des modèles — pull, create, customize, Modelfile
API REST Ollama — intégration dans vos applications
Multi-GPU et optimisation mémoire

Exercice : Déployer Ollama avec un modèle custom fine-tuné via Modelfile

Open WebUI et interface utilisateur

Installation et configuration Open WebUI
Gestion multi-utilisateurs et permissions
RAG intégré — upload documents et recherche
Intégration avec Ollama et providers externes en fallback

Exercice : Déployer Open WebUI connecté à Ollama avec RAG sur documents internes

Production et cloud souverain

Docker Compose production-ready avec Ollama + Open WebUI + monitoring
Déploiement sur hébergeurs souverains — OVH, Scaleway, Infomaniak
Monitoring et alerting — Prometheus + Grafana
Backup, mise à jour et maintenance des modèles

Exercice : Déployer la stack complète sur un VPS souverain avec monitoring

Évaluation

Évaluation & certification

Méthode d'évaluation

Évaluation continue + déploiement d'une stack LLM locale fonctionnelle en fin de formation

Certification

Attestation de compétences Better People

Livrables

Stack Ollama + Open WebUI déployée et configurée
Docker Compose production-ready
Dashboard de monitoring Grafana
Guide de maintenance et mise à jour des modèles

Pourquoi se former au déploiement LLM local ?

La souveraineté des données n’est plus une option — c’est une obligation pour de nombreuses organisations. Secteur public, santé, défense, finance, industrie : des milliers d’entreprises ne peuvent pas envoyer leurs données vers des clouds américains.

La bonne nouvelle : les modèles open source ont atteint un niveau de qualité qui les rend viables pour la production. Ollama et Open WebUI offrent une expérience utilisateur comparable aux solutions cloud, avec un contrôle total sur les données et l’infrastructure.

Ce que vous apprendrez

Choisir le bon modèle : Llama 3, Mistral, Phi, Gemma, Qwen — comparatif objectif par cas d’usage
Déployer Ollama en production avec configuration avancée et Modelfile custom
Configurer Open WebUI avec gestion multi-utilisateurs, permissions et RAG intégré
Optimiser les performances : quantization, multi-GPU, gestion mémoire
Mettre en production avec Docker Compose, monitoring Prometheus+Grafana et backups
Déployer en souverain sur OVH, Scaleway ou Infomaniak avec data residency FR/EU

Aller plus loin

Formations complémentaires

LLM & Fondamentaux

APIs Modèles

Maîtrisez les APIs OpenAI, Anthropic, Mistral et Google en 2 jours. Intégration, streaming, function calling, coûts. Pour dev seniors. OPCO éligible.

2j Maîtrise Py JS Java Go

Coding IA

Claude Code Avancé

Maîtrisez les Skills, serveurs MCP et l'automatisation avancée de Claude Code en 1 jour. Pour développeurs ayant déjà pratiqué Claude Code. Finançable OPCO.

1j Expert Py JS

Coding IA Populaire

Claude Code

Maîtrisez le CLI IA d'Anthropic pour coder, reviewer, tester et refactorer avec un agent autonome dans votre terminal. Formation 2 jours, 80% pratique.

2j Maîtrise Py JS Java Go

FAQ

Questions fréquentes

Oui. En déployant en local ou sur un hébergeur souverain français/européen, aucune donnée ne quitte votre infrastructure. C'est la solution la plus sûre pour les organisations soumises à des contraintes réglementaires strictes.

Pour les modèles 7B quantifiés, 8 Go de VRAM suffisent (RTX 3060/4060). Pour les modèles 13B-34B, comptez 16-24 Go de VRAM. La formation couvre aussi le déploiement CPU pour les organisations sans GPU dédié.

Les modèles open source de 70B+ paramètres rivalisent avec GPT-4 sur de nombreuses tâches. Pour les modèles plus petits (7B-13B), la qualité est suffisante pour la majorité des cas d'usage métier — classification, extraction, résumé, Q&A sur documents.

Un VPS avec GPU chez OVH ou Scaleway coûte entre 100€ et 500€/mois selon la puissance. C'est souvent 3-5x moins cher que les APIs cloud pour un volume de requêtes moyen à élevé, avec en bonus le contrôle total des données.

Oui, Better People est organisme de formation déclaré. Nous vous accompagnons dans les démarches de prise en charge OPCO. Contactez-nous pour un devis personnalisé.

La formation couvre les stratégies de mise à jour : pull automatique, tests de régression avant déploiement, blue/green deployment des modèles. Ollama simplifie grandement ce processus par rapport aux déploiements manuels.

Passez à l'action

Prêt à former
votre équipe ?

Demandez un devis personnalisé pour votre équipe. Nous adaptons le contenu à votre stack et vos cas d'usage.

OPCO