L'essentiel en 60 secondes
Le timing du 5 novembre est excellent. Sur les 12 derniers mois, l'IA locale est passée du labo au catalogue :
des machines desktop dédiées à l'inférence sont commandables depuis octobre 2025 (NVIDIA DGX Spark, 3 999 USD),
une vague continue de modèles open source de très haut niveau alimente les déploiements souverains, et un
cloud IA souverain suisse existe commercialement à Genève (Infomaniak). En face, les risques cyber liés à l'IA
sont désormais formalisés par les référentiels officiels (OWASP, ENISA) : injection de prompt, fuite de données via les SaaS IA,
empoisonnement de modèles. Et côté réglementaire, la Suisse prépare un avant-projet de loi IA attendu d'ici fin 2026 :
l'événement tombe quelques semaines avant ce jalon. Le cadre des 3 niveaux (frontière hébergée → open source sur
cloud souverain → on-premise complet) est le bon fil rouge ; il faut y ajouter deux positions intermédiaires (API avec garanties
entreprise, et le « compagnon » dans le poste de travail déjà identifié à l'atelier 14). Reste à trancher ce matin : le titre,
le format, le lieu, la cible et le démonstrateur.
Toute utilisation de l'IA en entreprise combine deux briques : l'orchestrateur (l'outil qui pilote,
connecte et automatise) et le modèle (le LLM qui raisonne et produit). Selon l'endroit où vivent ces
deux briques et qui les contrôle, on obtient trois niveaux de souveraineté croissante :
Niveau 1 · Frontière hébergée
IA frontière chez un fournisseur américain
Orchestrateur SaaS + modèle frontière hébergé chez l'éditeur : Claude (Anthropic), GPT (OpenAI), Gemini (Google).
✅Atouts : intelligence maximale, zéro investissement matériel, démarrage immédiat.
⚠️Limites : les données sortent de l'entreprise, juridiction américaine, dépendance totale au fournisseur (le cas Fable : l'accès peut être coupé du jour au lendemain).
👥Pour qui : données non sensibles, besoin de la meilleure capacité brute.
Niveau 2 · Open source hébergé
Modèles open source sur cloud loué (souverain)
Orchestrateur open source (n8n auto-hébergé, OpenWebUI…) + modèles open-weights (Mistral, DeepSeek, Llama, Qwen, gpt-oss…) sur un cloud européen ou suisse : Infomaniak, Exoscale, OVHcloud, Hostinger.
✅Atouts : juridiction choisie (Suisse : nLPD), réversibilité (on peut changer de modèle et d'hébergeur), pas de CAPEX matériel.
⚠️Limites : un tiers héberge toujours vos données ; les garanties « aucun stockage » restent déclaratives ; compétences d'exploitation nécessaires.
👥Pour qui : données métier sensibles, exigence nLPD, budget maîtrisé.
Niveau 3 · On-premise complet
LLM + orchestrateur open source chez vous
Tout tourne sur des serveurs qui appartiennent à l'entreprise : serveur GPU dédié, machine desktop type DGX Spark, voire postes de travail.
✅Atouts : souveraineté maximale, les données ne quittent jamais le bâtiment, aucun abonnement critique, fonctionne même sans internet.
⚠️Limites : investissement matériel, exploitation et sécurité physique à assumer, modèles plus petits que la frontière (mais l'écart se resserre).
👥Pour qui : secret professionnel (santé, fiduciaire, juridique), données patients / clients, indépendance totale.
Y a-t-il d'autres niveaux ? Oui, deux positions intermédiaires complètent le spectre - et en pratique,
la réponse pour une PME est presque toujours hybride : un routage qui envoie chaque tâche au niveau
le moins exposé acceptable pour la donnée concernée. C'est d'ailleurs un argument cyber en soi : l'hybride impose de
classifier ses données, ce qui est exactement le réflexe que l'événement doit déclencher.
| Position | Description | Où sont les données ? |
| Niveau 1 | SaaS frontière grand public / pro - abonnements ChatGPT, Claude, Gemini | Chez l'éditeur américain |
| Niveau 1bis | API frontière avec garanties entreprise - Azure OpenAI, AWS Bedrock, offres « zero data retention » : le modèle reste américain mais tourne dans une région cloud choisie avec engagements contractuels | Région cloud contractuelle (souvent UE), éditeur US |
| Niveau 2 | Open source sur cloud souverain - modèles open-weights sur Infomaniak, Exoscale, OVHcloud… | Datacenter suisse ou européen d'un tiers |
| Niveau 3 | On-premise serveur - serveur GPU ou machine IA dédiée dans l'entreprise | Dans l'entreprise |
| Niveau 3bis | Le « compagnon » du poste de travail - IA locale sur le laptop / desktop de l'utilisateur (puces Apple Silicon, PC à NPU), identifiée à l'atelier 14 : contrainte à la machine et aux demandes locales | Sur le poste de l'utilisateur |
Note : ce tableau se lit sans les couleurs - chaque position est identifiée par son libellé « Niveau N ».
Chaque fait ci-dessous a été vérifié contre ses sources primaires par relecture contradictoire (méthode en
section 10). Le badge indique le niveau de confiance.
🖥️ Le matériel IA desktop est devenu réel : NVIDIA DGX SparkVérifié · confiance haute
Commandable depuis le 15 octobre 2025 à 3 999 USD, le DGX Spark (puce GB10 Grace Blackwell) annonce
~1 pétaflop IA (mesure vendeur en FP4 avec sparsité) et 128 Go de mémoire unifiée ; il exécute en local
l'inférence de modèles jusqu'à 200 milliards de paramètres et le fine-tuning jusqu'à 70 milliards.
Réserve : bande passante mémoire limitée (273 Go/s), c'est une machine de développement et de validation, pas un serveur
de production haute charge.
Sources : communiqué NVIDIA (nvidianews.nvidia.com), tests indépendants LMSYS / StorageReview.
🗄️ Et le cran au-dessus arrive : NVIDIA DGX StationVérifié · confiance moyenne
Superchip GB300 Grace Blackwell Ultra, ~775 Go de mémoire cohérente (le chiffre varie de 748 à 784 Go selon
les documents vendeur), modèles jusqu'à 1 000 milliards de paramètres en FP4. Disponible au printemps 2026
chez 7 constructeurs (ASUS, Boxx, Dell, GIGABYTE, HP, MSI, Supermicro).
Source : blog NVIDIA (janvier 2026), corroboré par les pages constructeurs.
🧠 Une vague continue de modèles open source de haut niveauVérifié · confiance haute
Sur la période : gpt-oss-120b (OpenAI, août 2025 - le retour d'OpenAI à l'open source), Qwen3-235B
(Alibaba), Kimi-K2 Thinking (Moonshot, nov. 2025, 1 000 Md MoE), DeepSeek-V3.2 (déc. 2025),
Mistral Large 3 (déc. 2025, 675 Md MoE, licence Apache 2.0 - l'option européenne), Llama 4 Maverick
(Meta, avril 2025). Et le rythme ne faiblit pas : rien qu'en juin 2026, GLM-5.2 (Zhipu, licence MIT, contexte 1M tokens),
Kimi K2.7 Code (spécialisé code) et DiffusionGemma 26B-A4B (Google, Apache 2.0) - ce dernier tournant en local
sur un GPU grand public avec ~18 Go de VRAM en version quantifiée : le profil type du modèle « PME niveau 3 ».
Sources : annonces éditeurs (Mistral, DeepSeek, Google), blog NVIDIA, Hugging Face, Simon Willison, Artificial Analysis.
🚨 Les risques IA sont désormais dans les référentiels officielsVérifié · confiance haute
L'OWASP Top 10 LLM (édition 2025, toujours en vigueur en juillet 2026) classe : n°1 l'injection de prompt,
n°2 la divulgation d'informations sensibles, n°4 l'empoisonnement des données et des modèles.
L'ENISA (agence de cybersécurité de l'UE, Threat Landscape 2025) documente les attaques sur la chaîne
d'approvisionnement IA : modèles empoisonnés sur les plateformes de partage, paquets Python piégés, et le vecteur
« Rules File Backdoor » (démontré par Pillar Security) qui injecte des instructions cachées dans les assistants de code
comme Cursor et GitHub Copilot.
Sources : genai.owasp.org, ENISA Threat Landscape 2025, Pillar Security, The Hacker News.
🎣 Le phishing assisté par IA domine l'ingénierie socialeVérifié · à citer avec attribution
Selon l'ENISA, reprenant les données du fournisseur KnowBe4 : plus de 80 % des emails de phishing identifiés
entre septembre 2024 et février 2025 utilisaient l'IA « dans une certaine mesure ». Attention en communication : d'autres études
mesurant les emails entièrement générés par IA donnent 0,7 à 4,7 %. Toujours dire « selon ENISA / KnowBe4 »,
jamais asséner le chiffre comme un fait brut.
Source : ENISA Threat Landscape 2025 (p. 15), KnowBe4 Phishing Threat Trends Report vol. 5.
⚖️ Réglementation : la Suisse choisit la voie sectorielleVérifié · confiance haute
La Suisse n'a aucune loi générale sur l'IA. Le Conseil fédéral a arrêté sa feuille de route le
12 février 2025 : ratification de la Convention du Conseil de l'Europe sur l'IA (signée le 27 mars 2025),
adaptations législatives ciblées (transparence, protection des données, non-discrimination) et approche sectorielle
explicitement préférée à un « AI Act » horizontal comme dans l'UE. Point clé : « pas de loi générale » ne veut pas dire
« pas de règles » - la nLPD s'applique pleinement à tout traitement de données par IA, et l'AI Act européen
a une portée extraterritoriale sur les PME suisses qui servent le marché UE.
Sources : Chancellerie fédérale (bk.admin.ch), communiqué du Conseil fédéral du 12.02.2025, swissprivacy.law.
| Niveau | Maturité juillet 2026 | Ce qui manque encore |
Niveau 1 Frontière |
Mature et dominant. La meilleure capacité brute, l'écosystème le plus riche. C'est là que se crée le shadow AI : les collaborateurs y versent des données d'entreprise sans cadre. |
Garanties de souveraineté réelles ; protection contre la dépendance fournisseur (cas Fable). |
Niveau 2 Cloud souverain |
Opérationnel en Suisse. Infomaniak AI Services : modèles open source via API compatible OpenAI, exécutés dans ses propres datacenters genevois (D4 Plan-les-Ouates), avec conformité nLPD / RGPD revendiquée et engagement « aucune requête stockée, rien ne sert à l'entraînement ». La brique existe commercialement à quelques kilomètres de notre public. |
Ces engagements sont auto-déclarés par le fournisseur (pas d'audit tiers identifié) ; les GPU restent du matériel NVIDIA américain. À présenter comme « revendiqué par le fournisseur ». |
Niveau 3 On-premise |
Matériellement crédible depuis octobre 2025. DGX Spark à 3 999 USD pour maquetter et servir des modèles moyens ; DGX Station (printemps 2026) pour les très gros modèles ; des modèles récents comme DiffusionGemma tournent sur un simple GPU grand public. Les anciens Mac Mini prêtés par Computer Shop permettent de maquetter dès cet été. |
Compétences d'exploitation ; distinction machine de développement vs serveur de production ; le chiffrage TCO complet reste à instruire (voir encadré). |
⚠️ Angles encore à instruire avant l'événement (trous de la veille, pas absence de faits)
La veille vérifiée ne couvre pas encore : les
coûts d'entrée et TCO comparés des 3 niveaux pour une PME de
10-250 employés ; la maturité précise des
orchestrateurs locaux (Ollama, vLLM, LM Studio, OpenWebUI, n8n
auto-hébergé) ; le
calendrier détaillé de l'AI Act européen et sa portée exacte sur les PME suisses ;
les offres
OVHcloud / Exoscale / Hostinger comparées à Infomaniak ; les capacités réelles des
NPU laptops et Mac (la lecture « les puces Apple M5 positionnent le poste de travail comme serveur d'IA
locale » vient de l'atelier 14 et de Computer Shop - à valider techniquement) ; et les
taux d'adoption PME.
Ces briques sont au plan de charge de la préparation (section 8).
« Demain, si Microsoft coupait la ligne comme avec Fable, qu'est-ce qui se passe ? »
- Eric Darien, atelier 14 (26 juin 2026)
AXE 1
On vend ce qu'on fait pour nous
Le système d'entreprise ABAXINFO (site, LinkedIn, prospection, bientôt les opérations) est lui-même
en cours de bascule vers un orchestrateur et des modèles open source (décision D-12, atelier 14). L'événement ne présente
pas une théorie : il montre notre propre infrastructure en fonctionnement. C'est la différence entre un
séminaire et une démonstration.
AXE 2
Le créneau romand est quasi vide
Le diagnostic du paysage (brainstorming du 1er juin) tenait déjà : personne en Suisse romande ne montre
de l'IA locale exécutée en direct devant des dirigeants de PME. Les conférences IA locales restent théoriques
ou académiques. « Voir pour croire » est notre différenciateur : une démo live vaut tous les slides.
AXE 3
La cybersécurité est notre langage naturel
ABAXINFO parle cyber toute l'année (X Flash, diagnostic « X scan », campagne mairies). L'angle de
l'événement n'est pas « l'IA c'est formidable » mais « comment profiter de l'IA sans perdre le contrôle de vos
données » - injection de prompt, fuite via les SaaS, dépendance fournisseur. AXION apporte l'orchestration et
la méthode cas d'usage ; ABAXINFO apporte la confiance IT / cyber et la proximité terrain.
AXE 4
Partir des cas d'usage, jamais de la technologie
Les retours terrain d'Eric (D-13) sont la matière première du storytelling : la pharmacie inquiète de
voir ses données dispersées dans des IA grand public, le médecin d'abord sceptique dont l'objection tombe quand l'IA se
connecte à son logiciel existant (« lister toutes les hernies que j'ai traitées »). Principe : on ne fait pas de
l'IA pour faire de l'IA - on part de la souffrance la plus forte et du potentiel le plus élevé.
AXE 5
Le momentum réglementaire joue pour nous
Avant-projet de loi IA suisse attendu d'ici fin 2026, nLPD pleinement applicable, AI Act européen qui
touche les PME exportatrices : le dirigeant romand a besoin d'une boussole simple. Les 3 niveaux de souveraineté
sont cette boussole - un cadre mémorisable qu'il repartira en sachant se situer.
Le grand thème est acté depuis l'atelier 14 : souveraineté, IA locale et cybersécurité. Reste à choisir
l'angle d'attaque du titre. Trois options, de la plus pédagogique à la plus provocante :
Option A · Recommandée
« Votre IA, vos données, chez vous - les 3 niveaux de l'IA souveraine pour les PME romandes »
Le cadre des 3 niveaux comme promesse : chaque participant repart en sachant se situer et
quelle marche gravir. Pédagogique, positif, structurant - et le fil rouge de toute la soirée (une démo par niveau).
Compatible avec un naming de famille « X » si souhaité (à discuter, voir section 9).
Option B · Le hook du cas Fable
« Et si votre fournisseur coupait la ligne demain ? - IA locale & cybersécurité »
L'accroche par le risque de dépendance, avec l'histoire vraie du cas Fable en ouverture. Très fort en
communication LinkedIn (la question fait le post), mais l'angle anxiogène doit rester l'ouverture, pas tout le contenu -
la voix ABAXINFO apporte de la sérénité, elle ne vend pas par la peur.
Option C · L'angle conformité
« IA & données : ce que la nLPD attend déjà de vous (et ce que la future loi suisse changera) »
L'angle réglementaire, dopé par l'avant-projet de loi attendu fin 2026. Crédible et différenciant pour
les fiduciaires et la santé, mais plus étroit : mieux en module de 15 minutes dans l'événement qu'en thème principal.
Recommandation : Option A comme thème et structure, avec le hook de l'option B en ouverture
(la citation d'Eric) et un module conformité de l'option C avant le networking. Les trois se combinent naturellement.
Q1Thème et titre : option A, B, C ou combinaison ?
Recommandation : A en structure + hook B en ouverture + module conformité C (section 6).
Q2Format et durée : soirée (17h30-21h) ou matinée (8h-11h) ? Keynote + démos + networking ?
Le format soirée favorise les dirigeants ; la matinée favorise l'attention. Dans les deux cas : 1 keynote courte,
des démos live par niveau, du networking généreux.
Q3Lieu et jauge : reconfirmer la piste Tesla Geneva ? Quelle taille de salle ?
La jauge réaliste conditionne l'ambition : mieux vaut 40 présents dans une salle pleine que 40 dans une salle de 120.
Q4Cible prioritaire : santé / pharmacie et fiduciaires d'abord, ou toutes PME romandes ?
Les cas d'usage existants (D-13) plaident pour une dominante secret professionnel, plus facile à
raconter et à convertir.
Q5Partenaires : Computer Shop sur scène (matériel) ? Autres partenaires (hébergeur souverain, assureur cyber…) ?
Computer Shop est déjà dans la boucle (prêt de Mac Mini, partenariat AO-05 Trajets). Un hébergeur souverain
en partenaire apporterait la brique niveau 2 - à peser contre la neutralité du discours.
Q6La démo : quel cas d'usage en live ? Un assistant sur données fictives de pharmacie ?
Un scénario « données patients / clients fictives, l'IA répond sans que rien ne sorte de la machine » est le plus
parlant pour la cible. À choisir maintenant car il dimensionne tout le travail d'août.
Q7Entrée offerte ou payante ? Budget global ?
Le brainstorming du 1er juin penchait pour l'entrée offerte financée par la conversion post-événement.
À confirmer avec le budget (lieu, traiteur, matériel démo, impression).
Q8Le nom : garder « Local AI » (nom du projet ClickUp) ou créer un nom d'événement dans la famille « X » (X scan, X Flash) ?
Un nom de famille « X » renforcerait la cohérence de marque ABAXINFO. L'atelier 14 notait que le nom du projet
pourra évoluer. Décision de branding à prendre avant le lancement de la communication de septembre.
Méthode. Veille multi-angles (modèles & matériel, réglementation UE / Suisse, risques cyber IA, économie PME
& cloud souverain, contre-point sceptique) menée le 3 juillet 2026 : 23 sources collectées, 110 affirmations extraites,
25 vérifiées en priorité par
relecture contradictoire (3 vérificateurs indépendants par affirmation, chacun cherchant
à la réfuter) : 22 confirmées, 3 réfutées et écartées. Les affirmations non couvertes sont explicitement marquées
« à instruire » dans ce document plutôt que présentées comme des faits.
Sources primaires principales :
- NVIDIA - communiqué DGX Spark : nvidianews.nvidia.com · blog DGX Spark & Station / modèles ouverts : blogs.nvidia.com
- ENISA Threat Landscape 2025 : enisa.europa.eu (PDF)
- OWASP Top 10 LLM 2025 : genai.owasp.org
- Chancellerie fédérale suisse - IA : bk.admin.ch · communiqué du Conseil fédéral du 12.02.2025 (admin.ch) · analyse : swissprivacy.law
- Infomaniak AI Services : infomaniak.com (engagements auto-déclarés du fournisseur)
- Modèles juin 2026 : blog Google (DiffusionGemma), Hugging Face (Kimi K2.7 Code), Simon Willison / Artificial Analysis (GLM-5.2), Mistral (mistral.ai/news), DeepSeek (api-docs.deepseek.com)
- Tests indépendants DGX Spark : lmsys.org
Règles d'usage dans les supports de l'événement : les métriques vendeur (pétaflop FP4, « no storage » Infomaniak)
se citent toujours avec attribution ; le chiffre phishing « plus de 80 % » se dit « selon ENISA / KnowBe4 » ; les trois
affirmations réfutées (section 4) sont interdites de support ; revalidation générale des faits à J-30 / J-15.