OnlyAI — Agents IA souverains, on-prem, sans fuite cloud

// 01_STACK.md

Le stack.
Open-source, end to end.

Pas de SaaS verrouillé. Pas de "modèle propriétaire" qu'on ne peut pas inspecter. Tout tourne sur votre infra (on-prem, VPS, data center privé) — et reste activable hors-ligne.

[ MODELS ]

Llama 4 / Mistral / Qwen 3

Modèles open-weight 7B–405B paramètres. Quantization GGUF/MLX pour runtime CPU/Apple Silicon. Pas de licence OpenAI à payer chaque token.

[ RUNTIME ]

Ollama / vLLM / MLX

Serveur d'inférence selon hardware : Ollama pour la simplicité, vLLM pour le débit batch, MLX pour Mac silicon. API OpenAI-compatible.

[ RAG ]

LangChain / LlamaIndex / pgvector

Indexation de votre documentation interne, base de connaissances vectorielle Postgres pgvector, retrieval contextuel. Vos docs, vos réponses.

[ ORCHESTRATION ]

N8N / Temporal

Workflows IA déclencheurs métier : email entrant → classification → réponse → CRM update. Visual builder N8N, retry automatique, audit log.

[ OBSERVABILITY ]

Langfuse / OpenTelemetry

Traces LLM, eval automatique, A/B testing prompts, coûts par token / par utilisateur. Dashboards Grafana inclus.

[ FRONT ]

Open WebUI / Custom React

Interface chat sobre type ChatGPT pour vos équipes ou widget custom embarqué dans votre app. Auth SSO, multi-utilisateurs, conversations partagées.

// 02_AGENTS.json

Les agents.
Sur mesure.

agent_01

Support client 24/7

L'agent répond 80% des tickets niveau 1 en moins de 10 secondes. Escalation humaine sur les cas complexes. Apprend de votre base de tickets historiques.

SLA: 10s p95 Multilingue Self-improving

agent_02

Prospection sortante

Recherche LinkedIn / annuaire pro, qualification, premier contact mail personnalisé, follow-up séquencé. CRM update auto. ROI ~10x un commercial junior.

HubSpot / Salesforce RGPD-compliant A/B prompts

agent_03

RAG documentaire

Vos docs internes, contrats, procédures, manuels qualité — tout indexé. Vos collaborateurs posent des questions en langage naturel, l'agent cite les sources.

Source citations Permissions ACL Update incrémental

agent_04

Reporting auto

Connexions DB / API métier, génération de rapports hebdo + analyses, envoi mail / Slack. "Ce qui a changé cette semaine" en plain English.

SQL natif PDF / HTML / MD Cron-driven

agent_05

Modération contenu

Filtrage UGC (forum, reviews, support), détection toxicité / spam / SPF, escalation modérateur humain pour les zones grises.

Multi-classifier Audit log Override humain

agent_06

Workflow custom

Vous nous décrivez le besoin, on conçoit l'agent. Exemples livrés : tri d'emails, génération devis, traduction technique, pre-screening CV, monitoring concurrent.

Ad hoc Cahier des charges Délai 2-6 sem.

// 03_CASE_STUDIES.log

Cas d'usage.
Vrais clients, vrais chiffres.

CASE_01

PME industrielle (45 salariés)

Agent RAG sur documentation produits + procédures qualité. Les commerciaux trouvent les bons arguments en 5 secondes au lieu de 15 minutes.

+18% conversion devis
après 3 mois

CASE_02

Cabinet d'avocats (12 collaborateurs)

RAG sur jurisprudence + contrats clients (anonymisés). L'IA tourne sur leur serveur — secret professionnel respecté, données jamais dans le cloud.

−4 h/sem par collaborateur
sur la recherche

CASE_03

E-commerce niche (B2B)

Chatbot support client multilingue intégré. 78% des questions résolues sans humain. Escalade automatique sur les cas livraison / SAV.

−62% tickets niveau 1
en 6 mois

// 04_PRICING.toml

Tarifs.
Forfait fixe.

Aucun coût caché. Aucun "par token". Vous achetez un agent, vous le possédez. La maintenance est optionnelle.

[ STARTER ]

Agent unique

2 500€ HT

paiement unique

1 agent IA livré
Cahier des charges + dev + déploiement
Formation à l'usage (2h)
3 mois de support inclus
Modèle open-source au choix

/deploy starter →

★ POPULAIRE

[ STACK ]

3 agents + infra

7 500€ HT

+ 199€/mois maintenance

3 agents IA combinés
Setup infra dédiée (VPS/serveur)
Pipeline RAG sur vos docs
Monitoring Langfuse + Grafana
SLA support 4h ouvrées
Évolutions 2j/mois incluses

/deploy stack →

[ ENTERPRISE ]

Sur mesure

sur devis

selon périmètre

Agents illimités
Hardware GPU dédié on-prem
Fine-tuning modèles
Intégrations SSO / LDAP / AD
Audit RGPD & sécurité
SLA 1h 24/7

/contact enterprise →

// READY_TO_DEPLOY?

$ ./onlyai.sh --your-project

Audit gratuit en 1h. On regarde votre cas, on dit honnêtement si l'IA est la bonne réponse, et on chiffre. Réponse sous 48h.

contact@onlyai.fr 06 22 34 25 30

// agents IA Lyon & remote · réponse en 24h

Le stack.Open-source, end to end.