SYSTEM/ONLINE MODELclaude-opus-4-7 REGIONeu-fr-1 LATENCY TOKENS/S DEPLOY [_] →

AGENTS_IA · ON_PREM · ZERO_CLOUD_US

Votre IA. Chez vous. Pas chez Sam.

Agents conversationnels, RAG, automation N8N, modèles open-source self-hosted — déployés sur votre infra. Aucune donnée ne sort. Aucun abonnement OpenAI / Anthropic à payer chaque mois.

[01]100% on-prem
[02]Zéro cloud US
[03]RGPD by design
[04]CapEx not OpEx
onlyai-repl :: claude-opus-4-7 :: streaming READY
RAG // CHATBOT // AUTOMATION // EMBEDDINGS // FINE-TUNING // OBSERVABILITY // ON-PREM //  RAG // CHATBOT // AUTOMATION // EMBEDDINGS // FINE-TUNING // OBSERVABILITY // ON-PREM //  RAG // CHATBOT // AUTOMATION // EMBEDDINGS // FINE-TUNING // OBSERVABILITY // ON-PREM // 
// 01_STACK.md

Le stack.
Open-source, end to end.

Pas de SaaS verrouillé. Pas de "modèle propriétaire" qu'on ne peut pas inspecter. Tout tourne sur votre infra (on-prem, VPS, data center privé) — et reste activable hors-ligne.

[ MODELS ]

Llama 4 / Mistral / Qwen 3

Modèles open-weight 7B–405B paramètres. Quantization GGUF/MLX pour runtime CPU/Apple Silicon. Pas de licence OpenAI à payer chaque token.

[ RUNTIME ]

Ollama / vLLM / MLX

Serveur d'inférence selon hardware : Ollama pour la simplicité, vLLM pour le débit batch, MLX pour Mac silicon. API OpenAI-compatible.

[ RAG ]

LangChain / LlamaIndex / pgvector

Indexation de votre documentation interne, base de connaissance vectorielle Postgres pgvector, retrieval contextuel. Vos docs, vos réponses.

[ ORCHESTRATION ]

N8N / Temporal

Workflows IA déclencheurs métier : email entrant → classification → réponse → CRM update. Visual builder N8N, retry automatique, audit log.

[ OBSERVABILITY ]

Langfuse / OpenTelemetry

Traces LLM, eval automatique, A/B testing prompts, coûts par token / par utilisateur. Dashboards Grafana inclus.

[ FRONT ]

Open WebUI / Custom React

Interface chat sobre type ChatGPT pour vos équipes ou widget custom embarqué dans votre app. Auth SSO, multi-utilisateurs, conversations partagées.

// 02_AGENTS.json

Les agents.
Sur mesure.

agent_01

Support client 24/7

L'agent répond 80% des tickets niveau 1 en moins de 10 secondes. Escalation humaine sur les cas complexes. Apprend de votre base de tickets historiques.

SLA: 10s p95 Multilingue Self-improving
agent_02

Prospection sortante

Recherche LinkedIn / annuaire pro, qualification, premier contact mail personnalisé, follow-up séquencé. CRM update auto. ROI ~10x un commercial junior.

HubSpot / Salesforce RGPD-compliant A/B prompts
agent_03

RAG documentaire

Vos docs internes, contrats, procédures, manuels qualité — tout indexé. Vos collaborateurs posent des questions en langage naturel, l'agent cite les sources.

Source citations Permissions ACL Update incrémental
agent_04

Reporting auto

Connexions DB / API métier, génération de rapports hebdo + analyses, envoi mail / Slack. "Ce qui a changé cette semaine" en plain English.

SQL natif PDF / HTML / MD Cron-driven
agent_05

Modération contenu

Filtrage UGC (forum, reviews, support), détection toxicité / spam / SPF, escalation modérateur humain pour les zones grises.

Multi-classifier Audit log Override humain
agent_06

Workflow custom

Vous nous décrivez le besoin, on conçoit l'agent. Exemples livrés : tri d'emails, génération devis, traduction technique, pre-screening CV, monitoring concurrent.

Ad hoc Cahier des charges Délai 2-6 sem.
// 03_CASE_STUDIES.log

Cas d'usage.
Vrais clients, vrais chiffres.

CASE_01

PME industrielle (45 salariés)

Agent RAG sur documentation produits + procédures qualité. Les commerciaux trouvent les bons arguments en 5 secondes au lieu de 15 minutes.

+18% conversion devis
après 3 mois
CASE_02

Cabinet d'avocats (12 collaborateurs)

RAG sur jurisprudence + contrats clients (anonymisés). L'IA tourne sur leur serveur — secret professionnel respecté, données jamais dans le cloud.

−4 h/sem par collaborateur
sur la recherche
CASE_03

E-commerce niche (B2B)

Chatbot support client multilingue intégré. 78% des questions résolues sans humain. Escalade automatique sur les cas livraison / SAV.

−62% tickets niveau 1
en 6 mois
// 04_PRICING.toml

Tarifs.
Forfait fixe.

Aucun coût caché. Aucun "par token". Vous achetez un agent, vous le possédez. La maintenance est optionnelle.

[ STARTER ]

Agent unique

2 500€ HT

paiement unique

  • 1 agent IA livré
  • Cahier des charges + dev + déploiement
  • Formation à l'usage (2h)
  • 3 mois de support inclus
  • Modèle open-source au choix
/deploy starter →
[ ENTERPRISE ]

Sur mesure

sur devis

selon périmètre

  • Agents illimités
  • Hardware GPU dédié on-prem
  • Fine-tuning modèles
  • Intégrations SSO / LDAP / AD
  • Audit RGPD & sécurité
  • SLA 1h 24/7
/contact enterprise →

// READY_TO_DEPLOY?

$ ./onlyai.sh --your-project

Audit gratuit en 1h. On regarde votre cas, on dit honnêtement si l'IA est la bonne réponse, et on chiffre. Réponse sous 48h.

// agents IA Lyon & remote · réponse en 24h