Importante: precios y cuotas cambian. Siempre confirmá en la web oficial del proveedor antes de presupuestar. Este documento no incluye claves reales.
Objetivo: combinar Ollama en MSI (gratis local) + VPS (Open WebUI, Qdrant) + APIs baratas (OCR, audio, picos cloud) sin romper lo existente.
Regla de enrutamiento: 1) local MSI → 2) API económica → 3) modelo premium solo si hace falta.
| Capa | Recomendado | Costo típico | Uso CESCAC |
|---|---|---|---|
| Código / SQL ERP | qwen2.5-coder:7b o qwen3-coder (Ollama) | Gratis local | CRUD, parches, consultas |
| Embeddings RAG | nomic-embed-text (Ollama) | Gratis local | Qdrant omega_memory |
| Visión / OCR facturas | Gemini (Google AI Studio / Gemini API) | Gratis limitado + pago | Imagen → JSON estructurado |
| Audio STT | Whisper local | Gratis | Privacidad máxima |
| Audio STT avanzado | AssemblyAI | Créditos / por hora | Diarización, resúmenes |
| Inferencia rápida | Groq (Llama 3.3 70B, etc.) | Bajo por token | Picos de latencia |
| Razonamiento barato | DeepSeek API | Económico | Análisis largo |
| Router multi-modelo | OpenRouter | Variable | Fallback y A/B |
| Proveedor | Para qué | Dónde obtener (oficial) | Variable sugerida en .env |
|---|---|---|---|
| Google AI / Gemini | Visión, OCR, docs largos | Google AI Studio / ai.google.dev | GEMINI_API_KEY |
| OpenAI | GPT, Whisper API, embeddings cloud | API keys | OPENAI_API_KEY |
| OpenRouter | Fallback multi-modelo | openrouter.ai | OPENROUTER_API_KEY |
| Groq | Velocidad / picos | console.groq.com | GROQ_API_KEY |
| AssemblyAI | STT cloud avanzado | assemblyai.com | ASSEMBLYAI_API_KEY |
| DeepSeek | Razonamiento económico | platform.deepseek.com | DEEPSEEK_API_KEY |
Guardar solo en servidor seguro (CRM .env, Docker secrets, Hestia env). Nunca en páginas públicas del VPS.
127.0.0.1:11435 cuando el túnel está arriba)..env → devuelven JSON al ERP (factura, lead, nota).nomic-embed-text + Qdrant; consultas desde WebUI o jobs cron ya documentados en admin-docs (reindex_omega_memory.sh).msi-report.php tras cambios