APIs IA — costo, calidad e implementación (CESCAC)

Importante: precios y cuotas cambian. Siempre confirmá en la web oficial del proveedor antes de presupuestar. Este documento no incluye claves reales.

Objetivo: combinar Ollama en MSI (gratis local) + VPS (Open WebUI, Qdrant) + APIs baratas (OCR, audio, picos cloud) sin romper lo existente.

Regla de enrutamiento: 1) local MSI → 2) API económica → 3) modelo premium solo si hace falta.

1) Matriz por capa

CapaRecomendadoCosto típicoUso CESCAC
Código / SQL ERPqwen2.5-coder:7b o qwen3-coder (Ollama)Gratis localCRUD, parches, consultas
Embeddings RAGnomic-embed-text (Ollama)Gratis localQdrant omega_memory
Visión / OCR facturasGemini (Google AI Studio / Gemini API)Gratis limitado + pagoImagen → JSON estructurado
Audio STTWhisper localGratisPrivacidad máxima
Audio STT avanzadoAssemblyAICréditos / por horaDiarización, resúmenes
Inferencia rápidaGroq (Llama 3.3 70B, etc.)Bajo por tokenPicos de latencia
Razonamiento baratoDeepSeek APIEconómicoAnálisis largo
Router multi-modeloOpenRouterVariableFallback y A/B

2) Qué debe conseguir el admin (claves — sin pegarlas en chat público)

ProveedorPara quéDónde obtener (oficial)Variable sugerida en .env
Google AI / GeminiVisión, OCR, docs largosGoogle AI Studio / ai.google.devGEMINI_API_KEY
OpenAIGPT, Whisper API, embeddings cloudAPI keysOPENAI_API_KEY
OpenRouterFallback multi-modeloopenrouter.aiOPENROUTER_API_KEY
GroqVelocidad / picosconsole.groq.comGROQ_API_KEY
AssemblyAISTT cloud avanzadoassemblyai.comASSEMBLYAI_API_KEY
DeepSeekRazonamiento económicoplatform.deepseek.comDEEPSEEK_API_KEY

Guardar solo en servidor seguro (CRM .env, Docker secrets, Hestia env). Nunca en páginas públicas del VPS.

3) Dónde cablear en el ecosistema (orden técnico)

  1. Open WebUI (omega-chat): añadir proveedores/API keys en ajustes del contenedor o variables de entorno del compose — permite usar Gemini/OpenRouter como modelo remoto mientras MSI aporta Ollama vía túnel en el backend del VPS (127.0.0.1:11435 cuando el túnel está arriba).
  2. CRM PHP: endpoints internos que reciban imagen/audio → llaman Gemini/AssemblyAI con key desde .env → devuelven JSON al ERP (factura, lead, nota).
  3. RAG: ingest con nomic-embed-text + Qdrant; consultas desde WebUI o jobs cron ya documentados en admin-docs (reindex_omega_memory.sh).
  4. n8n / Langflow (opcional): orquestación visual entre CRM webhooks y APIs; no obligatorio para MVP.

4) Checklist MVP (sin romper producción)

5) Enlaces para IA externa (contexto total)