Osistan
Asistente de operaciones de IA que realmente corre en producción.
El problema
Los equipos de operaciones se ahogan en consultas repetitivas, triage de correos, seguimiento de plazos y conocimiento que vive en la cabeza de las personas. Las herramientas comerciales de IA o cuestan demasiado o no entienden tu contexto de negocio específico.
El enfoque
Arquitectura de 3 capas — el motor determinista maneja cron jobs, parsing de correos y cálculos de plazos sin involucrar al LLM y sin alucinaciones. El ensamblador de contexto construye ventanas de tokens óptimas con colocación consciente de posición. La capa de inteligencia solo piensa — nunca recupera datos ni parsea archivos.
Empecé con 50 herramientas. El LLM gastaba su inteligencia en selección de herramientas en lugar de pensar. Reduje a 3 canales de escritura: db_write, slack_send, file_create. Todo cambió.
Detalles clave
- Corre en Raspberry Pi 5 (8GB RAM) — producción 24/7
- 39K chunks de correo embebidos con pgvector (búsqueda en 3.4ms)
- Event sourcing para gestión de tareas
- Patrón de wiki Karpathy — conocimiento compilado una vez, mantenido actualizado
- Autoobservación — rastrea sus propios resultados de acción a lo largo del tiempo
- Soul file progresivo — 27K tokens → 3.9K core + secciones bajo demanda
- Costo: ~$40/mes sirviendo a un equipo de 8
Desafíos
Gestión del presupuesto de tokens. El soul file completo tenía 27K tokens — demasiado costoso para cada solicitud. Solución: divulgación progresiva. Una personalidad core de 3.9K carga siempre. Las secciones específicas de dominio (contratos, escalación, informes) cargan bajo demanda según el tema de conversación.
Ruido de correo. 472 remitentes de correo en 5 categorías. Sin filtrado, el modelo mezclaba correos de rutas de empresas de autobuses con comunicaciones de partners. Solución: etiquetado de remitentes con filtrado específico por empresa. Cuando alguien pregunta sobre una empresa específica, solo los correos de esa empresa aparecen.
Autoobservación sin bucles de retroalimentación. El agente rastrea si sus tareas se cancelan dentro de 24 horas (señal mala) o se ignoran durante 48 horas (señal de ruido). Estos datos alimentan revisiones mensuales que refinan el soul file — pero el agente nunca modifica sus propias instrucciones automáticamente. Un humano revisa los patrones primero.
Stack
Claude Opus 4.6 + Sonnet 4.6 · Python · PostgreSQL · pgvector · Slack Bolt · Raspberry Pi · Tailscale · PM2