Koca Ventures Ltd
71-75 Shelton Street
Covent Garden, London
WC2H 9JQ, United Kingdom
Registered in England & Wales — 16231043
Agentes de IA privados que gobiernan susoperaciones, no solo su bandeja de entrada
Harnesses de agentes a medida, despliegues con Claude / OpenAI Agent SDK, grafos de conocimiento e inferencia autoalojada, construidos en torno al flujo de trabajo que su equipo ya utiliza. La IA en el edge, on-premise y sensible a la seguridad, es nuestro trabajo diario.
Seis piezas, todas listas para producción
Harnesses de agentes a medida
Runtimes de agentes a medida construidos alrededor de sus flujos de trabajo: llamadas a herramientas, arquitecturas de memoria, semántica de reintentos y puertas de aprobación diseñadas para la clase de trabajo que su equipo hace de verdad.
Integración con Agent SDK
Despliegues en producción sobre el Claude Agent SDK, el framework OpenAI Agents y MCP: orquestación multiagente, uso de herramientas y salida estructurada, conectados a sus servicios existentes.
Agentes documentales + grafos de conocimiento
RAG sobre sus contratos, especificaciones, SOPs y PDFs con citas, respaldado por una capa de grafo de propiedades embebido, para que el agente razone sobre relaciones, no solo sobre similitud de fragmentos.
Pipelines de datos y CRM
Pipelines de ETL e ingesta que alimentan a los agentes con contexto estructurado, más automatización de CRM: enrutamiento de leads entrantes, resúmenes automáticos de consultas y flujos de seguimiento fiables.
Despliegue de IA on-premise
Ejecute agentes en su hardware: inferencia autoalojada, almacenamiento local cifrado, actualizaciones firmadas, acceso por roles, registros de auditoría. Ningún dato de clientes sale de su infraestructura.
Edge AI y visión por computador
Despliegues en NVIDIA Jetson Orin, pipelines de DeepStream, optimización TensorRT/ONNX y operación capaz de funcionar sin conexión: inferencia edge junto a las cámaras para alertas en tiempo real sin dependencia de la nube.
Organizador de operaciones con IA para WhatsApp
La mayoría de las empresas ya gestionan el día a día por WhatsApp: los responsables piden novedades, los equipos de campo envían fotos y notas de voz, ventas comenta solicitudes, compras comparte precios. Es rápido, pero las tareas quedan enterradas, la responsabilidad es difusa y los seguimientos se olvidan.
El Operations Organizer es una capa de IA sobre los canales de WhatsApp aprobados por la empresa que convierte conversaciones sin estructura en tareas, recordatorios, resúmenes, decisiones e informes, sin obligar a los equipos a aprender otra aplicación.
Comprensión de mensajes con IA
Clasifica las conversaciones en tareas, incidencias, aprobaciones, riesgos, peticiones de clientes, necesidades de compra y actualizaciones de planificación, de forma automática.
Procesamiento de notas de voz e imágenes
Transcribe las notas de voz, extrae información útil de imágenes y documentos y vincula cada elemento con el proyecto, cliente, equipo o ubicación que corresponde.
Motor de tareas y seguimiento
Crea tareas, asigna responsables, controla las fechas de vencimiento, recuerda a las personas responsables y escala los elementos ignorados o vencidos.
Informes diarios y semanales
Genera resúmenes concisos para la dirección: trabajo completado, incidencias abiertas, retrasos, riesgos, partidas de gasto, peticiones de clientes sin resolver y rendimiento de los equipos.
Memoria de conocimiento de la empresa
Una memoria interna consultable (respaldada por una capa embedded property-graph) de decisiones pasadas, problemas recurrentes, historial de clientes, notas de proveedores y patrones operativos.
Panel de la dirección
Un panel de control web donde la dirección puede ver lo que ocurre en todos los equipos sin tener que leer cientos de mensajes.
Consultas de los responsables que el sistema puede responder
- «¿Qué trabajos van con retraso hoy?»
- «¿Quién está a la espera de una aprobación?»
- «Resume todas las actualizaciones de obra de esta semana.»
- «¿A qué peticiones de clientes no se les ha dado seguimiento?»
- «Crea una lista de tareas a partir de los mensajes de WhatsApp de ayer.»
- «Muéstrame los artículos de compras mencionados pero aún no pedidos.»
La IA en el edge es sensible a la seguridad. Y así la tratamos.
NVIDIA ha reconocido nuestra investigación en seguridad por la divulgación responsable de una vulnerabilidad en la plataforma de edge AI Jetson.
Esa profundidad se traslada a cada despliegue de edge AI: on-premise por defecto, runtime endurecido, actualizaciones firmadas e identidad de dispositivo tratadas como valores por defecto, no como añadidos tardíos.
Su infraestructura, sus datos, su control.
- · Los flujos de las cámaras permanecen en local siempre que es posible.
- · Los documentos se indexan en almacenes vectoriales y de grafo privados.
- · Las respuestas incluyen citas para reducir las alucinaciones.
- · Controles de seguridad: aislamiento de red, almacenamiento cifrado, registros de auditoría, actualizaciones firmadas y acceso basado en roles.
- · Las API de LLM externas son opcionales, no la base.
FAQ sobre IA agéntica
¿Qué es un sistema de IA agéntica?
Un sistema de IA agentic es software en el que un LLM llama a herramientas, lee datos y ejecuta flujos de varios pasos hacia un objetivo de forma autónoma; no un chatbot que solo genera texto. Los nuestros leen documentos, consultan bases de datos, abren tickets y llaman a APIs bajo aprobación humana estructurada.
¿En qué se diferencia esto de un chatbot?
Un chatbot responde preguntas; un agente actúa. Nuestros harnesses incluyen llamadas a herramientas, semántica de reintentos, memoria (a menudo un grafo de propiedades embebido), flujos de aprobación e integración con sus sistemas reales: el resultado son acciones ejecutadas, no solo respuestas en pantalla.
¿Podemos ejecutar esto en nuestros propios servidores?
Sí: el despliegue on-premise es una opción de primera clase, no un plan B: inferencia autoalojada (vLLM, Ollama, llama.cpp), almacenes locales cifrados, actualizaciones firmadas, acceso por roles. Las APIs de LLM externas son opcionales, no fundacionales.
¿Utilizan Claude, GPT o modelos locales?
El que encaje con la carga de trabajo. El trabajo sensible on-premise se ejecuta con modelos locales (Llama, Qwen, Mistral) servidos vía vLLM; donde la sensibilidad de los datos lo permite y el razonamiento es exigente, Claude o GPT a través de sus agent SDKs. Muchos despliegues en producción son híbridos.
¿Por qué importa una capa de grafo en los agentes documentales?
La búsqueda vectorial por sí sola no basta. La combinamos con una capa de grafo de propiedades embebido para que el agente pueda recorrer “este RFI trata de esta especificación, cuyo dueño es este ingeniero, que aprobó esta revisión” en milisegundos: en local, en su propia infraestructura, sin levantar un servicio de grafos externo.
¿Cómo es un calendario de despliegue típico?
Un piloto centrado en un flujo de trabajo suele llevar cuatro semanas: descubrimiento, recogida de datos, construcción de la demo y revisión de la hoja de ruta. El despliegue completo en producción depende del alcance, pero suele llevar de 8 a 16 semanas tras el piloto.
Trabajo relacionado
Last reviewed:
Empiece por un único problema
Comparta un flujo de trabajo que duela —novedades de obra, seguimiento de clientes, preguntas sobre documentos, caos de compras— y construiremos una demo pequeña alrededor de sus datos reales antes de cualquier compromiso mayor.
