SO:AI — Optimización Semántica para IA Agéntica

Once dimensiones. Cada una rastrea un fallo específico de tu IA agéntica hasta la frase exacta de tu diseño que lo provoca.

La mayoría de los sistemas de IA agéntica combinan algunas de estas herramientas. Cada una es válida. Ninguna cubre lo que audita SO:AI.

Prompt engineering
Cubre: claridad de instrucciones, formato de output, tono.
No llega a
Activación de marcos, disambiguación de actos de habla, fallos de presuposición, entre otros.
System prompt guidelines
Cubre: alcance de políticas, reglas de comportamiento, acciones prohibidas.
No llega a
Anclaje deíctico, polifonía enunciativa, deriva de coherencia multi-turno.
Plantillas y frameworks
Cubre: estructura, reutilización, consistencia base.
No llega a
Polisemia específica del dominio, fallos de hedging semántico, incompatibilidades de marcos conceptuales.
Schema markup y Knowledge Graph
Cubre: definición de entidades, datos estructurados, relaciones.
No llega a
Lógica de ejecución agéntica, triggers de actos de habla, autoridad y deixis en workflows.
Políticas de gobernanza IA
Cubre: cumplimiento normativo, supervisión, marcos de responsabilidad.
No llega a
La precisión semántica de las propias políticas - una política lingüísticamente ambigua falla independientemente de la intención.
Testing y red-teaming
Cubre: descubrimiento de casos límite, inputs adversariales, validación de outputs.
No llega a
Diagnóstico sistemático de por qué ocurren los fallos. Los tests detectan síntomas.
11

Dimensiones diagnósticas. Cada una corresponde a una categoría de fallo semántico que aparece consistentemente en sistemas de IA agéntica - independientemente de la plataforma, el modelo o el stack.

No son checklists. Cada dimensión identifica un tipo específico de problema de lenguaje, cómo se manifiesta cuando falla, y qué cambiar para corregirlo.

Algunos diagnósticos de dimensión

Semántica de marcos
El agente actúa como si tuviera una autoridad que no tiene.

Un system prompt dice que el agente "selecciona la herramienta apropiada según lo que describes." El mecanismo real requiere invocación explícita por parte del humano. Esa frase activa un marco de agencia autónoma que el agente no tiene - y a veces actúa como si la tuviera. El fallo no está en la herramienta. Está en la frase.

Actos de habla
El agente ejecuta lo que solo se mencionó.

Las integraciones con capacidad de escritura están habilitadas globalmente - email, gestión de tareas, mensajería. Ningún componente define cuándo el agente puede actuar frente a cuándo solo puede responder. Un usuario menciona que necesita enviar un informe. Nada en el diseño distingue mencionar una tarea de solicitar su ejecución. La IA agéntica envía el mensaje. El usuario mencionó la tarea - no pidió que se ejecutara.

Deixis
El agente habla en nombre de alguien sin saberlo.

Un agente de cara al cliente redacta respuestas en primera persona, firmadas con un nombre real. El flujo nunca pregunta de quién es ese nombre. "Me pongo en contacto contigo directamente" se publica sin que el diseño haya establecido nunca de quién es ese "yo".

La IA agéntica no ejecuta lógica. Interpreta lenguaje. Los fallos anteriores no son bugs en el código - son fallos en cómo se estructura y comunica el significado.

Estos patrones de fallo llevan décadas estudiados en lingüística - con nombres distintos, pero con la misma mecánica subyacente. Cómo una frase enmarca una situación. Cómo una palabra implica una acción. Cómo 'yo' establece un hablante. SO:AI aplica ese cuerpo de conocimiento sistemáticamente al diseño de IA agéntica.

Las personas que construyeron los LLMs entendían de lingüística. Las arquitecturas transformer, los mecanismos de atención, la tokenización - nada de eso se diseñó desde el desconocimiento de cómo funciona el lenguaje. El hueco de conocimiento no está en los modelos. Está en las automatizaciones construidas encima de estos LLMs.

La mayoría de los equipos que construyen automatizaciones IA ponen todo el énfasis en las conexiones, la selección de modelo y un prompt de entrada - y confían en que la inferencia del modelo compense lo que no se diseñó. Para automatizaciones simples, a veces funciona. Para cualquier cosa con complejidad semántica real, no.

Quien construye una automatización y no puede reconocer un fallo de activación de marco no puede corregirlo - porque no puede verlo. La formación en lingüística aplicada es lo que hace visibles y nombrables estos patrones de fallo.

Y lo que se puede nombrar se puede corregir.