ES EN
Cómo se usa

Ejecutar los tests

Cómo se conecta el agente de IA, cómo se arman Test Plans y cómo se corre. Todo lo que pasa cuando haces clic en Run.

Modelo mental

Para ejecutar necesitas 3 piezas:

  1. Una Agent Connection — el agente de IA que vas a probar.
  2. Una Test Suite — los casos que quieres correr.
  3. Un Test Plan — la receta que combina los dos anteriores.

Una vez que tienes el Test Plan, puedes correrlo todas las veces que quieras. Cada corrida queda como un Run inmutable.

1. Configurar la Agent Connection

Ve a Configuration → AI Agents → + New Connection.

Conexión por Browser (Playwright)

Para agentes de IA embebidos en una página web. ArtificialQA corre Chromium headless en sus workers en la nube y lo opera como lo haría un usuario.

Conexión por HTTP/API (plan Pro o Enterprise)

Para agentes de IA que exponen un endpoint propio.

Test Connection

Una vez guardada la conexión, usa el botón Test Connection para validarla. Manda un mensaje de prueba y muestra qué se envió y qué se recibió. Si falla, verás el error exacto (timeout, 401, selector no encontrado, etc.).

🔁 Reintentos. Si una pregunta falla por un error transitorio (timeout, 5xx) la plataforma reintenta automáticamente antes de marcar el caso como fallido. Se aplican valores por defecto razonables — no requiere configuración manual.

2. Armar un Test Plan

Ve a Test Design → Test Plans → New Plan. Indica:

Una vez creado el plan, entra a su detalle y asigna una o más Test Suites. Un Test Plan puede contener múltiples suites — todas se ejecutan juntas cuando corres el plan.

3. Correr el Test Plan

Desde la lista de Test Plans, haz clic en Run sobre el plan que quieres ejecutar y elige la Agent Connection contra la que se va a correr. La plataforma ejecuta todos los casos de todas las suites asignadas al plan, contra la conexión seleccionada.

Vista en tiempo real

Mientras corre verás:

Pantalla de detalle de un Run con métricas y lista de cases
Detalle de un Run completado — métricas Total / Passed / Failed / Avg Time arriba, lista de test cases abajo con badges S (Simple) y C (Conversational).

Estados del Run

Casos conversacionales

Cuando un caso es multi-turno, ArtificialQA mantiene la sesión con el agente de IA a lo largo de todos los turnos del caso. La respuesta a cada turno se guarda y se evalúa en el contexto de la conversación.

Tokens consumidos durante la ejecución

Depende del protocolo de la conexión:

Otras fases que consumen tokens, sin importar el protocolo:

Snapshots inmutables (y reproducibilidad no determinista)

Cada Run guarda un snapshot completo: input enviado, headers, response crudo, tiempos y logs. Aunque después modifiques el Test Case, la Connection o la Suite, el Run conserva exactamente lo que pasó esa vez. Esto es lo que permite auditar resultados meses después.

Pero ojo con la reproducibilidad: el snapshot es inmutable, pero si vuelves a ejecutar el mismo Test Plan, las respuestas del agente de IA pueden ser distintas — hay un LLM detrás del agente de IA y los LLMs no son deterministas. Lo que queda fijo es lo que pasó en cada corrida específica, no lo que va a pasar en futuras corridas.

Errores comunes y cómo resolverlos

Próximo paso

Ya tienes el Run con todas las respuestas. El próximo paso es activar los evaluadores sobre ese run.