- 24 de June de 2026
- Se lee en 18 minutos
Si está desarrollando un producto impulsado por un modelo de lenguaje grande (LLM), ya conoce la emoción de lanzar una nueva función. También conoce el miedo creciente que sigue. Hace un pequeño ajuste de prompt el martes. El viernes, el soporte al cliente reenvía capturas de pantalla de su chatbot recomendando el producto de un competidor, alucinando una política de reembolso que no existe y olvidando llamar completamente a la herramienta “cancelar suscripción”.
- 23 de June de 2026 bug crawl
En nuestro proyecto semanal Bug Crawl, tomamos una aplicación móvil o web popular, la probamos y reportamos errores para que los desarrolladores los corrijan. En Bug Crawl, destacamos los errores de las aplicaciones y los servicios para indicar los puntos débiles que cada proveedor de software debería comprobar, y subrayamos la importancia de las pruebas adecuadas en el caso de las aplicaciones web y móviles.
- 17 de June de 2026
- Se lee en 12 minutos
Cada semana, los evaluadores de QAwerk seleccionan un juego o aplicación de las tiendas y buscan errores. Publicamos todos los hallazgos en nuestra página de rastreo de errores, incluyendo los pasos para reproducirlos, pruebas en vídeo, la gravedad del problema y otros detalles valiosos. Ya hemos procesado más de 1000 aplicaciones y registrado 5578 errores tras más de 15 000 horas de pruebas. Hoy, compartiremos un resumen de nuestros últimos hallazgos en las pruebas de juegos móviles. Analizaremos 19 errores descubiertos en 5 juegos de iOS probados y explicaremos su origen y cómo prevenirlos.
- 17 de June de 2026
- Se lee en 16 minutos
Un solo fallo puede llevar a un usuario directamente a desinstalar. Construya una estrategia de reporte de fallos de aplicaciones móviles que detecte errores temprano, además de las mejores herramientas a utilizar.
- 09 de June de 2026
- Se lee en 18 minutos
Imaginemos que lanza un producto de IA que clava cada demo. Su equipo lo prueba exhaustivamente antes del lanzamiento y las salidas parecen impecables, así que lanza con confianza. Sin embargo, dos semanas después, un cliente le envía una captura de pantalla de una respuesta que es factualmente incorrecta, declarada con seguridad y completamente en contradicción con lo que el mismo producto dijo el día anterior. Eso podría ser un golpe serio a su reputación, y absolutamente no puede permitirse perder la confianza de los clientes.
- 04 de June de 2026
- Se lee en 17 minutos
Si vous vous demandez pourquoi les outils de red teaming LLM sont aujourd’hui incontournables, considérez ceci : les coûts de la cybercriminalité devraient dépasser 10 500 milliards de dollars en 2025, les vulnérabilités des LLM faisant désormais partie de cette trajectoire.
- 02 de June de 2026
- Se lee en 13 minutos
Air Canada perdió un caso judicial porque su chatbot inventó una política de reembolsos. El tribunal dictaminó que la aerolínea debía cumplir lo que el bot prometió. Klarna revirtió su estrategia de atención al cliente basada en IA después de que su chatbot ofreciera un servicio peor que el humano, y comenzó a reincorporar agentes. Ambas historias acapararon titulares porque el problema subyacente era el mismo: un modelo de lenguaje grande lanzado a producción sin el proceso de QA que la tecnología realmente necesita.
- 02 de June de 2026
- Se lee en 21 minutos
Una sola frase. Eso fue todo lo que se necesitó para convencer al asistente de IA de un concesionario de automóviles de “acordar” vender un SUV de $76,000 por un solo dólar en diciembre de 2023.
- 25 de May de 2026
- Se lee en 16 minutos
Los sistemas de IA multiagente ofrecen una visión tentadora: agentes autónomos que colaboran como un equipo humano experimentado. En teoría, esta configuración permite que un agente investigador especializado recopile datos, un agente redactor elabore un informe y un agente editor lo finalice, comunicándose todos fluidamente en segundo plano.
- 25 de May de 2026
- Se lee en 15 minutos
¿Tu API no funciona como esperabas? ¿Se acumulan los problemas y no tienes ni idea de por qué, ya que superó todas las pruebas que tu equipo le realizó?








