Qué hacemos (y qué deberíamos hacer) para asegurar la calidad del dato

Aquí va una lista muy práctica. No hace falta tener un perfil técnico para entenderla, pero sí disciplina para aplicarla.

Definir “qué significa” cada dato

Un campo no es solo un lugar donde introducir información, sino un acuerdo sobre qué significa ese dato. Por ejemplo, cuando hablamos de “fecha de recepción”, es importante aclarar a qué momento se refiere: ¿A la entrada física, al registro en el sistema o a su validación? Para evitar confusiones, resulta clave contar con un diccionario de datos sencillo, vivo y compartido.

Validar en el punto de captura

Cuanto antes se detecta y se detiene un error, más fácil y barato es corregirlo. Por eso es importante validar los datos en el momento en que se introducen, utilizando listas cerradas cuando sea necesario en lugar de texto libre, aplicando reglas simples como rangos, formatos o campos obligatorios, y mostrando avisos claros cuando falta información o algo no encaja.

Trazabilidad de verdad (histórico + quién + por qué)

No se trata solo de guardar datos, sino de poder entender qué ha ocurrido con ellos. Un sistema debe permitir saber quién realizó un cambio, cuándo se hizo, con qué motivo y qué valor tenía el dato antes. En productos como AniBio o NorayBanks, esta trazabilidad completa es clave para comunicar cambios, mantener un histórico y sostener procesos críticos sin perder el control de la información.

Eliminar duplicados con criterio

Un duplicado no siempre significa que dos registros tengan exactamente el mismo nombre. Para detectarlos correctamente es necesario apoyarse en identificadores únicos, aplicar reglas de coincidencia entre distintos campos y realizar revisiones cuando exista alguna duda.

Medir la calidad como se mide cualquier KPI

Si la calidad del dato no se mide, difícilmente puede mejorar. Para ello se pueden utilizar métricas sencillas como el porcentaje de registros incompletos, el porcentaje de duplicados, el retraso medio en el registro o la clasificación de errores por tipo, ya sea de formato, rango o catálogo.

Gobernanza: alguien debe “ser dueño” del dato

No se trata de un propietario “legal” del dato, sino de un responsable operativo. Es decir, alguien que defina qué se considera correcto, quién aprueba los cambios y quién prioriza las mejoras necesarias.

La parte incómoda: la calidad del dato es cultura, no solo software

El software ayuda mucho, pero por sí solo no garantiza la calidad del dato. Esta se consigue cuando el dato se trata como un activo, se diseñan procesos pensando en él y se corrigen los problemas en su origen. Si quieres una IA realmente útil, empieza por el dato. Solo con información fiable puede convertirse en una ventaja competitiva. Antes de la IA está la calidad del dato; y antes de la calidad del dato, la trazabilidad, las reglas claras y la disciplina.

Si te perdiste la primera parte, puedes leerla aquí.