Validación de datos – Visión general, tipos, ejemplos prácticos

Qué es la validación de datos?

La validación de datos se refiere al proceso de garantizar la exactitud y la calidad de los datos. Se implementa incorporando varias comprobaciones en un sistema o informe para garantizar la coherencia lógica de los datos introducidos y almacenados.

En los sistemas automatizados, los datos se introducen con una supervisión humana mínima o nula. Por lo tanto, es necesario garantizar que los datos que se introducen en el sistema son correctos y cumplen los estándares de calidad deseados. Los datos serán poco útiles si no se introducen correctamente y pueden crear mayores problemas de información posterior. Los datos no estructurados, aunque se introduzcan correctamente, supondrán costes de limpieza, transformación y almacenamiento.

Tipos de validación de datos

Hay muchos tipos de validación de datos. La mayoría de los procedimientos de validación de datos realizan una o varias de estas comprobaciones para garantizar que los datos son correctos antes de almacenarlos en la base de datos. Los tipos más comunes de comprobaciones de validación de datos son:

1. Comprobación del tipo de datos

Una comprobación del tipo de datos confirma que los datos introducidos son del tipo correcto. Por ejemplo, un campo puede aceptar sólo datos numéricos. Si este es el caso, cualquier dato que contenga otros caracteres, como letras o símbolos especiales, debería ser rechazado por el sistema.

2. Comprobación del código

Una comprobación de código garantiza que un campo se selecciona de una lista válida de valores o sigue ciertas reglas de formato. Por ejemplo, es más fácil comprobar que un código postal es válido cotejándolo con una lista de códigos válidos. El mismo concepto puede aplicarse a otros elementos, como los códigos de país y los códigos industriales NAICSSistema de Clasificación Industrial de América del Norte (NAICS)El Sistema de Clasificación Industrial de América del Norte (NAICS) es un sistema de codificación jerárquico que agrupa a las empresas en industrias..

3. Comprobación de rangos

Una comprobación de rango verificará si los datos introducidos están dentro de un rango predefinido. Por ejemplo, la latitud y la longitud se utilizan habitualmente en los datos geográficos. Un valor de latitud debe estar entre -90 y 90, mientras que un valor de longitud debe estar entre -180 y 180. Cualquier valor fuera de este rango es inválido.

4. Comprobación de formato

Muchos tipos de datos siguen un formato predefinido. Un caso de uso común son las columnas de fecha que se almacenan en un formato fijo como “AAAA-MM-DD” o “DD-MM-AAAA.” Un procedimiento de validación de datos que garantice que las fechas tienen el formato adecuado ayuda a mantener la coherencia entre los datos y a lo largo del tiempo.

5. Comprobación de coherencia

Una comprobación de coherencia es un tipo de comprobación lógica que confirma los datos’s se han introducido de una manera lógicamente coherente. Un ejemplo es comprobar si la fecha de entrega es posterior a la fecha de envío de un paquete.

6. Comprobación de la singularidad

Algunos datos, como los identificadores o las direcciones de correo electrónico, son únicos por naturaleza. Es probable que una base de datos tenga entradas únicas en estos campos. La comprobación de la unicidad garantiza que un elemento no se introduzca varias veces en una base de datos.

Ejemplo práctico

Considere el ejemplo de un minorista que recoge datos sobre sus tiendas pero no crea una comprobación adecuada del código postal. El descuido podría dificultar el aprovechamiento de los datos para la información y la inteligencia empresarialInteligencia empresarial (BI)La inteligencia empresarial (BI) es la práctica de convertir los datos en información procesable. La información procesable permite a los responsables de la empresa tomar medidas específicas. Pueden producirse varios problemas si no se introduce el código postal o se introduce de forma incorrecta.

Puede ser difícil definir la ubicación de la tienda en algunos programas de cartografía. Un código postal de la tienda también ayudará a generar información sobre el barrio donde se encuentra la tienda. Sin una comprobación de datos en el código postal, es más probable que se pierda el valor de los datos. Esto supondrá más costes si hay que volver a recoger los datos o introducir manualmente el código postal.

Una solución sencilla al problema sería poner una comprobación que garantice que se introduce un código postal válido. La solución podría ser un menú desplegable o un formulario de autocompletar que permita al usuario elegir el código postal de una lista de códigos válidos. Este tipo de validación de datos se denomina validación de código o comprobación de código.

Validación de datos en Excel

El siguiente ejemplo es una introducción a la validación de datos en Excel. El botón de validación de datos bajo la pestaña de datos proporciona al usuario diferentes tipos de comprobaciones de validación de datos basadas en el tipo de datos de la celda. También permite al usuario definir comprobaciones de validación personalizadas mediante fórmulas de ExcelFórmulas básicas de ExcelEl dominio de las fórmulas básicas de Excel es fundamental para que los principiantes sean competentes en el análisis financiero. Microsoft Excel se considera el software estándar de la industria en el análisis de datos. El programa de hoja de cálculo de Microsoft también resulta ser uno de los preferidos por los banqueros de inversión. La validación de datos se encuentra en la sección Herramientas de datos de la pestaña Datos de la cinta de Excel:

Figura. 1: Herramienta de validación de datos en Excel

Tarea de entrada de datos

El siguiente ejemplo ilustra un caso de entrada de datos, donde la provincia debe ser introducida para cada ubicación de la tienda. Dado que las tiendas sólo se encuentran en determinadas provincias, cualquier entrada incorrecta debería ser detectada.

Se realiza en Excel mediante una doble validación de datos. En primer lugar, las provincias pertinentes se incorporan a un menú desplegable que permite al usuario seleccionar entre una lista de provincias válidas.

Fig. 2: Primer nivel de validación de datos

En segundo lugar, si el usuario introduce una provincia incorrecta por error, como “NY” en lugar de “NS,” el sistema advierte al usuario de la entrada incorrecta.

Figura. 3: Segundo nivel de validación de datos

Además, si el usuario ignora la advertencia, se puede realizar un análisis utilizando la función de validación de datos de Excel que identifica las entradas incorrectas.

Fig. 4: Nivel final de validación de datos

Recursos adicionales

Gracias por leer nuestro sitio web’Guía de la validación de datos. Para ayudarle a convertirse en un \N analista de clase mundial y a avanzar en su carrera hasta su máximo potencial, estos recursos adicionales le serán de gran ayuda:

    Deja un comentario