Las diez formas principales de limpiar los datos

Las palabras escritas de forma incorrecta, los espacios que persisten al final de una celda, los prefijos no deseados, las mayúsculas o minúsculas inadecuadas y los caracteres no imprimibles dan una mala impresión. Y esa ni siquiera es una lista completa de las formas en que los datos se pueden ensuciar. Remánguese, es hora de hacer una limpieza general en las hojas de cálculo con Microsoft Office Excel.

En este artículo


Volver al principio Volver al principio

Conceptos básicos para limpiar los datos

No siempre se tiene control sobre el formato y el tipo de datos que se importa desde un origen de datos externo, como una base de datos, un archivo de texto o una página Web. Con frecuencia, tendrá que limpiar los datos antes de poder analizarlos. Afortunadamente, Office Excel cuenta con muchas características para ayudarle a obtener los datos en el formato exacto que desee. Algunas veces, la tarea es muy sencilla y hay una característica específica que realiza el trabajo. Por ejemplo, puede utilizar fácilmente el corrector ortográfico para corregir las palabras que no están escritas correctamente en las columnas que contienen comentarios o descripciones. O, si desea quitar las filas duplicadas, puede hacerlo rápidamente utilizando el cuadro de diálogo Quitar duplicados.

En otras ocasiones, es posible que tenga que manipular una o varias columnas utilizando una fórmula para convertir los valores importados en nuevos valores. Por ejemplo, si desea quitar los espacios al final de las celdas, puede crear una nueva columna para limpiar los datos utilizando una fórmula, rellenar hacia abajo la nueva columna, convertir las fórmulas de esa nueva columna en valores y, a continuación, quitar la columna original.

Los pasos básicos para limpiar los datos son los siguientes:

  1. Importar los datos desde un origen de datos externo.
  2. Crear una copia de seguridad de los datos originales en un libro independiente.
  3. Asegurarse de que los datos están en un formato de tabla de filas y columnas que tengan: datos similares en cada columna, todas las columnas y filas visibles y que no haya filas en blanco dentro del rango. Para obtener los mejores resultados, utilice una tabla de Excel.
  4. Realice primero las tareas que no necesiten la manipulación de columnas, como revisar la ortografía o utilizar el cuadro de diálogo Buscar y reemplazar.
  5. A continuación, realice las tareas que requieran la manipulación de columnas. Los pasos generales para manipular una columna son:
    1. Insertar una nueva columna (B) junto a la columna original (A) que necesita limpieza.
    2. Agregar una fórmula que transforme los datos en la parte superior de la nueva columna (B).
    3. Rellenar hacia abajo en la nueva columna (B). En las tablas de Excel, las columnas calculadas se crean automáticamente con los valores rellenados hacia abajo.
    4. Seleccionar la nueva columna (B), copiarla y, a continuación, pegar como valores en la nueva columna (B).
    5. Quitar la columna original (A), con lo que la nueva columna se convierte de B a A.

Para limpiar periódicamente el mismo origen de datos, considere la posibilidad de grabar una macro o de escribir código para automatizar todo el proceso. También hay varios complementos externos escritos por otros proveedores que se enumeran en la sección Otros proveedores que puede considerar utilizar si no tiene tiempo o recursos para automatizar el proceso por sí mismo.

Más información Descripción
Describe todas las formas de importar datos externos en Office Excel.
Rellenar datos automáticamente en celdas de hojas de cálculo Muestra cómo utilizar el comando Rellenar.
Crear o eliminar una tabla de Excel

Agregar o quitar filas y columnas de una tabla de Excel

Crear, modificar o quitar una columna calculada en una tabla de Excel
Mostrar cómo crear una tabla de Excel y agregar o eliminar columnas o columnas calculadas.
Crear una macro Muestra varias formas de automatizar las tareas repetitivas mediante la utilización de una macro.

Volver al principio Volver al principio

Revisión ortográfica

El corrector ortográfico se puede utilizar no sólo para buscar palabras escritas de forma incorrecta, sino también para buscar valores que no se utilizan de forma coherente, como nombres de productos o empresas, agregando esos valores a un diccionario personalizado.

Más información Descripción
Comprobar la ortografía y la gramática Muestra cómo corregir las palabras escritas de forma incorrecta en una hoja de cálculo.
Utilizar diccionarios personalizados para agregar palabras al corrector ortográfico Explica cómo utilizar los diccionarios personalizados.

Volver al principio Volver al principio

Quitar filas duplicadas

Las filas duplicadas son un problema habitual cuando se importan datos. Es aconsejable aplicar un filtro para obtener los valores únicos primero y confirmar que los resultados son los que desea antes de quitar los valores duplicados.

Más información Descripción
Aplicar para obtener los valores únicos o quitar los valores duplicados Muestra dos procedimientos estrechamente relacionados: cómo aplicar un filtro para obtener filas únicas y cómo quitar filas duplicadas.

Volver al principio Volver al principio

Buscar y reemplazar texto

Puede que desee quitar una cadena común que aparece al principio, como una etiqueta formada por un punto y coma y un espacio, o un sufijo, como una frase entre paréntesis al final de la cadena que está obsoleta o es innecesaria. Puede hacerlo buscando instancias de ese texto y reemplazándolas por otro texto o dejándolas sin texto.

Más información Descripción
Comprobar si una celda contiene texto (no distingue entre mayúsculas y minúsculas)

Comprobar si una celda contiene texto (distingue entre mayúsculas y minúsculas)
Muestra cómo utilizar el comando Buscar y varias funciones para buscar texto.
Quitar caracteres del texto Muestra cómo utilizar el comando Reemplazar y varias funciones para quitar texto.
Buscar o reemplazar texto y números en una hoja de cálculo

Buscar y reemplazar
Muestra cómo utilizar los cuadros de diálogo Buscar y Reemplazar.
ENCONTRAR, ENCONTRARB

HALLAR, HALLARB

REEMPLAZAR, REEMPLAZARB

SUSTITUIR

IZQUIERDA, IZQUIERDAB

DERECHA, DERECHAB

LARGO, LARGOB

EXTRAE, EXTRAEB
Éstas son las funciones que puede utilizar para realizar diversas tareas de manipulación de cadenas, como buscar y reemplazar una subcadena dentro de una cadena, extraer partes de una cadena o determinar la longitud de una cadena.

Volver al principio Volver al principio

Cambiar las mayúsculas o minúsculas del texto

A veces el texto viene mezclado, en concreto en lo relativo a las mayúsculas y minúsculas. Utilizando una o varias de las tres funciones CASE, puede convertir texto a letras minúsculas, como en el caso de las direcciones de correo electrónico, a letras mayúsculas, como en el caso de los códigos de productos o a las letras de nombres propios, como en el caso de los nombres o títulos de libros.

Más información Descripción
Cambiar las mayúsculas o minúsculas del texto Muestra cómo utilizar las tres funciones CASE.
MINUSC Convierte todas las letras mayúsculas de una cadena de texto en letras minúsculas.
NOMPROPIO Pone en mayúscula la primera letra de una cadena de texto y otras letras del texto que siguen a cualquier carácter que no sea una letra. Convierte todas las demás letras en letras minúsculas.
MAYUSC Convierte el texto a letras mayúsculas.

Volver al principio Volver al principio

Quitar espacios y caracteres no imprimibles del texto

A veces los valores de texto contienen espacios al principio y al final o varios caracteres de espacio incrustados (valores del conjunto de caracteres Unicode (Unicode: codificación de caracteres estándar desarrollada por Unicode Consortium. Al utilizar más de un byte para representar cada carácter, Unicode permite que casi todos los idiomas se representen mediante un único juego de caracteres.) 32 y 160) o caracteres no imprimibles (valores del conjunto de caracteres Unicode 0 a 31, 127, 129, 141, 143, 144 y 157). Estos caracteres pueden originar algunas veces resultados inesperados al ordenar, filtrar o buscar. Por ejemplo, en el origen de datos externo, los usuarios pueden cometer errores tipográficos al agregar caracteres de espacios extra sin darse cuenta o los datos de texto importados de orígenes externos pueden contener caracteres no imprimibles que están incrustados en el texto. Como estos caracteres no son fácilmente observables, los resultados inesperados pueden ser difíciles de entender. Para quitar estos caracteres no deseados, puede utilizar una combinación de las funciones ESPACIOS, LIMPIAR y SUSTITUIR.

Más información Descripción
Quitar espacios y caracteres no imprimibles del texto Muestra cómo quitar todos los espacios y caracteres no imprimibles del conjunto de caracteres Unicode.
CODIGO Devuelve un código numérico para el primer carácter de una cadena de texto.
LIMPIAR Quita los primeros 32 caracteres no imprimibles del código ASCII de 7 bits (valores 0 a 31) del texto.
ESPACIOS Quita el carácter de espacio ASCII de 7 bits (valor 32) del texto.
SUSTITUIR Puede utilizar la función SUSTITUIR para reemplazar los caracteres Unicode de valor más alto (valores 127, 129, 141, 143, 144, 157 y 160) por los caracteres ASCII de 7 bits para los que fueron diseñadas las funciones ESPACIOS y LIMPIAR.

Volver al principio Volver al principio

Corregir números y signos de números

Hay dos problemas principales con los números que pueden hacer necesario limpiar los datos: el número fue importado como texto de forma involuntaria y el signo negativo necesita cambiarse al estándar de su organización.

Más información Descripción
Formatos de números disponibles Muestra todos los formatos de números disponibles.
Convertir los números almacenados como texto en números Muestra cómo convertir los números a los que se ha dado formato y se han almacenado en celdas como texto, lo que origina problemas con los cálculos o produce órdenes de clasificación confusas, al formato de número.
MONEDA Convierte un número a formato de texto y aplica un símbolo de moneda.
TEXTO Convierte un valor a texto en un formato de número específico.
DECIMAL Redondea un número al número especificado de decimales, aplica el formato decimal al número utilizando un punto y comas y devuelve el resultado como texto.
VALOR Convierte una cadena de texto que representa un número en un número.

Volver al principio Volver al principio

Corregir fechas y horas

Debido a que hay tantos formatos de fecha diferentes y debido a que estos formatos pueden confundirse con códigos de piezas numeradas u otras cadenas que contienen barras oblicuas o guiones, con frecuencia es necesario convertir las fechas y horas aplicarles otro formato.

Más información Descripción
Cambiar el sistema de fecha, el formato o la interpretación de un año con dos dígitos Describe cómo funciona el sistema de fechas en Office Excel.
Convertir las horas Muestra cómo hacer la conversión entre diferentes unidades de tiempo.
Convertir las fechas almacenadas como texto en fechas Muestra cómo convertir las fechas que tienen formato de texto y que se han almacenado en celdas como texto, lo que puede producir problemas con los cálculos u órdenes de clasificación confusas, a un formato de fechas.
FECHA Devuelve el número de serie secuencial que representa una fecha concreta. Si el formato de celda era General antes de introducir la función, el resultado tendrá formato de fecha.
FECHANUMERO Convierte una fecha representada por texto en un número de serie.
HORA Devuelve el número decimal de una hora concreta. Si el formato de celda era General antes de introducir la función, el resultado tendrá formato de fecha.
HORANUMERO Devuelve el número decimal de la hora representada por una cadena de texto. El número decimal es un valor del 0 (cero) al 0.99999999, que representa las horas desde 0:00:00 (12:00:00 a.m.) hasta 23:59:59 (11:59:59 p.m.).

Volver al principio Volver al principio

Combinar y dividir columnas

Una tarea habitual después de importar datos de un origen de datos externo es combinar dos o más columnas en una o dividir una columna en dos o más columnas. Por ejemplo, es posible que desee dividir una columna que contiene un nombre completo en una columna con el nombre y otra con el apellido. O puede que desee dividir una columna que contiene un campo de dirección en columnas separadas para la calle, ciudad, región y código postal. También puede ocurrir al contrario, que desee combinar el nombre y el apellido en una columna con el nombre completo o combinar las columnas con los datos de una dirección separados en una sola columna. Otros valores habituales que pueden requerir la combinación en una columna o la división en varias columnas con los códigos de productos, las rutas de acceso de archivos y las direcciones IP (protocolo de Internet).

Más información Descripción
Combinar los nombres y apellidos

Combinar texto y números

Combinar texto con fechas u horas

Combinar dos o más columnas mediante una función
Muestra ejemplos típicos de combinación de valores procedentes de dos o más columnas.
Dividir nombres mediante el Asistente para convertir texto en columnas Muestra cómo utilizar este asistente para dividir columnas basándose en varios delimitadores comunes.
Dividir texto entre columnas mediante funciones Muestra cómo utilizar las funciones IZQUIERDA, EXTRAE, DERECHA, HALLAR y LARGO para dividir columnas de nombres en dos o más columnas.
Combinar o dividir el contenido de las celdas Muestra cómo utilizar la función CONCATENAR, el operador & (Y comercial) y el Asistente para convertir texto en columnas.
Combinar celdas o dividir celdas combinadas Muestra cómo utilizar los comandos Combinar celdas, Combinar horizontalmente y Combinar y centrar.
CONCATENAR Une dos o más cadenas de texto en una sola cadena.

Volver al principio Volver al principio

Transformar y reorganizar columnas y filas

La mayoría de los análisis y funciones de formato de Office Excel presuponen que los datos existen un una única tabla bidimensional. Puede que a veces desee hacer que las filas se conviertan en columnas y que las columnas se conviertan en filas. En otras ocasiones, los datos ni siquiera estarán estructurados en formato de tabla y necesitará un modo de transformarlos a un formato de tabla.

Más información Descripción
TRANSPONER Devuelve un rango de celdas vertical como rango de celdas horizontal o viceversa.

Volver al principio Volver al principio

Hacer cuadrar los datos de una tabla uniéndolos o haciéndolos coincidir

En ocasiones, los administradores de bases de datos utilizan Office Excel para buscar y corregir errores de coincidencia cuando se unen dos o más tablas, lo que puede implicar cuadrar dos tablas de hojas de cálculo diferentes, por ejemplo, para ver todos los registros en ambas tablas o para comparar las tablas y buscar las filas que no coinciden.

Más información Descripción
Buscar valores en una lista de datos Muestra formas habituales de buscar datos mediante las funciones de búsqueda.
BUSCAR Devuelve un valor bien desde un rango de una sola fila o una sola columna o bien desde una matriz. La función BUSCAR tiene dos formas de sintaxis: la forma vectorial y la forma matricial.
BUSCARH Busca un valor en la fila superior de una tabla o una matriz de valores y, a continuación, devuelve un valor en la misma columna de una fila que especifique en la tabla o matriz.
BUSCARV Busca un valor en la primera columna de una tabla o matriz y devuelve un valor en la misma fila de otra columna de la tabla o matriz.
INDICE Devuelve un valor o la referencia a un valor dentro de una tabla o rango. Hay dos formas de la función INDICE: la forma matricial y la forma de referencia.
COINCIDIR Devuelve la posición relativa de un elemento en una matriz que coincide con un valor especificado en un orden especificado. Utilice COINCIDIR en vez de una de las funciones BUSCAR cuando necesite la posición de un elemento en un rango en vez del propio elemento.
DESREF Devuelve una referencia a un rango que es un número especificado de filas y columnas desde una celda o rango de celdas. La referencia que se devuelve puede ser una sola celda o un rango de celdas. Puede especificar el número de filas y el número de columnas que se van a devolver.

Volver al principio Volver al principio

Otros proveedores

A continuación se presenta una lista parcial de otros proveedores que ofrecen productos que se pueden utilizar para limpiar datos de diversas formas.

Proveedor Producto
Add-in Express Ltd.
Add-Ins.com Duplicate Finder
AddinTools
JKP Application Development Services
J-Walk & Associates, Inc. Power Utility Pak Version 7
Office Assistance LLC
PATools
Vonnix Excel Power Expander 4.6
WinPure ListCleaner Lite

ListCleaner Pro

Clean and Match 2007

Volver al principio Volver al principio

 
 
Corresponde a:
Excel 2007