- Inicio
- IA
- Guías del usuario
- Limpieza de datos con IA
Limpieza de datos con IA
El Editor de Hojas de Cálculo de ONLYOFFICE te permite usar asistentes de IA para ayudar a limpiar y preparar tus datos para el análisis. Al combinar las capacidades de IA con las funciones integradas de limpieza de datos, puedes eliminar entradas duplicadas, estandarizar formatos inconsistentes y completar valores faltantes para asegurar que tus datos sean precisos y estén listos para su uso.
El Editor de Hojas de Cálculo ofrece dos enfoques que funcionan juntos:
- Limpieza asistida por IA — Usa indicaciones en lenguaje natural para identificar problemas, obtener recomendaciones y generar fórmulas de limpieza.
- Funciones de limpieza integradas — Usa la herramienta Eliminar Duplicados, funciones de texto y Buscar y Reemplazar para correcciones precisas.
Abrir el aviso de IA
Para abrir el aviso de IA en el Editor de Hojas de Cálculo, presiona Ctrl+/ (o ⌘+/ en macOS). Usa este atajo siempre que necesites enviar una solicitud a la IA en los flujos de trabajo descritos en este artículo.
Eliminación de duplicados
El Editor de Hojas de Cálculo proporciona una herramienta integrada de Eliminar Duplicados en la pestaña Datos que te permite eliminar filas duplicadas basadas en columnas seleccionadas. Para obtener instrucciones detalladas sobre cómo usar esta función, consulta el artículo sobre eliminación de duplicados.
También puedes usar Formato condicional con la regla Duplicado/Único para resaltar duplicados para revisión antes de su eliminación.
Usar IA para identificar y manejar duplicados
La IA puede ayudarte a identificar posibles duplicados que no son coincidencias exactas y desarrollar estrategias para manejarlos:
- Selecciona el rango de datos que deseas verificar.
- Abre el aviso de IA.
- Pide ayuda a la IA con los duplicados:
- "¿Qué columnas debo verificar para identificar registros duplicados en estos datos?"
- "¿Hay entradas casi duplicadas o similares que podrían ser el mismo registro?"
- "¿Cómo debo manejar las entradas duplicadas: mantener la primera, mantener la última o fusionar?"
Estandarización de formatos
Funciones de texto para estandarización
El Editor de Hojas de Cálculo proporciona varias funciones de texto para estandarizar datos:
| Función | Propósito | Ejemplo |
|---|---|---|
| TRIM(texto) | Elimina espacios al inicio, al final y espacios extra | =TRIM(" John Smith ") → "John Smith" |
| UPPER(texto) | Convierte texto a mayúsculas | =UPPER("london") → "LONDON" |
| LOWER(texto) | Convierte texto a minúsculas | =LOWER("LONDON") → "london" |
| PROPER(texto) | Capitaliza la primera letra de cada palabra | =PROPER("john smith") → "John Smith" |
| CLEAN(texto) | Elimina caracteres no imprimibles | =CLEAN(A1) |
| SUBSTITUTE(texto, viejo, nuevo) | Reemplaza texto específico | =SUBSTITUTE("U.S.","U.S.","USA") → "USA" |
| TEXT(valor, formato) | Formatea números/fechas de manera consistente | =TEXT(A1,"YYYY-MM-DD") |
Usar IA para generar fórmulas de estandarización
Pide a la IA que cree fórmulas para tus necesidades específicas de estandarización:
Ejemplo de solicitud: "Crea una fórmula para estandarizar números de teléfono en la columna A al formato (XXX) XXX-XXXX."
Ejemplo de respuesta: "Usa esta fórmula para estandarizar números de teléfono: =TEXT(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"-",""),"(",""),")",""),"(###) ###-####"). Esto elimina el formato existente y aplica el formato estándar. Para números de teléfono con códigos de país o longitudes variables, puede que necesites un enfoque más complejo usando declaraciones IF anidadas o una columna auxiliar."
Usar Buscar y Reemplazar para estandarización masiva
El Editor de Hojas de Cálculo proporciona una función integrada de Buscar y Reemplazar (Ctrl+H) para reemplazos de texto simples en tus datos.
Flujo de trabajo de estandarización asistido por IA
Para tareas de estandarización complejas, sigue este flujo de trabajo:
- Identificar problemas: Abre el aviso de IA y pide a la IA que analice una muestra de tus datos y enumere las inconsistencias de formato.
- Obtener recomendaciones: Pregunta a la IA cuál es el mejor enfoque: fórmulas, Buscar y Reemplazar, o corrección manual.
- Generar fórmulas: Si usas fórmulas, pide a la IA que cree la fórmula específica para tus datos.
- Aplicar en una nueva columna: Crea una nueva columna con los valores estandarizados usando la fórmula.
- Verificar resultados: Revisa los datos estandarizados antes de reemplazar los originales.
- Reemplazar datos originales: Copia la columna estandarizada, luego usa Pegar Especial → Valores para reemplazar los originales.
Rellenar valores faltantes
Identificación de valores faltantes
Usa IA para ayudar a identificar y evaluar datos faltantes en tu hoja de cálculo:
- Selecciona tu rango de datos.
- Abre el aviso de IA.
- Pide a la IA que analice los valores faltantes:
- "¿Qué columnas tienen valores faltantes y cuántos?"
- "¿Qué porcentaje de datos falta en cada columna?"
- "¿Hay patrones en los datos faltantes?"
Usar formato condicional para resaltar vacíos
Para identificar visualmente los valores faltantes:
- Selecciona tu rango de datos.
- Ve a la pestaña Inicio → Formato condicional → Vacío/Error.
- Elige Vacíos para resaltar celdas vacías.
- Selecciona un estilo de formato (por ejemplo, relleno rojo) y haz clic en OK.
Usar IA para recomendar estrategias de relleno
Pide a la IA recomendaciones basadas en tus datos específicos:
- Para análisis de tendencias: Usa interpolación lineal si los datos son series temporales. Crea una fórmula que promedie los valores antes y después de cada hueco.
- Para estadísticas resumidas: Rellena con la mediana (más robusta ante valores atípicos que la media):
=IF(ISBLANK(C1), MEDIAN($C$1:$C$200), C1) - Para análisis segmentado: Si tienes categorías (por ejemplo, regiones), rellena con el promedio para esa categoría específica usando
AVERAGEIF. - Para estimaciones conservadoras: Rellena con el valor mínimo en el rango si quieres evitar sobreestimar.
- Excluir del análisis: Para cálculos críticos, podrías filtrar filas con valores faltantes en lugar de rellenarlas.
Limitaciones y consideraciones
Al usar IA para la limpieza de datos, ten en cuenta lo siguiente:
- La IA proporciona orientación, no automatización: La IA ayuda a identificar problemas y recomendar soluciones, pero tú aplicas los pasos de limpieza usando las funciones integradas del Editor de Hojas de Cálculo.
- El contexto importa: Las recomendaciones de IA se basan en patrones comunes. Tus reglas de negocio específicas pueden requerir enfoques diferentes.
- Verifica antes de reemplazar: Siempre revisa los datos limpiados antes de sobrescribir los originales, especialmente para conjuntos de datos grandes.
- Algunas limpiezas requieren juicio: Decidir si los casi duplicados son realmente el mismo registro a menudo requiere conocimiento humano de los datos.