- Home
- IA
- Guias do usuário
- Limpando dados com IA
Limpando dados com IA
O editor de planilhas do ONLYOFFICE permite que você use assistentes de IA para ajudar a limpar e preparar seus dados para análise. Ao combinar capacidades de IA com recursos internos de limpeza de dados, você pode remover entradas duplicadas, padronizar formatos inconsistentes e preencher valores ausentes para garantir que seus dados sejam precisos e prontos para uso.
O editor de planilhas oferece duas abordagens que funcionam em conjunto:
- Limpeza assistida por IA — Use prompts em linguagem natural para identificar problemas, obter recomendações e gerar fórmulas de limpeza.
- Recursos internos de limpeza — Use a ferramenta Remover Duplicados, funções de texto e Localizar & Substituir para correções precisas.
Abrindo o prompt de IA
Para abrir o prompt de IA no editor de planilhas, pressione Ctrl+/ (ou ⌘+/ no macOS). Use este atalho sempre que precisar enviar um prompt para a IA nos fluxos de trabalho descritos neste artigo.
Removendo duplicados
O editor de planilhas fornece uma ferramenta interna Remover Duplicados na guia Dados que permite eliminar linhas duplicadas com base em colunas selecionadas. Para instruções detalhadas sobre como usar este recurso, consulte o artigo sobre remover duplicados.
Você também pode usar Formatação condicional com a regra Duplicado/Único para destacar duplicados para revisão antes da remoção.
Usando IA para identificar e lidar com duplicados
A IA pode ajudar a identificar potenciais duplicados que não são correspondências exatas e desenvolver estratégias para lidar com eles:
- Selecione o intervalo de dados que deseja verificar.
- Abra o prompt de IA.
- Peça ajuda à IA com duplicados:
- "Quais colunas devo verificar para identificar registros duplicados nestes dados?"
- "Existem quase duplicados ou entradas semelhantes que podem ser o mesmo registro?"
- "Como devo lidar com entradas duplicadas — manter a primeira, manter a última ou mesclar?"
Padronizando formatos
Funções de texto para padronização
O editor de planilhas fornece várias funções de texto para padronizar dados:
| Função | Propósito | Exemplo |
|---|---|---|
| TRIM(texto) | Remove espaços à esquerda, à direita e extras | =TRIM(" John Smith ") → "John Smith" |
| UPPER(texto) | Converte texto para maiúsculas | =UPPER("london") → "LONDON" |
| LOWER(texto) | Converte texto para minúsculas | =LOWER("LONDON") → "london" |
| PROPER(texto) | Capitaliza a primeira letra de cada palavra | =PROPER("john smith") → "John Smith" |
| CLEAN(texto) | Remove caracteres não imprimíveis | =CLEAN(A1) |
| SUBSTITUTE(texto, antigo, novo) | Substitui texto específico | =SUBSTITUTE("U.S.","U.S.","USA") → "USA" |
| TEXT(valor, formato) | Formata números/datas de forma consistente | =TEXT(A1,"YYYY-MM-DD") |
Usando IA para gerar fórmulas de padronização
Peça à IA para criar fórmulas para suas necessidades específicas de padronização:
Exemplo de prompt: "Crie uma fórmula para padronizar números de telefone na coluna A para o formato (XXX) XXX-XXXX."
Exemplo de resposta: "Use esta fórmula para padronizar números de telefone: =TEXT(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A1,"-",""),"(",""),")",""),"(###) ###-####"). Isso remove a formatação existente e aplica o formato padrão. Para números de telefone com códigos de país ou comprimentos variados, você pode precisar de uma abordagem mais complexa usando instruções IF aninhadas ou uma coluna auxiliar."
Usando Localizar & Substituir para padronização em massa
O editor de planilhas fornece um recurso interno de Localizar e Substituir (Ctrl+H) para substituições de texto simples em seus dados.
Fluxo de trabalho de padronização assistido por IA
Para tarefas complexas de padronização, siga este fluxo de trabalho:
- Identificar problemas: Abra o prompt de IA e peça à IA para analisar uma amostra de seus dados e listar inconsistências de formatação.
- Obter recomendações: Pergunte à IA qual abordagem é melhor — fórmulas, Localizar & Substituir ou correção manual.
- Gerar fórmulas: Se usar fórmulas, peça à IA para criar a fórmula específica para seus dados.
- Aplicar em uma nova coluna: Crie uma nova coluna com os valores padronizados usando a fórmula.
- Verificar resultados: Revise os dados padronizados antes de substituir os originais.
- Substituir dados originais: Copie a coluna padronizada, depois use Colar Especial → Valores para substituir os originais.
Preenchendo valores ausentes
Identificando valores ausentes
Use a IA para ajudar a identificar e avaliar dados ausentes em sua planilha:
- Selecione seu intervalo de dados.
- Abra o prompt de IA.
- Peça à IA para analisar valores ausentes:
- "Quais colunas têm valores ausentes e quantos?"
- "Qual percentual de dados está ausente em cada coluna?"
- "Existem padrões nos dados ausentes?"
Usando formatação condicional para destacar vazios
Para identificar visualmente valores ausentes:
- Selecione seu intervalo de dados.
- Vá para a guia Início → Formatação condicional → Vazio/Erro.
- Escolha Vazios para destacar células vazias.
- Selecione um estilo de formatação (por exemplo, preenchimento vermelho) e clique em OK.
Usando IA para recomendar estratégias de preenchimento
Peça à IA recomendações com base em seus dados específicos:
- Para análise de tendência: Use interpolação linear se os dados forem uma série temporal. Crie uma fórmula que faça a média dos valores antes e depois de cada lacuna.
- Para estatísticas resumidas: Preencha com a mediana (mais robusta a outliers do que a média):
=IF(ISBLANK(C1), MEDIAN($C$1:$C$200), C1) - Para análise segmentada: Se você tiver categorias (por exemplo, regiões), preencha com a média para essa categoria específica usando
AVERAGEIF. - Para estimativas conservadoras: Preencha com o valor mínimo no intervalo se quiser evitar superestimativas.
- Excluir da análise: Para cálculos críticos, você pode filtrar linhas com valores ausentes em vez de preenchê-los.
Limitações e considerações
Ao usar IA para limpeza de dados, tenha em mente o seguinte:
- A IA fornece orientação, não automação: A IA ajuda a identificar problemas e recomendar soluções, mas você aplica as etapas de limpeza usando os recursos internos do editor de planilhas.
- O contexto importa: As recomendações da IA são baseadas em padrões comuns. Suas regras de negócios específicas podem exigir abordagens diferentes.
- Verifique antes de substituir: Sempre revise os dados limpos antes de sobrescrever os originais, especialmente para grandes conjuntos de dados.
- Algumas limpezas requerem julgamento: Decidir se quase duplicados são realmente o mesmo registro muitas vezes requer conhecimento humano dos dados.