- Accueil
- IA
- Guides utilisateurs
- Netoyer vos données avec l'IA
Netoyer vos données avec l'IA
Éditeur de classeurs ONLYOFFICE vous permet d'utiliser des assistants IA pour nettoyer et préparer vos données en vue de leur analyse. Combiner les fonctionnalités de l'IA avec les fonctionnalités de nettoyage intégrées pour supprimer les doublons, standardiser les formats incohérents et combler les valeurs manquantes afin de garantir que vos données sont exactes et prêtes à l'emploi.
Éditeur de classeurs propose deux approches complémentaires:
- Nettoyage assisté par IA - Utilisez des invites en langage naturel pour identifier les problèmes, obtenir des recommandations et générer des formules de nettoyage.
- Fonctionnalités de nettoyage intégrées - Utilisez l'outil Supprimer les doublons, les fonctions texte et Rechercher et remplacer pour des corrections précises
Ouvrir l'invite IA
Pour ouvrir l'invite IA dans l'éditeur de classeurs, appuyez sur Ctrl+/ (ou ⌘+/ sous macOS). Utilisez ce raccourci chaque fois que vous souhaitez envoyer une invite à l'IA dans les flux de travail décrits dans cet article.
Supprimer les doublons
Éditeur de classeurs propose un outil intégré Supprimer les doublons dans l'onglet Données permettant d'éliminer les lignes en double en fonction des colonnes sélectionnées. Pour des instructions détaillées sur l'utilisation de cette fonctionnalité, consultez l'article Supprimer les doublons.
Vous pouvez également utiliser la Mise en forme conditionnelle avec la règle Doublon/Unique pour mettre en évidence les doublons avant leur suppression.
Utiliser l'IA pour identifier et gérer les doublons
L'IA peut vous aider à identifier les doublons potentiels qui ne sont pas des correspondances exactes et à élaborer des stratégies de traitement de ceux-ci:
- Sélectionnez la plage de données à vérifier.
- Ouvrez l'invite IA.
- Demandez l'aide de l'IA pour rechercher les doublons:
- "Quelles colonnes dois-je vérifier pour identifier les doublons dans ces données?"
- "Y a-t-il des quasi-doublons ou des entrées similaires qui pourraient correspondre au même enregistrement?"
- "Comment dois-je gérer les entrées en double - conserver la première, la dernière, ou fusionner?"
Standardiser des formats
Fonctions texte pour la standardisation
Éditeur de classeurs propose plusieurs fonctions texte pour standardiser des données:
| Fonction | Objectif | Exemple |
|---|---|---|
| SUPPRESPACE(texte) | Supprimer tous les espaces au début et à la fin et les espaces superflus. | =SUPPRESPACE(" John Smith ") → "John Smith" |
| MAJUSCULE(texte) | Convertir texte en caractères majuscules. | =MAJUSCULE("london") → "LONDON" |
| MINUSCULE(texte) | Convertir texte en caractères minuscules. | =MINUSCULE("LONDON") → "london" |
| NOMPROPRE(texte) | Convertir en majuscule la première lettre de chaque mot. | =NOMPROPRE("john smith") → "John Smith" |
| EPURAGE(texte) | Supprimer les caractères non imprimables | =EPURAGE(A1) |
| SUBSTITUE(texte, ancien, nouveau) | Remplacer du texte | =SUBSTITUE("U.S.","U.S.","USA") → "USA" |
| TEXTE(valeur, format) | Mettre en forme des nombres/dates de manière cohérente | =TEXTE(A1,"YYYY-MM-DD") |
Utiliser l'IA pour générer des formules de standardisation
Demandez à l'IA de créer des formules adaptées à vos besoins spécifiques de standardisation:
Exemple d'invite: "Crée une formule pour standardiser les numéros de téléphone de la colonne A au format (XXX) XXX-XXXX. "
Exemple de réponse: "Utilisez cette formule pour standardiser les numéros de téléphone: =TEXTE(SUBSTITUE(SUBSTITUE(SUBSTITUE(A1,"-",""),"(",""),")",""),"(###) ###-####"). Cette formule supprime la mise en forme existante et applique le format standard. Pour les numéros avec indicatif pays ou de longueur variable, une approche plus complexe avec des instructions IF imbriquées ou une colonne auxiliaire peut être nécessaire."
Utiliser la fonction Rechercher et remplacer pour la standardisation en masse
Éditeur de classeurs propose la fonctionnalité intégrée Rechercher et remplacerCtrl+H) pour effectuer de simples remplacements de texte dans vos données.
Flux de travail de standardisation assisté par IA
Pour les tâches de standardisation complexes, suivez cette procédure
- Identifier les problèmes: Ouvrez l'invite IA et demandez à l'IA d'analyser un échantillon de vos données et de lister les incohérences de mise en forme.
- Obtenir des recommandations: Demandez à l'IA quelle est la meilleure approche : les formules, la fonction « Rechercher et remplacer » ou la correction manuelle.
- Générer des formules: Si vous utilisez des formules, demandez à l'IA de créer la formule appropriée à vos données.
- Appliquer dans une nouvelle colonne: Créez une nouvelle colonne avec les valeurs standardisées à l'aide de la formule.
- Vérifier les résultats: Examinez les données standardisées avant de remplacer les données d'origine.
- Remplacer les données d'origine: Copiez la colonne standardisée, ensuite utilisez Collage spécial → Valeurs pour remplacer les données d'origine.
Remplir des valeurs manquantes
Identifier des valeurs manquantes
Utilisez l'IA pour identifier et évaluer les données manquantes dans votre classeur:
- Sélectionnez votre plage de données.
- Ouvrez l'invite IA.
- Demandez à l'IA d'analyser les valeurs manquantes:
- "Quelles colonnes ont des valeurs manquantes et combien?"
- "Quel pourcentage de données est manquant dans chaque colonne?"
- "Y a-t-il des tendances dans les données manquantes?"
Utiliser la mise en forme conditionnelle pour mettre en évidence les cellules vides
Pour identifier visuellement les valeurs manquantes:
- Sélectionnez votre plage de données.
- Accédez à l'onglet Accueil → Mise en forme conditionnelle → Vide/Erreur.
- Choisissez Vides pour mettre en surbrillance les cellules vides.
- Sélectionnez un style de mise en forme (par ex., remplissage rouge) et cliquez sur OK.
Utiliser l'IA pour recommander des stratégies de remplissage
Demandez à l'IA des recommandations adaptées à vos données:
- Pour l'analyse de tendances: Utilisez l'interpolation linéaire si les données sont des séries temporelles. Créez une formule qui calcule la moyenne des valeurs avant et après chaque lacune.
- Pour les statistiques récapitulatives: Remplissez avec la médiane (plus robuste aux valeurs aberrantes que la moyenne):
=IF(ISBLANK(C1), MEDIAN($C$1:$C$200), C1) - Pour l'analyse segmentée: Si vous avez des catégories (par ex., des régions), remplissez avec la moyenne de la catégorie spécifique à l'aide de
MOYENNE.SI. - Pour des estimations prudentes: Remplissez avec la valeur minimale de la plage si vous souhaitez éviter une surestimation.
- Exclure de l'analyse: Pour les calculs critiques, il peut être préférable de filtrer les lignes contenant des valeurs manquantes plutôt que de les remplir.
Limites et considérations
Lors de l'utilisation de l'IA pour le nettoyage des données, gardez à l'esprit les points suivants :
- L'IA fournit des conseils, pas une automatisation: L'IA aide à identifier les problèmes et à recommander des solutions, mais c'est vous qui appliquez les étapes de nettoyage à l'aide des fonctionnalités intégrées de l'éditeur de classeurs.
- Le contexte est important: Les recommandations de l'IA sont basées sur des modèles courants. Vos règles métier spécifiques peuvent nécessiter des approches différentes.
- Vérifiez avant de remplacer: Examinez toujours les données nettoyées avant d'écraser les données d'origine, en particulier pour les grands ensembles de données.
- Certains nettoyages nécessitent du jugement: Déterminer si des quasi-doublons constituent vraiment le même enregistrement requiert souvent une connaissance humaine des données.