Netoyer vos données avec l'IA

Éditeur de classeurs ONLYOFFICE vous permet d'utiliser des assistants IA pour nettoyer et préparer vos données en vue de leur analyse. Combiner les fonctionnalités de l'IA avec les fonctionnalités de nettoyage intégrées pour supprimer les doublons, standardiser les formats incohérents et combler les valeurs manquantes afin de garantir que vos données sont exactes et prêtes à l'emploi.

Par défaut, l'IA n'est pas connecté aux éditeurs par défaut pour des raisons de sécurité. Pour utiliser l'IA dans le nettoyage des données, vous devez d'abord installer et configurer le module complémentaire IA. Consultez le guide Assistants IA: configuration et réglage pour obtenir des instructions détaillées.

Éditeur de classeurs propose deux approches complémentaires:

  • Nettoyage assisté par IA - Utilisez des invites en langage naturel pour identifier les problèmes, obtenir des recommandations et générer des formules de nettoyage.
  • Fonctionnalités de nettoyage intégrées - Utilisez l'outil Supprimer les doublons, les fonctions texte et Rechercher et remplacer pour des corrections précises

Ouvrir l'invite IA

Pour ouvrir l'invite IA dans l'éditeur de classeurs, appuyez sur Ctrl+/ (ou +/ sous macOS). Utilisez ce raccourci chaque fois que vous souhaitez envoyer une invite à l'IA dans les flux de travail décrits dans cet article.

Supprimer les doublons

Éditeur de classeurs propose un outil intégré Supprimer les doublons dans l'onglet Données permettant d'éliminer les lignes en double en fonction des colonnes sélectionnées. Pour des instructions détaillées sur l'utilisation de cette fonctionnalité, consultez l'article Supprimer les doublons.

Vous pouvez également utiliser la Mise en forme conditionnelle avec la règle Doublon/Unique pour mettre en évidence les doublons avant leur suppression.

Utiliser l'IA pour identifier et gérer les doublons

L'IA peut vous aider à identifier les doublons potentiels qui ne sont pas des correspondances exactes et à élaborer des stratégies de traitement de ceux-ci:

  1. Sélectionnez la plage de données à vérifier.
  2. Ouvrez l'invite IA.
  3. Demandez l'aide de l'IA pour rechercher les doublons:
    • "Quelles colonnes dois-je vérifier pour identifier les doublons dans ces données?"
    • "Y a-t-il des quasi-doublons ou des entrées similaires qui pourraient correspondre au même enregistrement?"
    • "Comment dois-je gérer les entrées en double - conserver la première, la dernière, ou fusionner?"

Standardiser des formats

Fonctions texte pour la standardisation

Éditeur de classeurs propose plusieurs fonctions texte pour standardiser des données:

FonctionObjectifExemple
SUPPRESPACE(texte)Supprimer tous les espaces au début et à la fin et les espaces superflus.=SUPPRESPACE(" John Smith ") → "John Smith"
MAJUSCULE(texte)Convertir texte en caractères majuscules.=MAJUSCULE("london") → "LONDON"
MINUSCULE(texte)Convertir texte en caractères minuscules.=MINUSCULE("LONDON") → "london"
NOMPROPRE(texte) Convertir en majuscule la première lettre de chaque mot.=NOMPROPRE("john smith") → "John Smith"
EPURAGE(texte) Supprimer les caractères non imprimables=EPURAGE(A1)
SUBSTITUE(texte, ancien, nouveau)Remplacer du texte=SUBSTITUE("U.S.","U.S.","USA") → "USA"
TEXTE(valeur, format)Mettre en forme des nombres/dates de manière cohérente=TEXTE(A1,"YYYY-MM-DD")
Utiliser l'IA pour générer des formules de standardisation

Demandez à l'IA de créer des formules adaptées à vos besoins spécifiques de standardisation:

Exemple d'invite: "Crée une formule pour standardiser les numéros de téléphone de la colonne A au format (XXX) XXX-XXXX. "

Exemple de réponse: "Utilisez cette formule pour standardiser les numéros de téléphone: =TEXTE(SUBSTITUE(SUBSTITUE(SUBSTITUE(A1,"-",""),"(",""),")",""),"(###) ###-####"). Cette formule supprime la mise en forme existante et applique le format standard. Pour les numéros avec indicatif pays ou de longueur variable, une approche plus complexe avec des instructions IF imbriquées ou une colonne auxiliaire peut être nécessaire."

Utiliser la fonction Rechercher et remplacer pour la standardisation en masse

Éditeur de classeurs propose la fonctionnalité intégrée Rechercher et remplacerCtrl+H) pour effectuer de simples remplacements de texte dans vos données.

Flux de travail de standardisation assisté par IA

Pour les tâches de standardisation complexes, suivez cette procédure

  1. Identifier les problèmes: Ouvrez l'invite IA et demandez à l'IA d'analyser un échantillon de vos données et de lister les incohérences de mise en forme.
  2. Obtenir des recommandations: Demandez à l'IA quelle est la meilleure approche : les formules, la fonction « Rechercher et remplacer » ou la correction manuelle.
  3. Générer des formules: Si vous utilisez des formules, demandez à l'IA de créer la formule appropriée à vos données.
  4. Appliquer dans une nouvelle colonne: Créez une nouvelle colonne avec les valeurs standardisées à l'aide de la formule.
  5. Vérifier les résultats: Examinez les données standardisées avant de remplacer les données d'origine.
  6. Remplacer les données d'origine: Copiez la colonne standardisée, ensuite utilisez Collage spécialValeurs pour remplacer les données d'origine.

Remplir des valeurs manquantes

Identifier des valeurs manquantes

Utilisez l'IA pour identifier et évaluer les données manquantes dans votre classeur:

  1. Sélectionnez votre plage de données.
  2. Ouvrez l'invite IA.
  3. Demandez à l'IA d'analyser les valeurs manquantes:
    • "Quelles colonnes ont des valeurs manquantes et combien?"
    • "Quel pourcentage de données est manquant dans chaque colonne?"
    • "Y a-t-il des tendances dans les données manquantes?"
Utiliser la mise en forme conditionnelle pour mettre en évidence les cellules vides

Pour identifier visuellement les valeurs manquantes:

  1. Sélectionnez votre plage de données.
  2. Accédez à l'onglet AccueilMise en forme conditionnelleVide/Erreur.
  3. Choisissez Vides pour mettre en surbrillance les cellules vides.
  4. Sélectionnez un style de mise en forme (par ex., remplissage rouge) et cliquez sur OK.
Utiliser l'IA pour recommander des stratégies de remplissage

Demandez à l'IA des recommandations adaptées à vos données:

  1. Pour l'analyse de tendances: Utilisez l'interpolation linéaire si les données sont des séries temporelles. Créez une formule qui calcule la moyenne des valeurs avant et après chaque lacune.
  2. Pour les statistiques récapitulatives: Remplissez avec la médiane (plus robuste aux valeurs aberrantes que la moyenne): =IF(ISBLANK(C1), MEDIAN($C$1:$C$200), C1)
  3. Pour l'analyse segmentée: Si vous avez des catégories (par ex., des régions), remplissez avec la moyenne de la catégorie spécifique à l'aide deMOYENNE.SI.
  4. Pour des estimations prudentes: Remplissez avec la valeur minimale de la plage si vous souhaitez éviter une surestimation.
  5. Exclure de l'analyse: Pour les calculs critiques, il peut être préférable de filtrer les lignes contenant des valeurs manquantes plutôt que de les remplir.

Limites et considérations

Lors de l'utilisation de l'IA pour le nettoyage des données, gardez à l'esprit les points suivants :

  • L'IA fournit des conseils, pas une automatisation: L'IA aide à identifier les problèmes et à recommander des solutions, mais c'est vous qui appliquez les étapes de nettoyage à l'aide des fonctionnalités intégrées de l'éditeur de classeurs.
  • Le contexte est important: Les recommandations de l'IA sont basées sur des modèles courants. Vos règles métier spécifiques peuvent nécessiter des approches différentes.
  • Vérifiez avant de remplacer: Examinez toujours les données nettoyées avant d'écraser les données d'origine, en particulier pour les grands ensembles de données.
  • Certains nettoyages nécessitent du jugement: Déterminer si des quasi-doublons constituent vraiment le même enregistrement requiert souvent une connaissance humaine des données.
AvertissementLes opérations de nettoyage des données peuvent modifier vos données de manière permanente. Utilisez toujours une copie de votre classeur d'origine. ONLYOFFICE n'assume aucune responsabilité en cas de perte de données résultant d'opérations de nettoyage. Utilisez la fonction Annuler ( Ctrl+Z) immédiatement si vous souhaitez annuler des modifications.
Articles avec le tag :
Parcourir tous les tags