Les partenaires publicitaires:

Comment utiliser la fonction de valeurs aberrantes dans Excel

Les valeurs aberrantes sont des valeurs de données qui sont beaucoup plus grands ou plus petits que les autres valeurs de données dans votre ensemble de données. Les valeurs aberrantes peuvent fausser les calculs statistiques de base tels que l'écart moyen et standard, ce qui est commun dans l'analyse statistique pour identifier les valeurs aberrantes dans l'ensemble avant d'effectuer l'analyse statistique des données.

Microsoft Excel n'a pas une fonction intégrée dans Outliers, car il ya beaucoup de différentes méthodes utilisées pour trouver les valeurs aberrantes. Mais vous pouvez combiner deux fonctions Excel pour trouver les valeurs aberrantes dans vos données en utilisant l'une des méthodes les plus courantes et simples.

Étapes de calcul

Nous utilisons un ensemble de données de l'échantillon de 15 points pour le démontrer. Nos données a deux valeurs qui sont beaucoup plus grandes que les autres valeurs et qui est beaucoup plus petite que les autres valeurs.

Données-échantillon
Données-échantillon

Attention

  • Le calcul pour déterminer les valeurs aberrantes ne donne des résultats précis pour les relativement grands ensembles de données avec une distribution normale. Un petit ensemble de données est utilisé dans cet exemple uniquement pour illustrer les calculs. Mais les résultats peuvent ne pas être exacts si vous avez défini un petites données ou si vos données ne suivent pas une distribution normale.

Étape 1: Calculez le premier et troisième quartiles (Q1 et Q3)

Calculer les premier et troisième quartiles des données en utilisant la fonction Excel quartile (cliquez ici pour savoir comment utiliser la fonction de quartile dans Excel). Dans notre exemple, ceux-ci sont étiquetés Quartile 1 (Q1) et 3 quartile (Q3).

Pointe

  • Pour calculer les quartiles les données doivent être triés du plus bas au plus élevé. Mais la fonction de quartile trie automatiquement les données pour vous, alors vous ne devez trier vos données avant d'utiliser cette fonction.

Etape 2: Calculer l'écart interquartile (IQR de)

Soustraire les quartiles 1 (Q1) du quartile 3 (Q3). Le résultat est appelé le Interquartile Range-ce dans notre exemple est étiqueté Interquartile (IQR).

Etape 3: Calculer la borne supérieure et la Basse-Bound

Ajouter 1,5 fois l'écart interquartile (IQR) à 3 quartile (Q3) - ce qui est étiqueté Limite supérieure. Soustraire 1,5 fois l'écart interquartile (IQR) du quartile 1 (Q1) - ceci est étiqueté Borne inférieure.

Pointe

  • Les valeurs aberrantes sont parfois classés comme faible aberrantes ou fort aberrantes. Le multiple de 1,5 x l'écart interquartile est généralement utilisé pour identifier ce qu'on appelle des valeurs aberrantes faibles. Pour identifier les valeurs aberrantes fortes, changer le multiple de 1,5 x l'écart interquartile à 3,0 x l'écart interquartile.

Étape 4: Comparer la première valeur de données à la borne supérieure et la borne inférieure




Si la première valeur de l'ensemble de données est plus grand que l'Upper Bound ou inférieure à la limite inférieure alors il est une valeur aberrante. Utilisez le Excel fonction OU pour comparer la première valeur à la borne supérieure et la borne inférieure dans le même temps.

Pointe

  • Voici la formule complète pour tester si la valeur 1 (A2) est une aberration:

    = OU (A2gt; (quartile (2 A $: 16,3 $ A) + (1,5(Quartile (2 A $: A 16,3 $) -QUARTILE (2 A $: 16,1 $ A)))), A2lt; (quartile (2 A $: A 16,1 $) - (1,5(Quartile (2 A $: A $ 16,3) -QUARTILE (2 A $: 16,1 $ A)))))

    Pour utiliser cette formule dans votre propre feuille de calcul Excel, vous devez:

    1. Remplacez la valeur de la cellule (A2) avec la première valeur de données dans votre gamme.
    2. Remplacer la plage de données dans la formule (2 $ A: A 16 $) avec la gamme complète de vos propres données.
    3. Par exemple, si vous avez 200 lignes de données commençant à la première rangée de la colonne C (C1) et étendant à la ligne 200e de la colonne C (C200), la première valeur de données dans votre gamme est C1 et votre gamme de données est de 1 $ C : 200 $ CAN. Vous devez modifier la formule de ce qui suit:

      = OU (C1gt; (quartile (C $ 1: 200,3 $ C) + (1,5(Quartile (C $ 1: 200,3 $ CA) -QUARTILE (C $ 1: 200C $ C $ 1: 200,1 $ CA)))), C1lt; (quartile (C $ 1: 200,1 C $) - (1,5(Quartile (C $ 1: 200,3 $ CA) -QUARTILE (C $ 1: 200,1 $ CA)))))

    Étape 5: Copiez la formule pour chaque valeur de données

    Après la formule est entrée à côté de votre première valeur de données, vous pouvez simplement copier la formule pour déterminer si vos autres valeurs de données sont aberrantes. Pour copier la formule pour toutes vos valeurs de données:

    1. Entre le Première Valeur Outlier formule dans la cellule à la droite de votre première valeur de données.
    2. Mettez en surbrillance la cellule où vous avez copié la formule.
    3. Cliquez sur le carré dans le coin inférieur droit de la cellule en surbrillance et faites-le glisser jusqu'à ce que toutes les cellules à côté de vos valeurs de données sont sélectionnés, puis relâchez le bouton de la souris.

    La cellule à côté de chaque valeur de données affiche vrai ou faux. Les valeurs de données à la gauche de cellules présentant TRUE sont des valeurs aberrantes.

    Pointe

    • Au lieu de créer une nouvelle colonne pour afficher laquelle les cellules sont aberrantes, vous pouvez également utiliser la formule ci-dessus avec la fonction Excel mise en forme conditionnelle pour mettre en évidence les cellules avec des valeurs aberrantes dans une couleur différente ou la police. Vous pouvez visiter le soutien de Microsoft Office pour apprendre à utiliser une formule à appliquer le formatage conditionnel.

    » » » » Comment utiliser la fonction de valeurs aberrantes dans Excel