Les partenaires publicitaires:

Comment tester la signification de chevauchement entre les échantillons

Procédures statistiques simples sont disponibles pour déterminer si il ya des différences significatives entre les séries d'échantillons. Les différences peuvent être déterminées entre les échantillons avec des points de données qui se chevauchent, ainsi que des échantillons discrets à ce que les ensembles de données. La procédure la plus couramment utilisée pour déterminer si il ya des différences importantes est appelé le test t de l'étudiant, ou, tout simplement, le test t. Cet essai peut être appliqué à des échantillons qui ont des points de données qui se chevauchent. Il ya plusieurs étapes formelles à faire le test, le premier de ce qui se développe ce qu'on appelle une hypothèse nulle. Puis il ya les calculs qui peut être fait soit manuellement ou en ligne.

Choses que vous devez

  • Un nombre égal de valeurs d'échantillons de chaque échantillon (si vous faites les calculs manuellement)
  • 2 échantillons qui ont cinq ou plusieurs points de données
  • Calculatrice
  • Tableau contenant t-scores, degrés de valeurs de la liberté et P
  1. Calcul de la signification manuellement

    • 1

      Faites votre hypothèse nulle. L'hypothèse nulle applicable dans ce cas serait qu'il n'y a pas de différence entre les moyens (moyennes) des deux échantillons. Si vous rejetez l'hypothèse nulle sur la base des résultats de vos tests, alors il ya une probabilité de différences significatives entre les échantillons.

    • 2
      Tous les calculs peut être fait sur une simple calculatrice. Les calculatrices scientifiques peuvent avoir des fonctions statistiques ainsi.
      Tous les calculs peut être fait sur une simple calculatrice. Les calculatrices scientifiques peuvent avoir des fonctions statistiques ainsi.

      Calculer la moyenne (moyenne) de chaque ensemble d'échantillons, qui est la somme de toutes les valeurs dans chaque jeu divisé par le nombre de valeurs. Par exemple, si vous avez les numéros 1, 2, 3, 4 et 5, ils vont ajouter jusqu'à 15. Lorsque vous divisez ce nombre par 5, la moyenne est de 3.

    • 3

      Calculer la variance (s ^ 2) et l'erreur standard (SE) pour les deux séries d'échantillons. La variance est calculée en premier calcul de la différence entre chacune des valeurs dans chaque ensemble de moyens, puis au carré la valeur. Donc, si vous avez un ensemble de trois nombres comme 10, 15 et 20, la moyenne est de 15 et les différences respectives sont -5, 0 et +5. Chacune de ces valeurs est élevé au carré, puis additionnés et divisés par le nombre de valeurs moins une (n-1 = 2). Donc, dans cet exemple, la variance est 50/2 = 25. La valeur de l'erreur-type, si il ya trois valeurs pour chacun des deux échantillons, serait SE = sq rt [(s ^ 2/3) + (s ^ 2/3)], où la variance de chacun des échantillons est inclus dans la formule.

    • 4

      Calculer le T-score. Tout d'abord déterminer les différences entre les deux moyens. Divisez cette valeur par l'erreur standard, vous avez calculé précédemment.

    • 5



      Déterminer si il ya une différence significative entre les deux échantillons. Ceci est fait en utilisant une table qui a t-scores cotées. Tout d'abord, trouver la ligne qui a le nombre de degrés de liberté, ce qui est le nombre d'échantillons que vous avez moins un. Si vous avez six numéros pour un ensemble de l'échantillon, les degrés de liberté seront 5.

      Aller à la colonne dans la table qui a une valeur de probabilité de 0,05 et de trouver le T-score qui est donné. Si votre T-score est supérieur à cette valeur, alors vous feriez "pas ne pas refuser" l'hypothèse nulle, ce qui signifie qu'il n'y a pas de différences significatives dans vos échantillons se chevauchent. Toutefois, si votre T-score est égal ou inférieur à cette valeur, alors vous rejetez cette hypothèse et de conclure qu'il existe des preuves pour des différences significatives.

    • Détermination de la différence à l'aide Ressources en ligne

      • 1

        Trouver un site Web qui a un "calculatrice t-test." Ces sites vous permettent d'entrer vos données, sélectionnez la variété appropriée de t-test et d'effectuer les calculs. Un autre avantage de calculatrices en ligne est qu'ils peuvent effectuer différents types de tests qui vous conviennent données.

      • 2

        Entrer les données pour chacun des deux échantillons. Selon le site en ligne que vous utilisez, vous pouvez entrer des données brutes ou des statistiques descriptives que vous avez déjà accomplies, telles que les moyens, les écarts types et le nombre de points de données pour chaque échantillon.

      • 3

        Sélectionnez le type approprié de test pour vos données. Si vos données comprend un nombre égal de points de données, sélectionner un test t apparié, mais si elle a un nombre différent de points de données, utiliser un test t non apparié. Enfin, si vous savez que vos données ne suit pas une distribution normale, sélectionnez un test non-paramétrique. Si vous n'êtes pas sûr de votre distribution de données, le chemin sûr est de sélectionner un test non paramétrique.

      • 4

        Appuyez sur l'icône qui permet au programme de calculer les résultats. La page de résultats doit montrer la valeur de P ou niveau de signification. Si la valeur est inférieure à 0,05, il y aurait une différence significative entre les deux séries d'échantillons. Cependant, si la valeur de P est supérieure à 0,05, vous concluez que les échantillons se chevauchent tant qu'il n'y a pas de différence significative.

    Conseils & Avertissements

    • Le t-test suppose que vous avez deux échantillons ayant des valeurs qui sont normalement distributed- qui est, les valeurs peuvent être reportés sur un graphique et cette parcelle sera ressembler à un "normal" distribution. Parfois, les statisticiens utilisent transformations de données pour ajuster les données pour avoir une distribution normale avant l'analyse statistique. Transformations qui sont utilisés comprennent journal et de la racine carrée.
    • Comme le nombre de valeurs dans chaque ensemble augmente, les degrés d'augmentation de la liberté. Cela augmente la probabilité de trouver les différences, lorsque les différences entre les moyennes d'échantillon sont petites. Donc, il est préférable d'avoir un plus grand nombre de valeurs pour chaque ensemble d'avoir ce qu'on appelle un "robuste" analyse.
    • Les valeurs de chacun des échantillons sont supposés être aléatoire pour se qualifier pour l'utilisation du test t.
    » » » » Comment tester la signification de chevauchement entre les échantillons