Formules de statistiques

Formules de statistiques

Médian

La moyenne (moyenne) est calculée en additionnant toutes les valeurs d'un ensemble de données, puis en divisant la somme par le nombre total de valeurs. Il représente la tendance centrale des données.

Formule : Moyenne = (Σx) / n

Où :

  • La moyenne est la moyenne
  • Σx est la somme de toutes les valeurs de l'ensemble de données
  • n est le nombre total de valeurs dans l'ensemble de données
Moyenne

La médiane est la valeur médiane d'un ensemble de données lorsque les valeurs sont classées par ordre croissant.

S’il existe un nombre pair de valeurs, la médiane est la moyenne des deux valeurs médianes.

Formule (nombre impair de valeurs) : Médiane = Valeur moyenne

Formule (Nombre pair de valeurs) : Médiane = (Valeur à la position n/2 + Valeur à la position (n/2 + 1)) / 2

Minimum

Le minimum est la plus petite valeur d'un ensemble de données.

Formule : Minimum = Plus petite valeur

Maximum

Le maximum est la plus grande valeur d'un ensemble de données.

Formule : Maximum = plus grande valeur

Catégorie

La plage est la différence entre les valeurs maximales et minimales d'un ensemble de données. Il fournit une mesure de la propagation ou de la variabilité des données.

Formule : Plage = Maximum - Minimum

milieu de gamme

Le milieu de gamme est la moyenne des valeurs maximales et minimales d'un ensemble de données.

Formule : Milieu de gamme = (Maximum + Minimum) / 2

que vous avez

Le nombre représente le nombre total de valeurs dans un ensemble de données.

Somme

La somme est le total de toutes les valeurs d'un ensemble de données.

Formule : Somme = Σx

Où :

  • Σx est la somme de toutes les valeurs de l'ensemble de données
Centile

Un percentile représente la valeur en dessous de laquelle se situe un pourcentage donné des données. Il est souvent utilisé pour identifier des points de données spécifiques dans une distribution.

quartile

Un quartile divise un ensemble de données en quatre parties égales, chaque partie contenant 25 % des données. Les quartiles sont souvent utilisés pour évaluer la répartition des données.

Somme des carrés

La somme des carrés est la somme des carrés des différences entre chaque point de données et la moyenne. C'est un élément clé dans le calcul de la variance et de l'écart type.

Formule : Somme des carrés = Σ(x - Moyenne)²

Où :

  • Σ représente le symbole de sommation
  • x est chaque point de données
  • La moyenne est la moyenne (moyenne) de l'ensemble de données
L'écart-type

L'écart type mesure le degré de variation ou de dispersion dans un ensemble de données. Il indique l'écart entre les points de données et la moyenne.

Formule : Écart type = √(Σ(x - Moyenne)² / (n - 1))

Où :

  • √ représente la racine carrée
  • Σ représente le symbole de sommation
  • x est chaque point de données
  • La moyenne est la moyenne (moyenne) de l'ensemble de données
  • n est le nombre total de valeurs dans l'ensemble de données
Variance

La variance est une mesure de la propagation ou de la dispersion d'un ensemble de données. Il s'agit de la moyenne des carrés des différences entre chaque point de données et de la moyenne.

Formule (variance de population) : Variance (σ²) = Σ(x - Moyenne)² / N

Où :

  • Σ représente le symbole de sommation
  • x est chaque point de données
  • La moyenne est la moyenne (moyenne) de l'ensemble de données
  • N est le nombre total de valeurs dans la population

Remarque : lorsque vous travaillez avec un échantillon de données, utilisez la formule de variance de l'échantillon, qui divise par (N - 1) au lieu de N. Cette correction tient compte du biais de l'échantillon.

Score Z

Le score Z mesure le nombre d'écarts types entre un point de données et la moyenne dans une distribution normale standard. Il est utilisé pour standardiser les données et évaluer leur position par rapport à la moyenne.

Formule : Z-Score = (x - Moyenne) / Écart type

Où :

  • x est le point de données
  • La moyenne est la moyenne (moyenne) de l'ensemble de données
  • L'écart type est l'écart type de l'ensemble de données
Intervalle interquartile (IQR)

L'intervalle interquartile est l'intervalle entre le premier quartile (Q1 - 25e centile) et le troisième quartile (Q3 - 75e centile) dans un ensemble de données. Il fournit une mesure de la diffusion des 50 % moyens des données.

Formule : IQR = Q3 - Q1

Où :

  • Q1 est le premier quartile (25e percentile)
  • Le troisième trimestre est le troisième quartile (3e percentile)
Coefficient de variation (CV)

Le coefficient de variation est une mesure relative de la variabilité et est exprimé en pourcentage. Il est utilisé pour comparer l'écart type des données à sa moyenne, ce qui le rend utile pour évaluer la variabilité relative entre des ensembles de données avec des moyennes différentes.

Formule : CV = (Écart type / Moyenne) * 100 %

Skewness

L'asymétrie mesure l'asymétrie de la distribution de probabilité d'une variable aléatoire à valeur réelle. Il indique si les données sont inclinées vers la droite ou vers la gauche.

Une asymétrie positive indique que la queue de la distribution est inclinée vers la droite (asymétrique à droite), ce qui signifie qu'il y a des valeurs plus extrêmes sur le côté droit de la distribution.

Une asymétrie négative indique que la queue de la distribution est inclinée vers la gauche (inclinaison vers la gauche), ce qui signifie qu'il y a des valeurs plus extrêmes sur le côté gauche de la distribution.

Kurtosis

L'aplatissement mesure la « queue » de la distribution de probabilité d'une variable aléatoire à valeur réelle. Il indique la présence et le degré de valeurs aberrantes dans les données.

Un kurtosis positif (leptokurtique) indique des queues lourdes et un pic, ce qui signifie que les données ont des valeurs plus extrêmes et présentent plus de pics qu'une distribution normale.

Un aplatissement négatif (platykurtique) indique des queues légères et une distribution plus plate, ce qui signifie que les données ont moins de valeurs extrêmes et sont plus plates qu'une distribution normale.

Covariance

La covariance mesure le degré dans lequel deux variables changent ensemble. Il indique si les variables ont une relation linéaire positive ou négative.

Formule : Cov(X, Y) = Σ((X - Moyenne(X)) * (Y - Moyenne(Y))) / (n - 1)

Où :

  • Σ représente le symbole de sommation
  • X et Y sont des variables
  • Mean(X) et Mean(Y) sont respectivement les moyennes de X et Y
  • n est le nombre total d'observations

Si la covariance est positive, cela indique une relation positive (X a tendance à augmenter lorsque Y augmente).

Si la covariance est négative, cela indique une relation négative (X a tendance à diminuer lorsque Y augmente).

Coefficient de corrélation (r de Pearson)

Le coefficient de corrélation mesure la force et la direction de la relation linéaire entre deux variables. Il s'agit d'une version normalisée de la covariance qui va de -1 à 1.

Formule : r = Cov(X, Y) / (Écart type(X) * Écart type(Y))

Où :

  • Cov(X, Y) est la covariance entre X et Y
  • L'écart type (X) et l'écart type (Y) sont les écarts types de X et Y, respectivement.

Si |r| est proche de 1, cela indique une relation linéaire forte, avec r positif indiquant une corrélation positive et r négatif indiquant une corrélation négative. Si |r| est proche de 0, cela indique une relation linéaire faible ou inexistante.

point 1
Une requête?

J'ai mis tellement d'efforts à écrire ce billet de blog pour vous apporter de la valeur. Cela me sera très utile, si vous envisagez de le partager sur les réseaux sociaux ou avec vos amis/famille. LE PARTAGE C'EST ♥️

Avatar de Nidhi

Qui sommes-nousNidhi

Salut! Je m'appelle Nidhi.

Ici, à l'EHL, tout est question de recettes délicieuses et faciles pour recevoir en toute décontraction. Alors venez me rejoindre à la plage, détendez-vous et profitez de la nourriture.

Soyez sympa! Laissez un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *