Fórmulas estadísticas

Fórmulas estadísticas

Media

La media (promedio) se calcula sumando todos los valores de un conjunto de datos y luego dividiendo la suma por el número total de valores. Representa la tendencia central de los datos.

Fórmula: Media = (Σx) / n

Lugar:

  • La media es el promedio
  • Σx es la suma de todos los valores en el conjunto de datos
  • n es el número total de valores en el conjunto de datos
Mediana

La mediana es el valor medio en un conjunto de datos cuando los valores están ordenados en orden ascendente.

Si hay un número par de valores, la mediana es el promedio de los dos valores medios.

Fórmula (número impar de valores): Mediana = Valor medio

Fórmula (Número par de valores): Mediana = (Valor en la posición n/2 + Valor en la posición (n/2 + 1)) / 2

Longitud Mínima

El mínimo es el valor más pequeño de un conjunto de datos.

Fórmula: Mínimo = Valor más pequeño

Máximo

El máximo es el valor más grande en un conjunto de datos.

Fórmula: Máximo = Valor más grande

Gama de Colores

El rango es la diferencia entre los valores máximo y mínimo en un conjunto de datos. Proporciona una medida de la dispersión o variabilidad de los datos.

Fórmula: Rango = Máximo - Mínimo

de gama media

El rango medio es el promedio de los valores máximo y mínimo en un conjunto de datos.

Fórmula: Rango medio = (Máximo + Mínimo) / 2

Contar

El recuento representa el número total de valores en un conjunto de datos.

Suma

La suma es el total de todos los valores de un conjunto de datos.

Fórmula: Suma = Σx

Lugar:

  • Σx es la suma de todos los valores en el conjunto de datos
Percentil

Un percentil representa el valor por debajo del cual cae un porcentaje determinado de los datos. A menudo se utiliza para identificar puntos de datos específicos en una distribución.

Cuartilla

Un cuartil divide un conjunto de datos en cuatro partes iguales, y cada parte contiene el 25% de los datos. Los cuartiles se utilizan a menudo para evaluar la dispersión de los datos.

Suma de cuadrados

La suma de cuadrados es la suma de los cuadrados de las diferencias entre cada punto de datos y la media. Es un componente clave en el cálculo de la varianza y la desviación estándar.

Fórmula: Suma de cuadrados = Σ(x - Media)²

Lugar:

  • Σ representa el símbolo de suma
  • x es cada punto de datos
  • La media es la media (promedio) del conjunto de datos.
Desviación Estándar

La desviación estándar mide la cantidad de variación o dispersión en un conjunto de datos. Indica qué tan separados están los puntos de datos de la media.

Fórmula: Desviación estándar = √(Σ(x - Media)² / (n - 1))

Lugar:

  • √ representa la raíz cuadrada
  • Σ representa el símbolo de suma
  • x es cada punto de datos
  • La media es la media (promedio) del conjunto de datos.
  • n es el número total de valores en el conjunto de datos
Diferencia

La varianza es una medida de la extensión o dispersión de un conjunto de datos. Es el promedio de las diferencias al cuadrado entre cada punto de datos y la media.

Fórmula (varianza poblacional): Varianza (σ²) = Σ(x - Media)² / N

Lugar:

  • Σ representa el símbolo de suma
  • x es cada punto de datos
  • La media es la media (promedio) del conjunto de datos.
  • N es el número total de valores en la población.

Nota: Cuando trabaje con una muestra de datos, utilice la fórmula de varianza muestral, que divide por (N - 1) en lugar de N. Esta corrección tiene en cuenta el sesgo de la muestra.

Puntuación Z

La puntuación Z mide cuántas desviaciones estándar tiene un punto de datos de la media en una distribución normal estándar. Se utiliza para estandarizar datos y evaluar su posición en relación con la media.

Fórmula: Puntuación Z = (x - Media) / Desviación estándar

Lugar:

  • x es el punto de datos
  • La media es la media (promedio) del conjunto de datos.
  • La desviación estándar es la desviación estándar del conjunto de datos.
Rango intercuartil (IQR)

El rango intercuartil es el rango entre el primer cuartil (Q1 - percentil 25) y el tercer cuartil (Q3 - percentil 75) en un conjunto de datos. Proporciona una medida de la dispersión del 50% medio de los datos.

Fórmula: RIQ = Q3 - Q1

Lugar:

  • Q1 es el primer cuartil (percentil 25)
  • Q3 es el tercer cuartil (percentil 75)
Coeficiente de variación (CV)

El coeficiente de variación es una medida relativa de variabilidad y se expresa como porcentaje. Se utiliza para comparar la desviación estándar de los datos con su media, lo que lo hace útil para evaluar la variabilidad relativa entre conjuntos de datos con diferentes medias.

Fórmula: CV = (Desviación estándar / Media) * 100%

Oblicuidad

La asimetría mide la asimetría de la distribución de probabilidad de una variable aleatoria de valor real. Indica si los datos están sesgados hacia la derecha o hacia la izquierda.

Un sesgo positivo indica que la cola de la distribución está sesgada hacia la derecha (sesgada hacia la derecha), lo que significa que hay valores más extremos en el lado derecho de la distribución.

Un sesgo negativo indica que la cola de la distribución está sesgada hacia la izquierda (sesgada hacia la izquierda), lo que significa que hay valores más extremos en el lado izquierdo de la distribución.

Kurtosis

La curtosis mide la "cola" de la distribución de probabilidad de una variable aleatoria de valor real. Indica la presencia y el grado de valores atípicos en los datos.

Una curtosis positiva (leptocúrtica) indica colas pesadas y un pico, lo que significa que los datos tienen valores más extremos y tienen más picos que una distribución normal.

Una curtosis negativa (platicúrtica) indica colas claras y una distribución más plana, lo que significa que los datos tienen menos valores extremos y son más planos que una distribución normal.

Covarianza

La covarianza mide el grado en que dos variables cambian juntas. Indica si las variables tienen una relación lineal positiva o negativa.

Fórmula: Cov(X, Y) = Σ((X - Media(X)) * (Y - Media(Y))) / (n - 1)

Lugar:

  • Σ representa el símbolo de suma
  • X e Y son variables
  • La media (X) y la media (Y) son las medias de X e Y, respectivamente
  • n es el número total de observaciones

Si la covarianza es positiva, indica una relación positiva (X tiende a aumentar cuando Y aumenta).

Si la covarianza es negativa, indica una relación negativa (X tiende a disminuir cuando Y aumenta).

Coeficiente de correlación (r de Pearson)

El coeficiente de correlación mide la fuerza y ​​la dirección de la relación lineal entre dos variables. Es una versión normalizada de la covarianza que oscila entre -1 y 1.

Fórmula: r = Cov(X, Y) / (Desviación estándar(X) * Desviación estándar(Y))

Lugar:

  • Cov(X, Y) es la covarianza entre X e Y
  • La desviación estándar (X) y la desviación estándar (Y) son las desviaciones estándar de X e Y, respectivamente

Si |r| es cercano a 1, indica una fuerte relación lineal, donde r positiva indica una correlación positiva y r negativa indica una correlación negativa. Si |r| es cercano a 0, indica una relación lineal débil o nula.

punto 1
¿Una solicitud?

Me he esforzado mucho en escribir esta publicación de blog para brindarle valor. Será muy útil para mí, si considera compartirlo en las redes sociales o con sus amigos/familiares. COMPARTIR ES ♥️

Avatar de Nidhi

Nuestra EmpresaNidhi

¡Hola! Soy Nidhi.

Aquí en EHL, todo se trata de recetas deliciosas y fáciles para entretenimiento informal. Así que ven y únete a mí en la playa, relájate y disfruta de la comida.

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *