miércoles, 6 de diciembre de 2017

Distribución de Probabilidades continuas y discretas



Las distribuciones de probabilidad son distribuciones de probabilidad continuas o distribuciones de probabilidad discretas, dependiendo de si definen probabilidades para variables continuas o discretas.

¿Qué es una distribución continua?


Una distribución continua describe las probabilidades de los posibles valores de una variable aleatoria continua. Una variable aleatoria continua es una variable aleatoria con un conjunto de valores posibles (conocido como el rango) que es infinito y no se puede contar.
Las probabilidades de las variables aleatorias continuas (X) se definen como el área por debajo de la curva de su PDF. Por lo tanto, solo los rangos de valores pueden tener una probabilidad diferente de cero. La probabilidad de que una variable aleatoria continua equivalga a algún valor siempre es cero.

Ejemplo de la distribución de pesos

La distribución normal continua puede describir la distribución del peso de hombres adultos. Por ejemplo, usted puede calcular la probabilidad de que un hombre pese entre 160 y 170 libras.
Gráfica de distribución del peso de hombres adultos
El área sombreada debajo de la curva en este ejemplo representa el rango de 160 a 170 libras. El área de este rango es 0.136; por lo tanto, la probabilidad de que un hombre seleccionado aleatoriamente pese entre 160 y 170 libras es de 13.6%. Toda el área por debajo de la curva equivale a 1.0.
Sin embargo, la probabilidad de que X sea exactamente igual a algún valor siempre es cero, porque el área por debajo de la curva en un punto individual, que no tiene anchura, es cero. Por ejemplo, la probabilidad de que un hombre pese exactamente 190 libras es cero. Podría calcular una probabilidad diferente de cero de que un hombre pese más de 190 libras, menos de 190 libras o entre 189.9 y 190.1 libras, pero la probabilidad de que pese exactamente 190 libras es cero.

¿Qué es una distribución discreta?

Una distribución discreta describe la probabilidad de ocurrencia de cada valor de una variable aleatoria discreta. Una variable aleatoria discreta es una variable aleatoria que tiene valores contables, tales como una lista de enteros no negativos.
Con una distribución de probabilidad discreta, cada valor posible de la variable aleatoria discreta puede estar asociado con una probabilidad distinta de cero. Por lo tanto, una distribución de probabilidad discreta suele representarse en forma tabular.

Ejemplo del número de quejas de clientes

Con una distribución discreta, a diferencia de una distribución continua, usted puede calcular la probabilidad de que X sea exactamente igual a algún valor. Por ejemplo, puede utilizar la distribución discreta de Poisson para describir el número de quejas de clientes en un día. Supongamos que el número promedio de quejas por día es 10 y usted desea saber la probabilidad de recibir 5, 10 y 15 quejas de clientes en un día.
x       P (X = x)
5     0.037833
10   0.12511
15   0.034718
Usted también puede visualizar una distribución discreta en una gráfica de distribución para ver las probabilidades entre los rangos.




Gráfica de distribución del número de quejas de clientes

Las barras sombreadas en este ejemplo representan el número de ocurrencias cuando las quejas diarias de los clientes son 15 o más. La altura de las barras suma 0.08346; por lo tanto, la probabilidad de que el número de llamadas por día sea 15 o más es 8.35%.

Medidas de dispersión

Parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Rango
Indica la dispersión entre los valores extremos de una variable. Se calcula como la diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)

Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Resultado de imagen para ejemplo de rango estadistica

Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la media.
DesvMedia.jpg
Donde:
xi:valores de la variable.

n: número total de datos
Resultado de imagen para ejemplo de desviacion media en estadistica
Desviación estándar
La desviación estándar mide el grado de disersión de los datos con respecto a la media, se denota como s para una muestra o como σ para la población. Se define como la raiz cuadrada de la varianza según la expresión:
Error al crear miniatura: Falta archivo
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide entre n; también existe la formula de desviación típica donde el denominador es n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe menor dispersión, el incremento de los valores de la desviación estándar indica ina mayor variabilidad de los datos.

Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto a la media.
Imagen relacionadaResultado de imagen para ejemplo de varianzar

Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se denota como CV. El coeficiente de variación permite decidir con mayor claridad sobre la dispersión de los datos.
También puede ser expresado en por ciento.

Resultado de imagen para ejemplo de coeficiente de variacion

Medidas de Tendencia Central




Cuando se tiene una lista de datos numéricos a veces se necesita extraer uno que sea representativo de todos, es decir, que ofrezca una cierta idea del valor más típico, ya sea porque es el que más se repite o porque tenga la misma cantidad de datos antes o después de él o porque es el valor alrededor del cual están los demás. Este tipo de datos que se ubican hacia el lugar central de la lista y que indican medidas representativas se llama medidas de tendencia central o de posición.
Los valores que asumen estas medidas están incluidos entre el menor y el mayor de los datos lo que no significa que ocuparán exacta y necesariamente su centro, ni que los valores que tomen tengan que coincidir con alguno de los que han sido recolectados. Entre estas medidas se tienen la moda, la mediana, la media (aritmética, geométrica, armónica) y los percentiles, entre otras.

 La moda

En una muestra de tamaño N, la moda, si existe, es el dato o los datos, que tienen mayor frecuencia absoluta. 
Para denotar la moda de una variable X, se usará la notación Mo.

Resultado de imagen para ejemplo de moda
La mediana

La mediana de una muestra de tamaño N, cuyos datos han sido ordenados ascendente o descendentemente, es el valor (único) que ocupa el propio centro de dichos datos.
  
Resultado de imagen para ejemplo de mediana

Media aritmética
La media aritmética es el valor alrededor del cual se encuentran los datos de una lista.

Resultado de imagen para ejemplo de mediana
 Media geométrica
La media geométrica de una muestra de tamaño N es la raíz n - ésima del producto de los N datos de esa muestra. Se denota esta medida por G

Resultado de imagen para ejemplo de media geometrica

Media armónica

La media armónica de una muestra de tamaño N es el cociente que se establece entre el tamaño de la muestra y la suma de los recíprocos de los datos de esa muestra.

En resumen, para calcular la media armónica de una muestra de tamaño N, se procede del siguiente modo:
  • Calcular el recíproco de cada dato de la muestra.
  • Calcular la suma de esos nuevos datos.
  • Dividir el valor de N por la suma anterior.


La importancia de las medidas estudiadas está en dependencia del tipo de datos, de su distribución y del objetivo que se tiene en la realización del estudio. A pesar de ser considerada la media como la medida más importante en la mayoría de los estudios de fenómenos o hechos, el conocimiento de las tres proporciona una mejor descripción de estos.