Estadistica descriptiva


INTRODUCCIÓN A LA ESTADÍSTICA



Introducción
Un ingeniero es alguien que resuelve problemas de interés para la  sociedad mediante la aplicación eficiente de principios científicos.   Los ingenieros llevan a cabo esta tarea perfeccionando un producto o un proceso existente o bien diseñando un producto o proceso nuevo que satisfaga las necesidades de los consumidores.
El método de la ingeniería o científico es el enfoque aplicado para formular y resolver problemas.
Los pasos del método de la ingeniería son:

  1. Desarrollar una descripción clara y concisa del problema
  2. Identificar al menos de manera tentativa, los factores importantes que afecten el problema o que pueden jugar un papel en su solución
  3. Proponer un modelo para el problema, utilizando los conocimientos científicos o de la ingeniería del fenómeno bajo estudio.    Considerar todas las limitaciones y/o supuestos del modelo
  4. Realizar experimentos apropiados y recolectar datos para probar o validar el modelo tentativo o las conclusiones planteadas en los pasos 2 y 3.
  5. Refinar el modelo con base en los datos observados
  6. Manipular el modelo para contribuir a desarrollar una solución del problema.
  7.  Realizar un experimento apropiado para confirmar que la solución propuesta del problema es efectiva ala vez que eficiente.
  8. Sacar conclusiones o hacer recomendaciones con base en la solución del problema.
EL campo de la estadística trata de la recolección, presentación, análisis y uso de datos para tomar decisiones, solucionar problemas y diseñar productos y procesos.


Terminología usada en la estadística

1.1   Procedimientos de muestreo

1.2   Medidas de localización:  Media y mediana
Al tener una colección de datos del tipo numérico no agrupados (sean una población ó bien de una muestra), resulta muy útil conocer algunas medidas para resumir la información o que las representen de alguna manera, existen las llamadas medidas de tendencia central y de dispersión.
Estudiaremos aquellas que centralizan o resumen un 
conjunto de valores a uno o unos cuantos, por eso el nombre de tendencia central. Las principales medidas de este tipo son la media o promedio aritmético, la mediana y la moda. De las tres, la que más usaremos en este curso, será la media aritmética, ya que es una con mayores aplicaciones y mejores cualidades para centralizar la información.

Media aritmética
Cuando tenemos una población de tamaño N a saber;  $X_1,  X_2,  X_3, ...,  X_N$, se define la media aritmética poblacional como:
$$\boxed{\ \ \mu = \frac{X_1 +  X_2 +  X_3 + ... +  X_N}{N}  =  \frac{1}{N}\sum_{i\ =\ 1}^N X_i = \frac{\sum_{i\ =\ 1}^N X_i}{N} \ \ }$$

Si se tiene una muestra de tamaño n a saber:  $x_1,  x_2,  x_3, ..., x_n $, se define la Media Aritmética muestral como:
$$\boxed{\ \ \overline x = \frac{x_1 +  x_2 +  x_3 + ... +  x_n}{n}  =  \frac{1}{n}\sum_{i\ =\ 1}^n x_i = \frac{\sum_{i\ =\ 1}^n x_i}{n} \ \ }$$

La media muestral es simple y de uso común. Representa el promedio aritmético de los datos,  sin embargo, es sensible a errores en los datos. Un dato erróneo puede cambiar significativamente el valor de la media muestral. 
Para evitar este problema, se puede ignorar un pequeño porcentaje de los datos más grandes y más pequeños de la muestra antes de calcular la media muestral

En lo futuro hablaremos de la media muestral y solo cuando se requiera hablaremos de la media poblacional.
Ejemplo 1: Si suponemos que los siguientes 10 datos representan a una población de tamaño N =10:   10 000, 11 000, 11 000, 12 000, 12 000, 12 000, 13 000, 14 000, 14 000 y 15 000.

La media poblacional será:
$$\mu  =  \frac{10000 + 11000 + 11000 + 12000 + 12000 + 12000 + 13000 + 14000 + 14000 + 15000}{10}$$$$\boxed{\ \ \mu  =  \frac{124,000}{10}  =  12, 400\ \ }$$

Ejemplo 2: Los pesos de 8 jóvenes con edad de 25 años representan una muestra y son 70, 78, 75, 78, 75, 80, 68 y 90.
La media muestral será:
$$\overline x  =  \frac{70 + 78 + 75 + 78 + 75 + 80 + 68 + 90}{8}$$$$\boxed{\ \ \overline x  =  \frac{614}{8} =  76.75 \ \ }$$

Ejemplo 3: Una muestra aleatoria arroja los siguientes datos que representan los diámetros de 15 tubos de cobre (en centímetros): 1.9, 1.8, 1.9, 2.1, 2.0, 2.1, 1.8, 1,9, 1.8, 2.1, 2.0, 1.7, 1.9, 2.0 y 2.1.
La media muestral será:
$$\overline x  =  \frac{1.9 + 1.8 + 1.9 + 2.1 + 2.0 + 2.1 + 1.8 + 1,9 + 1.8 + 2.1 + 2.0 + 1.7 + 1.9 + 2.0 + 2.1}{15}$$$$=  \frac{29.1}{15}$$$$\boxed{\ \ \overline x  \approx  1.94 \ \ }$$


La Mediana de un grupo de datos se define como aquel dato que se encuentra a la mitad de ellos, cuando ya están ordenados de forma creciente.
Dependiendo del número de valores que se tengan, en forma simbólica, para una muestra de tamaño n , a saber,  $x_1,  x_2,  x_3, ..., x_n $ se define la Mediana muestral como:

$$\boxed{\ \ \ Med=\begin{cases} x_{(x\ +\ 1)/2}, & \mbox{si $n$ es impar,}\\   &  \\ \frac{x_{n/2}\  +\  x_{(n/2)\ + \ 1 } }{2}, & \mbox{si $n$ es par} \end{cases} \ \ \ }$$

Ejemplo  4: Para el caso de los diámetros de los 15 tubos de cobre los datos ordenados son: 1.7, 1.8, 1.8, 1.8, 1.9, 1.9, 1.9, 1.9, 2.0, 2.0, 2.0, 2.1, 2.1, 2.1 y 2.1.

Ya que el numero de datos es impar, 15,  La mediana se calcula con
$$Med = x_{(15 + 1)/2}  =  x_8$$
Y viendo los datos ya ordenados, este valor corresponde a:
$$\boxed{\ \ \ Med = x_8 = 1.9 \ \ \ }$$


Ejemplo  5: si consideramos los pesos de los 8 jóvenes, tendremos que al ordenarlos quedan así: 68, 70, 75, 75, 78, 78, 80 y 90.
Aquí como el número de datos es impar (8), entonces hay que hallar el promedio de los dos datos que se localizan a la mitad, es decir,
$$Med  =  \frac{x_{8/2}  +  x_{(8/2)\ +\ 1}}{2}  =  \frac{x_4\ +\ x_5}{2}  =  \frac{75\ +\ 78}{2}$$$$\boxed{\ \ \ Med = 76.5\ \ \ }$$

La Moda es aquel dato que tiene la mayor frecuencia, es decir, que se repite el mayor número de veces.
Si consideramos los tres ejemplos que ilustraron la media aritmética, se tiene que en el primer ejemplo, la moda es 12 000, ya que su frecuencia es 3 y es la mayor, sin embargo en el segundo ejemplo, hay dos datos con la mayor frecuencia, a saber, 1.9 y 2.1 cuya frecuencia es 4, cuando esto ocurre le llamamos a la muestra bimodal, algo similar ocurre con el tercer ejemplo, ya que la Moda serán el 75 y 78 por tener la mayor frecuencia (2).
La moda es una medida poco usada en la estadística, más bien tiene un valor utilitario en el campo mercantil y comercial, porque permite conocer las preferencias de un producto o las ventas por un artículo determinado.




1.3   Medidas de variabilidad
Los métodos estadísticos se utilizan como ayuda para describir y entender la variabilidad.
Por variabilidad se entiende que observaciones sucesivas de un sistema o fenómeno no producen exactamente el mismo resultado.

Todos nos encontramos con la variabilidad en nuestras vidas cotidianas y el pensamiento estadístico puede ofrecernos un recurso conveniente para incorporar esta variabilidad en nuestros procesos de toma de decisiones.
Por ejemplo, consideremos el rendimiento del tanque de gasolina de un  automóvil.  ¿Se recorre siempre el mismo kilometraje con cada tanque de combustible?  Desde luego que no!!!, de hecho, en ocasiones el kilometraje recorrido varía considerablemente.   Esta variabilidad observada en el rendimiento por tanque de muchos factores como: condiciones de manejo que que ocurren  (en ciudad o carretera);  los cambios en el estado del vehículo con el tiempo , que podrían incluir factores como la presión de las llantas, la compresión de el motor o el desgaste de las válvulas;  el tipo y octanaje de la gasolina usada y posiblemente hasta las condiciones meteorológicas.
Estos factores  representan fuentes de variabilidad potenciales en el sistema.  La estadística proporciona un marco para describir esta variabilidad y para saber cuales de las fuentes de variabilidad son más importantes o cuales tienen el mayor impacto sobre el rendimiento por tanque de gasolina.


1.4   Datos discretos y continuos





No hay comentarios. :

Publicar un comentario