lunes, 15 de septiembre de 2008

REGRESION LINAL COMO PROMEDIO 10/09/08

Mediante el siguiente ejemplo iniciaremos el estudio de lo que es la regresion lineal

Se estudia el ingreso económico mensual de familias dependientes de obreros residentes. Dicho ingreso puede compararse contra la edad del padre de familia. De este modo, se estudian 2 variables que representan a su vez una variable bivariada susceptible. De escribirse como un par ordenado estadístico (x,y). En la tabla siguiente se muestran los datos correspondientes a una muestra aleatoria de 30 familias.









Por lo tanto:

y=0.0973x + 2.047

jueves, 11 de septiembre de 2008

PROBLEMAS DE UNIDAD 1 09-09-08

Problema 1 pagina 31
1. Suponga que el siguiente conjunto de datos es una muetsra aleatoria de 40 calificaciones de autoconcepto.

a) Determine Xmax, Xmin y el rango

Xmax= 117 Xmin= 63 Rango= Xmax-Xmin=117-63=54
b) ¿Cuantos intervalos sugeriria para mostrar la distribucion?
Puede ser 8 o 10
c) Determine el ancho del intervalo, w, para permitir 10 intervalos
w=rango/#intervalos=54/10=5.4 ~ 5
d) Si w=5, ¿Cual es el primer intervalo (valores mas bajos)?

60-64, ya que 60 es el multiplo de 5 mas cercano a 63
e) Si w=5, liste los intervalos

f) Construya una distribucion de frecuencias agrupadas para los 40 valores.
g) Construye columnas de porcentajes y porcentajes acumulados para esos datos.


h) ¿Seria un poligono de frecuencias una grafica apropiada para esos datos? ¿Por que?

Si, por que son datos medidos y por lo tanto variables continuas

i) Construya un poligono como el de la figura 2.4 con esos datos.

j) Construya una ojiva de esos datos

k)Estime P10, P50, Y P90 utilizando la ojiva.

P10=80; P50=100; P90= 110

l) Construya una gráfica horizontal de caja y patillas para esos datos. (Nota: las gráficas de caja pueden tener una orientación vertical u horizontal. Para la orientación horizontal, las patillas se extienden a la izquierda y a la derecha de la caja.)


m) Comente sobre la aparente asimetria o asimetria de esos datos

Parece que la distribución es asimétrica y sesgada a la izquierda.

n) ¿Cómo diferirá una ojiva de asimetría positiva de la de asimetría negativa?

La ovija de una distribución asimétrica positiva se elevaría muy rápido de la línea base en el lado izquierdo de la ojiva debido al conjunto de valores en las regiones más bajas. Por otro lado, la ojiva de una distribución asimétrica negativa no comenzará a elevarse rápidamente sino hasta que alcance los valores altos en el lado derecho de la figura.

o) ¿Puede suponer cómo podría aparecer la ojiva de una distribución rectangular?
Una línea recta inclinada hacia arriba desde el extremo inferior izquierdo hasta el extremo superior derecho.

Problema 2 pagina 31

2. El siguiente conjunto de datos es de una aleatoria de 50 casos de los datos del HSB. En este caso, los números representan la raza de los individuos, de donde 1=hispano, 2=asiático, 3=negro, 4=blanco.


4 1 4 4 1 1 4 4 4 2
4 4 2 4 4 4 3 4 4 4
1 4 4 4 1 4 4 3 4 4
4 3 1 4 4 4 1 3 4 4
4 3 3 4 4 3 3 4 4 4

a)¿Un polígono de frecuencias es apropiado para graficar esos datos? ¿Por qué?

No prorque son datos discretos o enumeraciones.

b) ¿Es apropiada una gráfica de barras para graficar esos datos? ¿Por qué?

Si, porque los datos no son continuos

c) Construya una distribución de frecuencias agrupada para esos datos.

d) Construya una columna de porcentajes para esos datos.


e) Construya un histograma de frecuencias para esos datos.

f) Etiquete el eje veretical de la figura en el inciso e para indicar frecuencia y porcentajes.
g) ¿Habría probablemente brechas entre las columnas del histograma? ¿Por qué?
Sí, ya que es congruente con los datos categóricos no clasificables.

Problemas de la pagina 50

Los ejercicios 1-10 están basados en los siguientes datos.En una grupo de sexto grado con 36 estudiantes, se administra una técnica sociométrica de "adivina quién" para evaluar el grado de relaciones positivas entre ellos para cada estudiante. Los valores para los 36 estudiantes fueron:

1. ¿Cuál es el rango?

Rango= Xmax-Xmin=52-0=52
2. Construya una distribución de frecuencias no agrupada.


3. Construya una distribución de frecuencias agrupada, con w=5

4. Construya un histograma de esos datos y comente sobre la forma de la distribución.

5. Construya una ojiva.




6. Estime Q1y Q2.
Q1=2 o 3, Q2=13.5
7. Calcule la media.
9.78
8. Determine la mediana.
5
9. Determine la moda.
1
10. Compare la distancia de Q1 y Q2 con la distancia de Q2 a Q3. El patrón sugiere asimetría:
Q3-Q2 es mayor que Q2-Q1. Positiva.

11. Para una década reciente, el incremento en el ingreso medio en el sur fue 74% para blancos y 113% para no blancos. ¿Cuál es el incremento medio para ambos grupos combinados si de cada 100 trabajadores 82 fueron blancos?
X mayor= X=(n1X1+n2X2)(n1+n2)=[82(74)+18(113)]/100=81%
12. Suponga que siete amigos viven junto a una autopista y quieren juntarse en la casa de uno de ellos para comer tacos y discutir las medidas de tendencia central y sus tipos favoritos de gráficas. Si sus casas a lo largo de la autopista están situadas de este a oeste en este orden: A, B, C, D, E, F, y G. ¿dónde deberían reunirse para minimizar la suma de las distancias recorridas? (Sugenerencia: ¿de cuál punto se minimiza la suma de las desviaciones?)
Md en el punto D. (La suma de las desviaciones absolutas es un mínimo alrededor de la mediana).
13. Suponga que una distribución tiene una media de 70, una mediana de 65 y una moda de 55. ¿En qué dirección está sesgada la distribución?
Está sesgada a la derecha, es decir, positivamente.
14. Si aplica una pruebla de CI a una clase en dos ocasiones separadas, como regla general, comente sobre las diferencias relativas entre las dos medias, las dos medianas y las dos modas.
Se espera que las medias difieran menos y que las modas difieran más.
Las preguntas 15-16 corresponden a los datos presentados en la tabla. 2.2
15. Mo =?
Mo= 50
16. Md= ?
Md= 51

domingo, 7 de septiembre de 2008

DISTRIBUCION DE FRECUENCIAS 04-09-08

Distribucion de Frecuencias.- Una lista de valores de datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos)correspondientes.

DEFINICIONES

Limites de clase inferior.- Son las cifras mas pequeñas que pueden pertenecer a las diferentes clases.

Limites de clase superior.- Son las cifras mas grandes que pueden pertenecer a las diferentes clases.

Fronteras de clase.- Son las cifras utilizadas para separar las clases, auque sin los espacios creados por los limites de clase. Se obtienen de la siguiente manera:

Se determina el tamaño del espacio entre el limite de clase superior de un clase y el limite de clase inferior de la siguiente. Se suma la mitad de esa cantidad a cada limite de clase superior, para obtener las fronteras de clase superor; se resta la mitad de esa cantidad de cada limite de clase inferior, para obtener las fronteras de clase inferiores.

Tabla.-Distribucion de Frecuencias de los niveles contaminantes de Nicotina-


Limites de Clase Inferior

0,100,200,300 y 400

Limites de clase Superior

99,199,299,399 y 499

Fronteras de clase

-0.5, 99.5, 199.5, 299.5, 399.5 y 499.5

Marca de Clase

49.5 , 149.5 ,249.5 ,349.5 y 449.5

Anchura de Clase

100 en todas

VISUALIZACION DE LOS DATOS

Histograma.- Entre los distintos tipos de graficas que se presentan, este es particularmente importante. Es una grafica de barras en donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias. Las alturas de las barras corresponden a frecuencias.

GRAFICA SELECCIONADA PORA MOSTRAR AL GRUPO

Pirámides de población.

Este gráfico se construye utilizando pirámides para construir la representación de los datos bajo cierta clase, la diferencia de información considerada entre cada clase será dada por el tamaño de la pirámide. En ocasiones la frecuencia de cada clase se coloca en el extremo superior de cada clase, sin embargo también, al igual que en las anteriores puede resultar útil colocar información, como el porcentaje de información en la punta de cada pirámide.









sábado, 6 de septiembre de 2008

CLASE DEL 02-09-08

TOMA DE DATOS
Los datos estadisticos generalmente son numericos. Con ello se realiza el estudio de situaciones variadas en los mas diversos campos de la ciencia y tecnologia.
Dicho estudio se refiere a situaciones en las cuales es indespensable obtener informacion confiable para tomar decisiones certeras; las cuales en gran mediada se producen gracias a que los datos se organizan en tablas o graficos.


FUENTES DE DATOS
--Fuentes de Datos Estadisticos


Experimentales.- Provienen de experimentos planteados y quizas controlados en algunas de las variables por un investigador.
Por Observacion.- No proceden de experimentos, sino de fuentes no controlables.


DATOS AGRUPADOS
Cuando se toman datos por experimentacion u observacion estos aparecen sin orden, por eso se llaman datos en bruto o crudos.
Estos datos se pueden agrupar, se pueden ordenar de mayor a menor (o menor a mayor). Esto ya nos permite saber cual es el dato mayor, menor y cuales de estos estan en el centro. Si son pocos datos, si se repiten los datos, es decir los mas frecuentes.


FRECUENCIA
Numero de veces que se repite un dato. Estos datos tambien se pueden agrupar en tablas de frecuencia y frecuencias relativas. La agrupacion de estas tablas se hace mediante la distribucion de los datos numericos en clases, segun sea su frecuencia.


Ejemplo: Los siguientes datos corresponden a las utilidades en pesos de una panificadora (conchita) durante cada uno de los ultimos 24 meses. Se dan tal cual como se recogieron, por eso aparecen en desorden. El dueño desea traspasar la panaderia y requiere conocer estos datos para tomar una decision.




1.¿Cual es la pregunta del dueño de la panificadora?
Si realmente le conviene traspasar la panificadora

2.¿Cual es la poblacion bajo estudio? .Describela
Los 24 meses, que corresponden a las ultimas utilidades

3.¿Cual es la variable correspondiente?
Meses contra pesos de utilidades


4.Ordena los datos anteriores en una tabla de menor a mayor.

5.¿Caul es el mayor dato y cual es el menor?

El menor es 7814.889 y el mayor 21169.320

6.¿Cual es la diferencia entre el dato mayor y el menor?

13354.431

7. ¿ Cuales son los dos valores en el centro de los datos?

16505.530 y 16573.730






CLASE DE ESTADISTICA DEL 01-09-08

Del siguiente conjunto de datos obtener las definiciones de moda , mediana y media aritmetica, asi como el promedio por columna y obtener el promedio total de la siguiente tabla.



La mediana es : 427.700

La moda es: 324.000

La media aritmetica total es: 494.580