Estadística básica GSS-HEBA-1801-B1-002 Actividad 1. Clasificación de datos agrupados y no agrupados en tablas de frecuencia


Gerencia de servicios de salud

Primer Semestre

GSS-HEBA-1801-B1-002

Unidad 2 Representación numerica y gráfica de datos

Actividad 1. Clasificación de datos agrupados y no agrupados en tablas de frecuencias

Profesor Jose María Martínez Rivera

Alumno Ismael Luna Abrajan

Matricula XXXXXXXXXX

13/02/2018







Datos agrupados

Definición de términos

Clase, son los grupos que contienen una gran cantidad de elementos

Intervalo de clase, es el rango utilizado para dividir el conjunto de valores numéricos con grandes cantidades de datos

Frecuencia, número de veces que aparece un valor

Frecuencia acumulada, es la suma de frecuencias absolutas de todos los valores iguales o inferiores al valor considerado

Frecuencia relativa, es el resultado de dividir la frecuencia absoluta de un determinado valor entre el número total de datos

Distribución de porcentajes, número de veces que aparece cada valor de la variable

Distribución de porcentajes acumulados, cada uno de los valores de la variable ordenados de menor a mayor

Marcas de clases, es el punto medio de cada intervalo para el cálculo de algunos parámetros, como la media aritmética

Introducción

En esta actividad desarrollare un ejercicio de datos agrupados, los datos que utilizare son referentes al tema de tabaquismo, el cual vengo utilizando desde el inicio de la materia. En este caso utilizare una tabla que indica la prevalencia de fumadores adultos durante el año 2006

Tabla Porcentaje de prevalencia de fumadores adultos 2006
Cigarrillos fumados a diario
Cantidad de fumadores
% de todos los fumadores
Cigarrillos promedio por día
Menos de 1
3.050,046
26.9%
0.2
Entre 1 y 5
4,816,444
42.4%
2.8
Entre 6 y 10
1,953,524
17.2%
8.3
Entre 11 y 20
1,330,947
11.7%
17.7
Más de 20
199.930
1.8%
37.3

Desarrollo


En esta tabla muestro los resultados obtenidos, que son parte del calculo que realice respecto a los diferentes términos que se solicitan en la actividad

Clase, es la cantidad de datos que dispongo para trabajar.

Intervalo de clase, es el rango en el que se encuentran mis datos.

La frecuencia, es la cantidad de personas que participaron.

La frecuencia acumulada, es la suma de cada clase, lo que nos da el total de participantes.

La frecuencia relativa, es la división entre la frecuencia absoluta y la relativa.

La distribución de porcentajes se obtiene al multiplicar la frecuencia relativa por cien.

La distribución de porcentajes acumulados es la suma de la distribución de porcentajes de cada clase.

Finalmente, la marca de clase la obtuve al realizar la suma del número mínimo y máximo del intervalo de clase el cual se divide entre dos.

Clase
Intervalo de clase
Frecuencia
Frecuencia acumulada
Frecuencia relativa
Distribución de porcentajes
Distribución de porcentajes acumulados
Marca de clase
1
1
3,050,046
3,050,046
0.32
32%
32%
0.5
2
1-5
4,816,444
7,866,490
0.42
42%
74%
3
3
6-10
1,953,524
9,820,014
0.17
17%
91%
8
4
11-20
1,330,947
11,150,961
0.11
11%
102%
15.5
5
20
199,930
11,350,891
0.01
1%
103%
10


11,350,891






A continuación, represento de forma gráfica, por medio de barras y forma circular la relación entre clase y frecuencia.



Datos no agrupados

En este ejercicio, utilice los datos obtenidos “de respuesta de hogar por estado”, de acuerdo con la encuesta nacional del 2017. Quedando los datos de la siguiente manera

Estos datos los ordene de forma ascendente, quedando de la siguiente manera

Entidad
Completas
Veracruz de Ignacio de la Llave
1869
Guerrero
1847
Tlaxcala
1829
Hidalgo
1828
Michoacán de Ocampo
1821
Baja California
1807
Tabasco
1800
Sonora
1797
Nayarit
1777
San Luis Potosí
1776
Sinaloa
1775
Baja California Sur
1768
Morelos
1762
Ciudad de México
1760
Guanajuato
1758
Durango
1747
Chihuahua
1741
Quintana Roo
1733
Zacatecas
1733
Yucatán
1732
Querétaro
1731
Jalisco
1724
Puebla
1718
Campeche
1717
Chiapas
1712
Aguascalientes
1707
Oaxaca
1705
Colima
1679
México
1661
Coahuila de Zaragoza
1652
Tamaulipas
1643
Nuevo León
1598



Técnica de tallo y hoja

En esta parte de la actividad, al manejar cantidades de 4 dígitos, considere usar 3 para que fueran el tallo, quedando de la siguiente forma mi tabla

Tallo
Hoja
159
8
164
3
165
2
166
1
167
9
170
5,7
171
1,7,8
172
4
173
1,2,3,3
174
1,7
175
8
176
0,2,8
177
5,6,7
179
7
180
0,7
182
1,8,9
184
7
186
9


Polígono de frecuencia

Para obtener estos resultados, primero cree un intervalo de frecuencia, de acuerdo con la tabla donde tenía mis datos, como resultado obtuve tres intervalos.
La marca de clase la obtuve como la media de cada intervalo, para completar la segunda y tercera solo le fui sumando 10, ya que esa es la cantidad que existe en cada intervalo.
La frecuencia la obtuve de la suma de cada valor que existía entre los intervalos, quedando la tabla de la siguiente manera.

Intervalo
Marca de clase
Frecuencia
159-169
163
8233
170-179
173
34873
180-189
183
12801

Con los resultados obtenidos, realice mi gráfica de polígono de frecuencia y de acuerdo con el resultado considero que es una frecuencia simétrica, en este gráfico se representa la frecuencia y la marca de clase.


Conclusiones

En esta actividad he conocido nuevos términos que se utilizan en la estadística. Utilice herramientas, como las tablas, en las cuales ordene datos que utilice con otra herramienta, los gráficos. Con ambas pude reflejar de una forma más visual la información obtenida. Utilicé la investigación y consulta en fuentes primarias para utilizar información verídica relacionada al tema que elegí, además de buscar la forma en como realizar la técnica de tallo y hoja.
Esta actividad ha significado retomar parte de las actividades anteriores para obtener nuevos conocimientos.





















Bibliografía

Ditutor. (s.f.). Ditutor. Recuperado el 13 de febrero de 2018, de https://www.ditutor.com/estadistica/marca_clase.html
Sangaku. (s.f.). Sangaku Maths. Recuperado el 13 de febrero de 2018, de https://www.sangakoo.com/es/temas/frecuencia-absoluta-relativa-acumulada-y-tablas-estadisticas
Ub.edu. (s.f.). Recuperado el 13 de febrero de 2018, de http://www.ub.edu/aplica_infor/spss/cap2-1.htm
UNADM. (2018). Respresentación numérica y gráfica de datos. Recuperado el 13 de febrero de 2018, de www.unadmexico.blackboard.com
Villalobos , A., & Rojas, R. (enero de 2007). Scielo. Recuperado el 13 de febrero de 2018, de www.scielo.org.mx: http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0036-36342007000800005

Waters, H., Sáenz de Miera, B., Ross, H., & Reynales Shigematsu, L. M. (2010). La economía del tabaco y los impuestos al tabaco en México. Recuperado el 13 de febrero de 2018, de http://www.who.int/fctc/reporting/party_reports/mexico_annex2_economy_of_tobacco_and_taxes_in_mexico.pdf


Ya no sé si es estadística o taller de lectura y redacción...

Calificaciones Quinto Semestre Bloque 2

Hasta apenas he tenido tiempo de revisar mi cardex y veo que no me fue tan mal, es irónico que en plena pandemia no tenga tiempo para muc...