Cualquier investigación que se emprenda puede conducir a la acumulación de valores cuantitativos y cualitativos correspondientes a las diversas medidas efectuadas. Esta posibilidad, convierte a la estadística en una herramienta vital para el tratamiento de volúmenes de datos mediante tablas resúmenes conocidas como "Tablas de Frecuencia". Cuando los datos son agrupados, la interpretación resulta ser más sencilla.
Tablas de Frecuencia: Tablas estadísticas que agrupan diversos valores de una variable, simplificando los datos. Podemos identificar dos tipos de tablas de frecuencias, las cuales denotaremos como tablas tipo A y B.
Construcción y características de las tablas tipo A o de datos no agrupados
Se caracterizan por manejar un conjunto pequeño de posibles resultados de una variable dentro de la muestra o población. Por lo general, su uso tiende al manejo de variables cualitativas o variables cuantitativas discretas con rango menor a 10
Una empresa decide medir el grado de aceptación de 10 clientes sobre un nuevo producto que hace poco salió al mercado. Para tal fin, se les pide que valoren, empleando una escala del 1 al 5, su opinión frente al producto. (1 = Muy Malo, 2 = Malo, 3 = Regular, 4 = Bueno y 5 = Excelente). Las respuestas tabuladas de los 10 clientes son:
En presencia de estos puntajes, la persona encargada del proyecto pide que se simplifiquen y luego se interpreten los datos.
Como podemos observar, el número de resultados que puede alcanzar la variable grado de aceptación son relativamente pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una Tabla Tipo A. Otra forma de catalogar los datos es conociendo la distancia o variación que hay entre el valor menor ( Xmin) y el valor mayor (Xmax ), diferencia que de ahora en adelante la conoceremos como “Rango”.
Rango (R): Diferencia existente entre el valor Máximo (Xmax ) y el valor Mínimo ( Xmin) de un conjunto de datos. La fórmula es: R= (Xmax ) - ( Xmin)
En nuestro ejemplo el Rango (R) sería igual a 3
Si el rango manejado es menor a 10, bastará representar los datos con una tabla Tipo A. Para crear esta tabla deberemos seguir los siguientes pasos:
PASO 1: Contar las veces que se repite cada valor dentro de la muestra La forma de simplificar los datos anteriores equivale a contar cuantas veces se repiten las variables estudiadas. A esta operación la conoceremos como “frecuencia Absoluta”.
Frecuencia Absoluta (fi): Número de veces que se repite un valor dentro de un conjunto de datos.
El Ni representa el número de posibles resultados tabulados en la tabla
PASO 2: Ubicar estas frecuencias en una tabla ordenada
Ninguno de los clientes valoró al producto como muy malo (grado de aceptación igual a 1), mientras que la mayoría de las respuestas se centraron en valorar al producto como Excelente y Bueno (grado de aceptación iguales a 5 y 4 respectivamente). Observando los datos resumidos, podemos concluir que la mayoría de las personas encuestadas tienen una visión favorable del nuevo producto. Queda claro, como la tabla de frecuencia agiliza el análisis de los datos. Observen que la sumatoria de las frecuencias absolutas es igual al número de personas encuestadas (10), por lo cual podemos llegar a la siguiente conclusión:
La estadística considera otros tipos de frecuencias auxiliares que complementan el análisis de las tablas de frecuencia.
Frecuencia Absoluta Acumulada (Fi): Presenta un saldo acumulado de las frecuencias de los intervalos. Esta frecuencia se calcula sumando el acumulado de las frecuencias de los intervalos anteriores más la frecuencia absoluta del intervalo actual.
Frecuencia Relativa (hi): Equivale a la razón de las frecuencias de cada intervalo sobre la totalidad de los datos (o, dependiendo del caso). Matemáticamente se expresa:
Frecuencia Relativa Acumulada (Hi): Presenta un saldo acumulado de las frecuencias relativas de cada intervalo de clase. Su cálculo resulta de la suma del acumulado de las frecuencias relativas de los intervalos anteriores más la frecuencia relativa del intervalo actual.
Interpretemos los valores que acabamos de obtener:
La Frecuencia absoluta (fi) ya la interpretamos anteriormente.
Frecuencia absoluta acumulada (Fi): Se puede observar que esta frecuencia en el último intervalo es igual al tamaño de la muestra (o población). Esta frecuencia no proporciona de inmediato el número de casos que queda por debajo de cada clase. La F4, por ejemplo, nos dice que seis personas opinaron que el producto se encontraba entre muy malo y bueno.
Frecuencia relativa (hi%): La sumatoria de las frecuencias relativas porcentuales debe ser igual al 100%.
Como una de las interpretaciones de esta frecuencia podemos decir que el 40% de las personas encuestadas (h5) opinaron que el producto es excelente.
Frecuencia relativa acumulada (Hi): Al igual que la frecuencia Fi, esta frecuencia nos proporciona el índice de las variables que quedan por debajo de cada clase. La H3, por ejemplo, nos dice que el 30% de los encuestados opinaron que el producto no era bueno. Hay que tener en cuenta que la última de las Frecuencias Relativas Acumuladas equivale al 100%.
Características de las tablas Tipo A
El número de posibles valores que toma la variable debe ser reducido. (Rango menor a 10).
Suele ser utilizada en la cuantificación de las variables cualitativas.
Maneja variables cuantitativas cuyos valores son preferiblemente discretos.
Su construcción es sencilla.
La interpretación equivale a especificar la frecuencia de cada resultado o de los que resalten.
Construcción y características de las tablas tipo B o de datos agrupados
Este tipo de tablas, llamados también tabla para datos agrupados, suelen ser utilizadas cuando el número de resultados posibles que puede obtener una variable son tan amplios, como variables cuantitativas continuas o variables con un rango mayor a 10 Debido a esta cantidad de valores, será necesario agruparlos mediante intervalos.
Agrupar los valores de la variable en intervalos podría simplificar estas fuentes de datos. Por ejemplo, podríamos hablar de las frecuencias para los valores comprendidos entre 0-20, 20-40, 40-60, 60-80 y 80-100. En el intervalo 0-20 (que de ahora en adelante le llamaremos intervalo de clase), se sumarán las frecuencias de los datos cuyos resultados estén entre 0 y 20.
Intervalo de clase: Son cada uno de los grupos de datos empleados en las Tablas de Frecuencias Estadísticas, capaz de contener diversas medidas de una variable cuantitativa discreta o continua. Consta de un límite inferior (Li) y un límite superior (Ls).
Otro punto importante que en estos casos se debe definir, es la cantidad de intervalos de clase que se empleará en la tabla de frecuencia. Esta cantidad de intervalos no deberían ser muchos, debido a que no se cumpliría el objetivo de resumir la información, y no tan pocos intervalos, ya que se perdería mucha información.
No existe una fórmula, ni unos principios únicos para establecer el número de intervalos. En este cursado, optaremos por manejar un número de intervalos convenientes entre 5 y 10.
Algunos autores han propuestos fórmulas que permiten ayudar en la tarea de conseguir el número ideal de intervalos. La más conocida, establece el número de intervalos al obtener la raíz cuadrada del total de elementos considerados en el estudio:
Cada intervalo posee un número máximo de resultados que puede agrupar. A este valor lo conoceremos como el “Ancho del Intervalo de Clase (A)”.
Ancho del intervalo de Clase (A): Su cálculo resulta de la división del Rango ® entre el Número de Intervalos (Ni)
Equivale a la diferencia entre el Límite superior (Ls) y el Límite inferior (Lm) de cada intervalo. Matemáticamente se expresa: A= Ls – Lm
Hay que aclarar, que el ancho puede variar entre los intervalos, pero por razones estéticas, comprensión y para facilitar el análisis, se recomienda manejar un ancho equivalente en todos los intervalos de clase.
Ejemplo tabla de frecuencia tipo B
Un sondeo realizado en el barrio de la ciudad de Resistencia sobre 30 mujeres con hijos pretende hacer un estudio de las edades de las mismas cuando fueron madres por primera vez, y hallar la edad más representativa. Las edades de las mujeres fueron:
Cuando recolectamos los datos por primera vez, estos se presentarán en forma confusa, lo que amerita ser ordenada. Para ordenar los datos hay varios métodos, el que vamos a utilizar nosotros se llama Diagrama de Tallo y Hojas, el mismo consiste en formar una columna con el primer o los primeros dígitos (contando de izquierda a derecha) y luego filas con los dígitos restantes pertenecientes a los valores de los dígitos de las columnas. Para el ejemplo anterior el diagrama se construye de la siguiente forma:
Es importante el conteo de datos por fila para cerciorase de que no nos faltan datos. La suma de esto debe darnos el total de la muestra o población. Y luego ordenamos de menor a mayor los valores de las hojas (filas). Si lo valores se repiten más de dos veces lo escribimos una vez e indicamos entre paréntesis la cantidad que representa ese valor.
A continuación, se detallan los siguientes pasos para la construcción de la tabla de frecuencia tipo B. Paso 1: Siempre debemos calcular el rango ® como primera medida. Este nos indica si nuestra tabla será de tipo A o B
R= Xmax – Xmin -> R = 31 – 17 = 14
Paso 2: Determinar el número de intervalos (Ni)
Se debe siempre aproximar el número de intervalos al entero superior más próximo, recordando que este valor no será menor a 5, ni un valor mayor a 10. Nuestra tabla estará constituida entonces por 6 (seis) intervalos.
Paso 3: Determinar el ancho de cada intervalo.
Con el Rango y el número de intervalos, podremos hallar el ancho:
Aproximamos al entero superior A = 3 El ajuste del Ancho no podrá ser menor al valor obtenido inicialmente.
Paso 4: Determinar el nuevo Rango (R´)
En el momento de realizar el ajuste del ancho del intervalo, el rango se incrementa automáticamente. Este “Nuevo Rango” lo denotaremos como R´ El rango para datos agrupados es R= Ls – Li, para determinar el límite inferior del primer intervalo y el límite superior del último intervalo debemos utilizar un nuevo rango.
Nuevo Rango (R’): Rango que es convenido por el Ancho de los intervalos a los decimales que son manejados en los datos objeto del estudio. Su cálculo se realiza multiplicando el Ancho ajustado por el Número de Intervalos:
El rango se incrementó en cuatro años. El incremento entre el nuevo rango (R’) y el rango inicial ®, se reparte entre el valor mínimo y el valor máximo. Es decir, al valor mínimo le quitamos y al valor máximo le agregamos.
Este procedimiento permite encontrar los valores mínimos y máximos cuya resta sea igual al nuevo Rango (R’) Si el resultado de la diferencia entre el nuevo rango y el rango:
Si es 0 está bien el rango porque incluye a todos los datos
Si es mayor que cero, se debe utilizar el rango nuevo porque hay datos que no se contemplan. Como en el ejemplo anterior
Paso 5: Determinar los intervalos de clases iniciales.
Con el ajuste de los valores mínimos y máximos, y el ancho, podremos armar cada intervalo de clase. El primer intervalo parte del valor mínimo (Xmin´), al cual le agregamos el ancho (A). El segundo intervalo parte del límite superior del intervalo anterior y se le agrega el ancho, y así sucesivamente hasta alcanzar el valor máximo (Xmax´)
Presenta algunos inconvenientes al momento de repartir las frecuencias a cada intervalo de clase, por ejemplo, existen 6 personas del total de encuestadas que tienen una edad de 21 años, los cuales podrían ser clasificados en el intervalo dos o en el tres. Este caso se le conoce como el “Problema de la Ambigüedad”, y el cual debe ser solucionado antes de terminar la tabla de frecuencia tipo B. Vamos a utilizar nosotros estará referido a los limites abiertos y cerrados. Los limites abiertos se identifican con paréntesis ( ) y significa que el valor que se encuentre anexo al paréntesis no pertenece al intervalo. Los limites cerrados se identifican con corchetes [ ] y significa que el valor que se encuentre anexo al corchete pertenece al intervalo. Según nuestro ejemplo:
En el 2do intervalo van a estar comprendidos los datos recolectados de las variables desde 18 años hasta casi 21años, pero no los que corresponden a 21 años. En el 3er intervalo sucede algo similar, este va a estar comprendido por los datos desde 21 años hasta casi 24 años.
Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y sus respectivas acumuladas.
Y para las tablas tipo B se agrega una columna más que estará referida a las “Marcas de clase”
Marcas de Clase (xi ): Se define como el punto medio (promedio) de un intervalo de clase. Es el valor representativo de cada intervalo.
Intervalos y marca de clase
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
El máximo valor del último intervalo también se pone el corchete, para de esta manera en los casos que se pudieran dar, este valor también este comprendido en el intervalo.
Características de las tablas tipo B
El número de posibles valores que toma la variable es elevado. (Rango grande).
Se utiliza para el tratamiento de variables cuantitativas (discretas y continuas).
Su construcción es más compleja que en las tablas tipo A.