6. TABULACIÓN DE DATOS BINARIOS O CRUZADOS

En la mayoría de los estudios estadísticos se emplea el análisis uni-dimensional para interpretar su comportamiento de forma aislada o individualmente. Sin embargo, los vínculos que tienen las diferentes personas, objetos o fenómenos, facultan el establecimiento de rela-ciones entre las características o variables que ellas presentan. Estas relaciones permiten analizar simultáneamente el comportamiento de dos variables, ya sean cualitativas o cuantitativas, usando para ello la tabulación cruzada o tablas de contingencia.

En el siguiente ejemplo se demuestra el procedimiento para la elabo-ración de una tabla de contingencia:

Un informe sobre instituciones de educación superior de una región muestra, entre sus resultados, la calidad académica de la institución y la antigüedad en años de funcionamiento. La calidad académica corresponde a una variable cualitativa, calificada como excelente, muy buena y buena. La antigüedad, como variable cuantitativa conti-nua, oscila entre 10 y 49 años. La muestra fue de 300 instituciones. En la tabla 21 sólo se muestran los datos para las primeras 10 insti-tuciones.
El formato general para la tabla de contingencia o tabulación cruzada se describe en la tabla 22, con la síntesis de los datos para las insti-tuciones de educación superior. En los costados izquierdo y superior se ubican los encabezados de las variables y en las demás posiciones, el número de instituciones que presentan simultáneamente la calidad y antigüedad correspondientes. De esta manera, en cada intervalo de antigüedad se cuenta el número de instituciones que presentan eva-luación en cada categoría (buena, muy buena y excelente).

En la tabla 22 se observa que la mayor cantidad de instituciones edu-cativas (64) tienen calidad "muy buena", y que la antigüedad está entre 20 y 29 años. Sólo hay dos instituciones con calidad "excelente" y antigüedad entre 10 y 19 años. De forma análoga se interpretan las demás frecuencias. Como se observa en la tabla 22, los totales de los costados derecho e inferior indican la distribución de frecuencias de la calidad académica y de la antigüedad de la institución, respec-tivamente. Es posible observar que hay 84 instituciones con buena calidad académica, 150 muy buena y 66 excelente. De forma similar, se puede observar en la margen inferior la distribución de frecuen-cias de la antigüedad: 78 instituciones tienen entre 10 y 19 años, 118 entre 20 y 29, 76 entre 30 y 39 y 28 entre 40 y 49. 

8.Medidas de posición

Las medidas de posición, también llamadas cuantiles, son aquellas que permiten calcular valores en la distribución de los datos y que la dividen en partes iguales, de tal forma que los intervalos generados por los cuantiles contienen el mismo número de datos. Los cuantiles más usados son los cuartiles, deciles y percentiles. Cuando se tienen datos agrupados en intervalos, estas medidas se consideran en cierta forma como una extensión de la mediana.

8.1 Cuartiles

Los cuartiles (Q) son valores que fraccionan la distribución de los datos en cuatro partes iguales (Ruíz Muñoz, 2005). Existen tres cuar-tiles y cada una de las partes representa un 25% de los datos.

El primer cuartil Q, deja por debajo el 25% de la distribución de los datos o el 75% por encima de él. El segundo cuartil (Q₂) acumula el 50% de los datos por debajo y el otro 50% por encima de él (por tal razón es igual a la mediana); y el tercer cuartil (Q3) deja por debajo el 75% de los datos y por encima el 25% (Ruíz Muñoz, 2005).

El cálculo de los cuartiles se realiza mediante el siguiente procedimiento:

1. Ordenar los datos de forma ascendente.

2. Calcular la posición i con la ecuación: i= k/4 n  donde k es el número del cuartil (k = 1, 2, 3) y n el número total de datos.

3. Si i no es un número entero, se debe redondear al entero siguiente y el valor que ocupa esta posición será el cuartil requerido. Si i es un número entero, el cuartil es el promedio de los valores e.ii+1. 

Analisis 


Primero, el texto aclara que estudiar una sola variable puede ser insuficiente cuando se busca entender relaciones más complejas. Por eso introduce las tablas de contingencia, que permiten observar cómo se comportan dos variables al mismo tiempo. En el ejemplo de las instituciones educativas, este tipo de tabla sirve para detectar patrones, como si la calidad académica tiene alguna relación con la antigüedad de la institución. Este método no solo organiza información, sino que facilita comparar categorías y detectar tendencias que de otro modo pasarían desapercibidas.
Luego, el texto pasa a las medidas de posición, centrándose en los cuartiles. Estas medidas dividen los datos en partes iguales y permiten ubicar cada valor dentro del conjunto total. El primer cuartil indica el 25% más bajo de los datos, el segundo coincide con la mediana y el tercero marca el límite del 75%. Esto ayuda a entender si los datos están muy dispersos, si se concentran en ciertos rangos o si hay diferencias marcadas entre los valores más bajos y los más altos. En otras palabras, los cuartiles permiten interpretar la estructura interna de un conjunto de datos, más allá de promedios simples.
En conjunto, ambos conceptos —tablas de contingencia y cuartiles— muestran dos formas complementarias de análisis: una que compara variables entre sí, y otra que examina cómo se distribuyen los datos dentro de una sola variable. Esto da una visión más completa y útil para cualquier estudio estadístico.

Reflexión

El texto muestra que comprender datos no es solo hacer cuentas: es aprender a mirar la realidad con más precisión. Las tablas de contingencia nos obligan a aceptar que nada existe aislado; siempre hay relaciones, patrones y efectos que solo se ven cuando comparamos variables. Ignorar esas conexiones es interpretar el mundo a medias.
Por otro lado, los cuartiles nos recuerdan que un promedio nunca cuenta toda la historia. Dividir los datos en partes revela desigualdades, concentraciones y diferencias que suelen quedar escondidas. Entender cómo se distribuye la información es clave para no caer en conclusiones superficiales.
En conjunto, ambos conceptos enseñan algo más profundo: pensar estadísticamente es aprender a desconfiar de la primera apariencia, a buscar estructura donde otros solo ven números, y a tomar decisiones basadas en patrones reales, no en intuiciones débiles. Entender esto no solo mejora el análisis de datos, también mejora la forma en que interpretamos cualquier situación del mundo real.


Entradas populares de este blog

guía