Saltar navegación

Funciones estadísticas

La Estadística se ocupa del análisis y descripción de fenómenos de naturaleza aleatoria. Por ejemplo la lluvia media recogida en una determinada zona, las ventas de un establecimiento comercial, la insolvencia de una empresa, los precios de las acciones en Bolsa, o el número que muestra un dado tras ser lanzado.

Considere el caso de un pequeño negocio de venta minorista, que lleva un registro semanal de los clientes que acceden al establecimiento y de la cifra de ventas. Los valores durante el último mes han sido los siguientes:

Semana Clientes Compras
1 269 20500
2 229 20400
3 222 19800
4 282 21000
5 257 23500

Vamos a utilizar estadísticos para resumir estos datos y para profundizar en ellos en busca de tendencias o patrones que puedan ser de interés.

Estadísticos básicos: media y dispersión

La media es una medida de posición, que ofrece una idea aproximada de cuál es el centro o punto de equilibrio de un conjunto de observaciones. El número de clientes es variable, oscila entre un mínimo de 229 y un máximo de 294 personas; si tuviésemos que expresarlo resumidamente un solo dato, podríamos afirmar que recibimos un promedio de 268 clientes por semana:

Otra posibilidad es la mediana, que es el valor que ocupa exactamente el centro de la distribución - es decir, que deja a derecha e izquierda el mismo número de observaciones. Si ordena las visitas de menor a mayor, es evidente que la mediana es igual a 268 (deja detrás dos observaciones inferiores: 229 y 260; y tiene por delante dos observaciones superiores: 287 y 294).

Aunque son triviales, los cálculos ocupan tiempo y esfuerzo a medida que la muestra se hace más grande, de ahí el interés de automatizar los cálculos. Inicie el asistente, o vaya a la categoría Más funciones > Estadísticas, y localice la función que calcula medias aritméticas, que es PROMEDIO; haga clic en Aceptar y especifique los valores que desea promediar.

Aunque muchas funciones pueden manejar directamente valores numéricos, la principal fortaleza de la hoja de cálculo es su capacidad para tratar con referencias; puede introducir las celdas una a una, aunque es más sencillo referenciar el rango B3:B7.

Un rango es un grupo de celdas adyacentes, por ejemplo varias celdas a lo largo de una misma fila o columna, o una matriz compacta de celdas. Los rangos se especifican indicando los extremos superior (o izquierdo) e inferior (o derecho), separados por dos puntos. Puede teclearlos o también hacer clic con el botón principal del ratón en uno de los extremos y, sin levantarlo, arrastrar hasta el otro.

Calcular medias (I)
Calcular medias (II)

La parte inferior de la ventana del asistente le muestra el resultado de la función: la media, si todo ha ido bien, o un mensaje de error (por ejemplo, si dentro del rango hay alguna cadena alfanumérica).

La imagen inferior muestra varios estadísticos calculados para las series de clientes y ventas: las medias y medianas, los máximos y mínimos respectivos, el rango y la dispersión. Naturalmente hay muchas otras funciones, destinadas en general al cálculo de probabilidades.

Las medidas de dispersión evalúan en qué medida la variable toma valores muy heterogéneos, o por el contrario está muy concentrada en torno a la media. Dos medidas comunes de dispersión son la desviación típica (o desviación estándar) y su cuadrado, la varianza. La hoja de cálculo le permite calcular medidas de dispersión muestrales (son las que empleamos aquí) y poblacionales (estas últimas acaban en P; por ejemplo, VARP y DESVESTP).

Estadísticos básicos

Dependencia e independencia

¿Está la facturación relacionada con el número de clientes que entran en nuestra tienda? En principo podríamos pensar que sí, aunque es probable que haya un número indeterminado de visitantes que finalmente no realizan compra alguna; por otra parte, no hay ninguna razón para asumir a priori que el importe medio de las compras sea constante.

El coeficiente de correlación y la covarianza son dos indicadores comúnmente empleados para cuantificar el grado de (in)dependencia de dos variables.

Covarianza y correlación

de lo que se desprende que ambas variables exhiben una moderada dependencia, de signo positivo (ρ = 41,91%). La facturación y las visitas de clientes parecen tener una relación positiva, aunque no todo lo estrecha e intensa que cabría esperar.

Una forma de comprobarlo es trazar un gráfico de dispersión; en ordenadas se muestra la facturación y en abscisas el número de visitantes de la tienda. Seleccione el rango B2:C5 y construya un gráfico de dispersión (en Excel, haga clic en la ficha Insertar > Gráficos; en Calc Insertar > Gráfico): en lugar de una relación positiva y creciente, hallamos una nube de puntos más o menos dispersa, lo que concuerda con el moderado valor de la correlación.

Gráfico de dispersión: ventas vs. clientes