Glosario

El actual trabajo tiene la intención de agrupar en su totalidad los términos que utilizamos en la materia de "Análisis de datos para la toma de decisiones en el deporte". La gran mayoría de las definiciones han sido obtenidas del contenido de cada una de las clases y sus presentaciones, mientras que el resto de la herramienta de inteligencia artificial que nos ha brindado el profesor. 

GLOSARIO DE ESTADÍSTICA

Estadística: Se define como la ciencia que se ocupa de la recopilación organización, interpretación y presentación de datos. Nos ayuda a entender y analizar fenómenos complejos en varias disciplinas.

Datos: Son observaciones recopiladas que se pueden escribir y presentar, pueden ser números, palabras, mediciones, observaciones o incluso descripciones de cosas.

Hecho: Es un dato que ya ha sido interpretado.

Población: Es el conjunto complejo de observaciones a medidas que se están estudiando.

Muestra: Subconjunto de la población que se utiliza para representar la población entera.

Muestreo aleatorio simple: Todos los miembros de la población tienen la misma probabilidad de ser seleccionados para la muestra.

Muestreo estratificado: La población se divide en grupos o estratos, y se seleccionan muestras aleatorias de castrato.

Muestreo sistemático: Se selecciona un punto de partida aleatorio, y luego se selecciona cada enésimo miembro de la población.

Muestreo por conglomerados: La población se divide en grupos o conglomerados, y se seleccionan uno o más conglomerados a lazar y todos los miembros de estos conglomerados incluyen la muestra.

Muestreo no probabilístico por conveniencia: Se seleccionan los miembros de la población que son más fáciles de alcanzar.

Muestreo por cuota: Se establecen cuotas para ciertos grupos o categorías y se seleccionan miembros de la población hasta que se llenen las cuotas.

Muestra por juicio o criterio: El investigador selecciona a los miembros de la población que considera más representativos útiles para el evento.

Muestra bola de nieve: Los miembros actuales de la muestra reclutan a futuros miembros de la población.

Variable: Son características o atributos que pueden tomar diferentes valores.

Variables cuantitativas: Se pueden medirse numéricamente, es decir, representan una cantidad.

Variables cuantitativas discretas: Son aquellas que pueden tomar valores aislados, es decir, representan una cantidad.

Variables cuantitativas continuas: Son aquellas que pueden tomar cualquier valor dentro de un intervalo específico.

Variables escalares: Son aquellas que tienen una magnitud númerica y se miden en una escala continua.

Valores intervalo: Son variables numéricas en las que los intervalos entre los valores son Uniformes. Lo que significa que la diferencia entre dos valores significativa y tiene sentido.

Variables de razón: Son similares a las variables intervalo en que los intervalos entre los valores son uniformes. Sin embargo, a diferencia de las variables intervalo, las variables de razón tienen un verdadero cero.

Variables cualitativas: Se escribe en una característica o atributo que no puede ser medido con números, pero puede ser agrupado en categorías diferentes.

Variables cualitativas nominales: Son variables que no tienen orden o jerarquía. 

Variables cualitativas ordinales: Son variables que si tienen orden o jerarquía.

Dependiente: Es la variable que se mide en el estudio y que se espera que cambié como resultado de las manipulaciones de la variable independiente.

Independiente: Es la variable que se manipula en un experimento estudio para ver si causa algún cambio en la variable dependiente.

Frecuencia: La variable de una frecuencia particulares el número de veces que aparece en un conjunto de datos.

Medidas de tendencia central: Son valores que representan el centro o el valor típico en un conjunto de datos. Incluyen la media (promedio), la mediana y la moda.

Media: A veces también llamada promedio, que es la suma de todas las observaciones dividida por el número de observaciones.

Moda: Es el dato que más se repite en una muestra.

Mediana: Es un valor numérico que se encuentra en la mitad de un conjunto dedatos ordenados.

Medidas de dispersión: Miden la variabilidad de dispersión de los datos (rango, varianza, desviación estándar).

Varianza: Mide como en los valores individuales en un conjunto de datos se desvían de la media.

Desviación estándar: Una medida de la dispersión o variabilidad de los datos. Es la raíz cuadrada de la varianza.

Simetría: Una distribución normal es simétrica, lo que significa que los datos se distribuyen de una misma manera ambos lados de la media

Curva de densidad de probabilidad: En una distribución normal, la curva de densidad de probabilidad tiene una forma de una campana.

Medida Z: Es una medida que describe la posición de una observación individual en relación con la media y la desviación estándar de un conjunto de datos.

Normalidad: La normalidad es una suposición clave en muchos modelos y pruebas estadísticas.

Función de distribución acumulada: Esta función describe la probabilidad de qué una variable aleatoria tomada de la población sea igual o menor que un valor específico.

Percentiles: Son valores que dividen los datos en cien partes iguales. 

Cuartiles: Dividen un conjunto de datos ordenados en cuatro partes iguales.

Rango intercuartilico: Es la diferencia entre el tercer y el primer cuartil y mide la dispersión de los valores medios.

Sesgo: Es una medida de la simetría de una distribución de probabilidad alrededor de su media.

Curtosis: Es una medida de la “pesadez” de las colas de una distribución de probabilidad. Ayuda a describir la extensión y la probabilidad de los valores atípicos.

Histograma: Un gráfico que muestra la distribución de un conjunto de datos. El eje X representan las categorías o rango de valores y el eje Y representa las frecuencias.

Diagrama de caja: Un gráfico que muestra de la mediana, los cuartiles y los valores extremos en un conjunto de datos. Ayuda visualizar la distribución y la dispersión de los datos.

Tipos de frecuencia

Frecuencia absoluta: Es el número de veces que se presentan valoro categoría deuna variable.

Frecuencia relativa: Se puede expresar en términos de porcentaje o de proporción y se representa como fr. (Es la razón entre la frecuencia absoluta y el total de datos).

Tablas de contingencia o tablas cruzadas: Las tablas de contingencia, también conocidos como tablas cruzadas, son útiles para mostrar la relación entre dos o más variables categóricas.

Tablas de resumen: Son útiles para presentar estadísticas resumidas para una o más variables.

Elaboración interpretación de gráficos

Principios de la visualización de datos: La visualización de datos es una forma de comunicar información de manera eficaz y fácil de entender mediante representaciones gráficas de los datos. Algunos de los principios claves en la visualización de datos son: simplicidad, claridad, consistencia.

Gráficos de barras y columnas: Son útiles para comparar una o varias categorías a lo largo de una dimensión, como el tiempo.

Gráficos de líneas: Son útiles para mostrar tendencias a lo largo del tiempo.

Gráficos de pastel: Son útiles para mostrar proporciones de un todo.

Histograma: Son útiles para representar la distribución de datos cuantitativos.

Diagrama de dispersión: Son útiles para mostrar relación entre dos variables cuantitativas.

Boxplots: Son útiles para mostrar la mediana, cuartiles y posibles valores atípicos de una variable cuantitativa.

Polígono de frecuencias: Es un tipo de gráfico que se utiliza para representar la distribución de un conjunto de datos. Se trata de una niña que conectan los puntos que representan frecuencia de datos.

Ojivas tipo mayor que y menor que: Son gráficos que representan la frecuencia acumulada o frecuencia acumulada relativa, de los datos en un conjunto de datos. Los gráficos de ojiva pueden ser de dos tipos: mayor que y menor que.

Caja y manijas (boxplot): También conocido como gráfico de caja y bigotes, es una forma gráfica de representar la distribución de un conjunto de datos. Es útil para visualizar la mediana, los cuartiles y los valores atípicos.

Gráficos de violín: Combinan características de boxplots e histogramas. Son útiles para visualizar la distribución de los datos.

Mapas de calor: Son útiles para visualizar matrices de datos, donde los colores representan los valores en la saldos de la matriz. Son especialmente útiles para visualizar correlaciones y otros patrones.

Rango: Diferencia entre el máximo y el mínimo valor de una variable.

Tamaño de un intervalo: Es el cociente entre el valor del rango y la cantidad de intervalos que se desea obtener.

Medidas de asociación lineal


Covarianza: 
Es una medida de variabilidad conjuntiva entre dos variables. 

Correlación: Se refiere al grado de asociación entre dos variables. 

Estadística descriptiva y ejemplos

Estadística descriptiva: Es la parte de la entrada en la recolección, presentación y descripción de los datos: la media, la mediana como a la moda, el rango y la desviación estándar, son algunos conceptos en estadística descriptiva.

Prueba T de student: También conocida como la prueba de student, es un procedimiento estadístico que se utiliza para determinar si la media de una muestra significativamente diferente de la media de una población de la media de otra muestra.

Prueba T independiente o de dos muestras: Se usa cuando se desea comparar las medias de dos grupos diferentes.

Prueba T pareada o de muestras emparejadas: Este tipo sutiliza cuando se tienen parece observaciones, como las mediciones antes y después de un tratamiento en el mismo individuo, o de mediciones en pares de individuos que están emparejados alguna manera.

Probabilidad: Es la rama de las matemáticas que estudia el comportamiento de los sucesos aleatorios.

Suceso aleatorio: Es aquel fenómeno que ejecutado bajo las condiciones, puede tener varios resultados.

Sucesos deterministas: Sucesos en los que si las condiciones iniciales son siempre las mismas sólo hay un resultado posible.

Sucesos equiprobables: En los que por ejemplo, todas las caras un lado tienen las mismas posibilidades de salir.
Para calcular la probabilidad de este suceso se utiliza la regla de LaPlace.

Suceso imposible: Es un suceso que tiene probabilidad 0, no puede ocurrir. 

Seguro: cuánto es eso que tiene probabilidad uno, es un suceso que va a ocurrir siempre.

El espacio muestral: Cuando tenemos un suceso aleatorio, el conjunto de cada uno de los resultados individuales posibles ese suceso se denomina espacio muestral.

Comentarios

Más Popular

Presentación personal