INTRODUCCIÓN A LOS ANÁLISIS ESTADÍSTICOS EN R

INTRODUCCIÓN A LOS ANÁLISIS ESTADÍSTICOS EN R

CARRASCO RIBELLES, LUCÍA AMALIA / MARÍN MORALES, JAVIER

20,85 €
IVA inclòs
Editorial:
MARCOMBO, S.A.
Any d'edició:
2022
Matèria
Ciencias/ecologia/tecnologia
ISBN:
978-84-267-3544-7
Pàgines:
230
Col·lecció:
SIN COLECCION

Disponibilitat:

  • LLIBRERIA EL PUERTODisponible (Entrega en 24/48h)
  • AKELARRE KULTURGUNEADisponible (Entrega en 24/48h)

Índice general i
Preámbulo v
1 Generación de conocimiento a partir de datos 1
1.1 Datos, información y conocimiento . . . . . . . . . . . . . . . . . 1
1.2 Métodos estadísticos . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Inferencia estadística: población, muestra e incertidumbre asociada 3
2 Instalación y primeros pasos en R 5
2.1 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Instalación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Instalación de R . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.2 Instalación e introducción a RStudio . . . . . . . . . . . . . . . 7
2.2.3 Instalando paquetes . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Importación y exportación de datos . . . . . . . . . . . . . . . . 11
2.3.1 Utilizando el importador . . . . . . . . . . . . . . . . . . . . 11
2.3.2 Utilizando comandos . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3 Datos online . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.4 Datos precargados . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.5 Exportación . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 tidyverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3 Análisis exploratorio de datos 19
3.1 Análisis exploratorio de datos . . . . . . . . . . . . . . . . . . . 19
3.2 Primer vistazo al conjunto de datos . . . . . . . . . . . . . . . . 20
3.3 Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4 Crear subconjuntos de datos . . . . . . . . . . . . . . . . . . . . 25
3.4.1 Subconjuntos de variables . . . . . . . . . . . . . . . . . . . . 25
3.4.2 Subconjuntos de registros . . . . . . . . . . . . . . . . . . . . 26
3.5 El concepto de frecuencia . . . . . . . . . . . . . . . . . . . . . . 28
3.5.1 Conceptos . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.2 Tablas de frecuencia . . . . . . . . . . . . . . . . . . . . . . . 29
3.5.3 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5.4 Funciones de densidad . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Describiendo las distribuciones . . . . . . . . . . . . . . . . . . . 35
3.6.1 Campana de Gauss . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . 36
3.6.3 Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . 39
3.6.4 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . 41
3.7 Visualización de datos . . . . . . . . . . . . . . . . . . . . . . . . 44
3.7.1 Gráfico de barras . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.2 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.3 Scatterplot . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.7.4 Pie chart . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.7.5 Combinar gráficos . . . . . . . . . . . . . . . . . . . . . . . . 51
3.7.6 Exportar gráficos . . . . . . . . . . . . . . . . . . . . . . . . 52
4 La distribución normal 53
4.1 Las distribuciones de probabilidad de los datos . . . . . . . . . . 53
4.2 La distribución normal . . . . . . . . . . . . . . . . . . . . . . . 54
4.3 La distribución normal tipificada . . . . . . . . . . . . . . . . . . 56
4.4 Análisis de normalidad . . . . . . . . . . . . . . . . . . . . . . . 58
4.4.1 Q-Q plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Otras distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5.1 Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . 60
4.5.2 Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . 63
5 Contraste de hipótesis 67
5.1 Inferencia estadística . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2 Contrastes de hipótesis . . . . . . . . . . . . . . . . . . . . . . . 69
5.3 Metodología científica . . . . . . . . . . . . . . . . . . . . . . . . 71
5.4 Definición y formulación de hipótesis . . . . . . . . . . . . . . . 72
5.5 P-valor y nivel de significación . . . . . . . . . . . . . . . . . . . 72
5.6 Errores tipo I y tipo II . . . . . . . . . . . . . . . . . . . . . . . 73
5.7 Contraste unilateral y bilateral . . . . . . . . . . . . . . . . . . . 75
5.9 Ejemplo práctico . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.10 Tamaño de efecto, poder estadístico y tamaño de muestra . . . . 78
5.10.1 Tamaño de efecto . . . . . . . . . . . . . . . . . . . . . . . . 79
5.10.2 Poder estadístico . . . . . . . . . . . . . . . . . . . . . . . . 79
5.10.3 Calculando el tamaño de la muestra . . . . . . . . . . . . . . . 80
6 Test estadísticos 83
6.1 Métodos de contraste de hipótesis . . . . . . . . . . . . . . . . . 83
6.2 Contrastes de una variable . . . . . . . . . . . . . . . . . . . . . 86
6.2.1 Contraste para una proporción . . . . . . . . . . . . . . . . . . 86
6.2.2 Contraste para una media . . . . . . . . . . . . . . . . . . . . 89
6.2.3 Contraste para una varianza . . . . . . . . . . . . . . . . . . . 92
6.3 Contraste para proporciones de más de una variable . . . . . . . 94
6.3.1 Test de independencia Chi-cuadrado . . . . . . . . . . . . . . . 94
6.3.2 Test McNemar . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.4 Contraste para medias: test de una variable y dos condiciones . 101
6.4.1 t-test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
6.4.2 t-test pareado . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.4.3 Wilcoxon-Mann-Whitney test . . . . . . . . . . . . . . . . . . 108
6.4.4 Wilcoxon signed rank test (pareado) . . . . . . . . . . . . . . . 110
6.5 Contraste para medias: test de una variable con más de dos condiciones . . . . . . . . . . 112
6.5.1 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.5.2 Comparación múltiple: análisis post hoc . . . . . . . . . . . . . 118
6.5.3 ANOVA de medidas repetidas . . . . . . . . . . . . . . . . . . 122
6.5.4 Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.5.5 Friedman . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.6 Contraste para medias: test de una variable y más de un factor 131
6.6.1 ANOVA (two-way) . . . . . . . . . . . . . . . . . . . . . . . 131
6.7 Visualización de contraste de medias . . . . . . . . . . . . . . . 137
6.8 Contraste para varianzas: análisis de la homocedasticidad . . . . 138
6.8.1 Test de Levene . . . . . . . . . . . . . . . . . . . . . . . . . 140
6.9 Bondad de ajuste: análisis de la normalidad . . . . . . . . . . . 141
6.9.1 Test Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . 142
6.9.2 Test Shapiro-Wilk . . . . . . . . . . . . . . . . . . . . . . . . 144
6.9.3 ¿Qué test de bondad de ajuste utilizar? . . . . . . . . . . . . . 144
6.10 Categorizando variables cuantitativas . . . . . . . . . . . . . . . 145
7 Correlaciones y regresión lineal 149
7.1 La relación de variables cuantitativas . . . . . . . . . . . . . . . 149
7.2 Correlación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.2.1 Correlación y causalidad . . . . . . . . . . . . . . . . . . . . . 151
7.2.2 Covarianza y coeficientes de correlación . . . . . . . . . . . . . 151
7.2.3 Contraste de correlación . . . . . . . . . . . . . . . . . . . . . 152
7.2.4 Coeficiente de Pearson . . . . . . . . . . . . . . . . . . . . . . 153
7.2.5 Coeficiente de Spearman . . . . . . . . . . . . . . . . . . . . . 153
7.2.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 154
7.3 Regresión lineal simple . . . . . . . . . . . . . . . . . . . . . . . 157
7.3.1 Formulación . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7.3.2 Coeficientes de regresión . . . . . . . . . . . . . . . . . . . . . 158
7.3.3 Análisis de la precisión del modelo . . . . . . . . . . . . . . . . 160
7.3.4 Inferencia y estimación . . . . . . . . . . . . . . . . . . . . . 164
7.3.5 Condiciones necesarias . . . . . . . . . . . . . . . . . . . . . 165
7.3.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 166
7.4 Regresión lineal múltiple . . . . . . . . . . . . . . . . . . . . . . 169
7.4.1 Formulación . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.4.2 Coeficientes de regresión . . . . . . . . . . . . . . . . . . . . . 170
7.4.3 Análisis de la precisión del modelo . . . . . . . . . . . . . . . . 170
7.4.4 Significación global del modelo . . . . . . . . . . . . . . . . . . 171
7.4.5 Condiciones necesarias . . . . . . . . . . . . . . . . . . . . . 171
7.4.6 Ejemplo de aplicación . . . . . . . . . . . . . . . . . . . . . . 173
7.4.7 Inclusión de variables categóricas . . . . . . . . . . . . . . . . 176
7.4.8 Interacciones entre variables . . . . . . . . . . . . . . . . . . . 181
7.4.9 Regresión polinómica . . . . . . . . . . . . . . . . . . . . . . 183
7.4.10 Selección de variables independientes . . . . . . . . . . . . . . . 187
7.4.11 Validación y test . . . . . . . . . . . . . . . . . . . . . . . . 191
8 Detección de valores atípicos y faltantes 199
8.1 Valores que pueden invalidar el análisis . . . . . . . . . . . . . . 199
8.2 Valores atípicos u outliers . . . . . . . . . . . . . . . . . . . . . 200
8.2.1 Detección univariante . . . . . . . . . . . . . . . . . . . . . . 201
8.2.2 Detección multivariante . . . . . . . . . . . . . . . . . . . . . 206
8.3 Valores faltantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
8.3.1 Descripción y visualización . . . . . . . . . . . . . . . . . . . 210
8.3.2 Imputación . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
Bibliografía 219

La estadística es una herramienta esencial para extraer un conocimiento riguroso a partir del análisis de datos, tanto para la toma de decisiones empresariales como para la investigación científica. Sin embargo, su aprendizaje a menudo se hace tedioso, y es común perderse en la notación matemática o los conceptos teóricos. En este libro encontrará una introducción a los métodos estadísticos desde una perspectiva eminentemente práctica y actualizada. Está destinado a cualquier estudiante, investigador o profesional que necesite aplicar análisis estadísticos en un conjunto de datos, independientemente de su naturaleza. Los conceptos teóricos se presentan utilizando la menor notación matemática posible mediante descripciones intuitivas. Cada capítulo incluye ejemplos prácticos de análisis con el código y los datos necesarios para implementar los análisis presentados en R sin necesidad de tener conocimientos previos de programación. Gracias a la lectura de este libro, asimilará y aprenderá a realizar técnicas de estadística descriptiva, y a aplicar los principales métodos de contraste de hipótesis, paramétricos y no paramétricos, así como correlaciones y regresiones, además de la forma de tratar los datos anómalos y los faltantes, en un programa informático de referencia en estadística como es R. Con todo ello, esta es una guía completa que le permitirá minimizar la curva de aprendizaje y adquirir la seguridad necesaria para identificar el análisis estadístico apropiado en cada caso y realizarlo con éxito. Javier Marín Morales es doctor en Tecnologías para la Salud y el Bienestar, investigador en el Instituto de Investigación e Innovación en Bioingeniería (Universitat Politècnica de València, UPV) y colaborador docente en el Departamento de Estadística e Investigación Operativa Aplicadas y Calidad (UPV). Lucía Amalia Carrasco Ribelles tiene un Máster en Ciencia de Datos y es investigadora en la Fundación Instituto Universitario para la Investigación en Atención Primaria de Salud Jordi Gol i Gurina (IDIAPJGol). Ambos autores han publicado numerosos artículos en revistas científicas y tienen amplia experiencia en R.

Articles relacionats

  • LAS BONDADES DE LA NATURALEZA
    WILLIS, KATHY
    Una visión pionera sobre los secretos y las virtudes de las plantas. Una mirada nueva y reveladora, basada en evidencias científicas, sobre cómo la naturaleza puede cambiar nuestras vidas Kathy Willis, directora científica del Royal Botanic Gardens de Kew, ha dedicado varios años de investigación a demostrar cómo las plantas y los árboles afectan a nuestro bienestar, estado de ...

    22,00 €

  • EL ESPAÑOL QUE ENAMORÓ AL MUNDO
    PEYRO JIMÉNEZ, IGNACIO
    Un extraordinario retrato de Julio Iglesias y una parábola de la evolución de la sociedad española en los últimos cincuenta años. Imagen de la seducción y del éxito, la riqueza y la fama, Julio Iglesias ha alcanzado una celebridad a escala global como ningún otro español –con la excepción de Dalí y Picasso– ha conseguido en nuestro tiempo. Su carrera, sin embarg...

    20,95 €

  • LA FALSA MEDIDA DEL HOMBRE
    GOULD, STEPHEN JAY
    Desmonta las teorías racistas que condujeron en el siglo XX a la matanza de millones de seres humanos y que hoy siguen perpetuando la pobreza y la injusticia social. Gould estudia los diversos intentos realizados a lo largo del tiempo para medir la inteligencia humana: primero mediante los cráneos, más tarde por medio del coeficiente intelectual y, finalmente, con análisis soci...

    19,90 €

  • EL MONO OBESO
    CAMPILLO ÁLVAREZ, JOSÉ ENRIQUE
    Un análisis del papel que juegan nuestros genes en el desarrollo de las enfermedades de la opulencia.¿Por qué hay tantas personas obesas? ¿Cuál es la razón de que resulte tan difícil perder el exceso de peso? ¿A qué obedece esta epidemia de diabetes que en el año 2020 afectará a más de 300 millones de personas? ¿Cómo es posible que la hipertensión y el exceso de colesterol nos ...

    17,90 €

  • INTERNET PARA LA GENTE
    TARNOFF, BEN
    Por qué deberíamos estar todos en pie de guerra para salvar nuestra independencia digital y nuestro pensamiento crítico. «Un libro extraordinario y urgente». Naomi Klein. Internet tiene dueños: empresas privadas con ánimo de lucro. La mayoría de buscadores aniquilan cualquier tipo de privacidad y algunas redes sociales se han convertido en altavoz de la propaganda de ultraderec...

    21,90 €

  • EL DÍA QUE INVENTAMOS LA REALIDAD
    ARGUELLO, JAVIER
    Con la agudeza y la elegancia características del gran talento literario, Argüello relata en estas páginas el nacimiento y la consolidación, las contradicciones y las incongruencias del rocambolesco camino que nos ha llevado a construir una fantasía tan prodigiosa como es la realidad. Y, al mismo tiempo, nos invita a mirar hacia el futuro para explorar los desafíos a los que no...

    19,90 €