En este episodio de estadistica y ciencia de datos con R / Rstudio discutimos el analisis exploratorio de datos (Exploratory data analysis EDA). Para ello utilizamos un conjunto de datos con variables categoricas y cuantitativas para elaborar:
Resumenes estadisticos:
- Estructura de los datos
- Explorando los datos mediante View
- Valores maximos, minimos, promedio y mediana de los atributos
- Interpretacion de resultados
- Creacion de tablas de contingencia / cruzadas
* Tablas de frecuencia
* Tablas porcentuales
* Tablas porcentuales por fila y por columna
- Analisis exploratorio con graficas:
* boxplot, histogramas, barplots
- EDA con graficas: graficos de dispersion (scatter)
- Creacion de graficos comparativos para diversas categorias
- Como entender un diagrama de caja (boxplot) con valores extremos
- Que es el coeficiente de correlacion Pearson (Pearson coefficient)
- Como interpretar los resultados de correlacion
- Que es el coeficiente de correlacion Spearman
- Cual es la diferencia entre los coeficientes Pearson y Spearman?
- Analisis exploratorio con graficas de variables:
* scatterplot o diagramas de dispersion
* mapa de calor o heatmap
- Preguntas de interes para analisis confirmatorio :
* Prueba de hipotesis de medias independientes
* Prueba de hipotesis para muestra simple
* Analisis de varianza
#Rstudio #Analisis #Estadistica
Discutimos ademas
- Generar preguntas sobre tus datos.
- Buscar respuestas visualizando, transformando y modelando sus datos.
- Usar lo que aprende para refinar sus preguntas y / o generar nuevas preguntas.
Cualquier comentario o sugerencia bienvenido es.
Contáctanos para mas información o solicitar un servicio: [email protected]
Igualmente, suscribirte para más vídeos y para apoyar el canal
My youtube channel in English:
https://www.youtube.com/channel/UCfW4cZ2fO4NpRO_8hRxS6Rw/
## 3.1 Tablas y resumenes: https://youtu.be/-5nfpVNBMcE
## 3.2 Plots y visualizaciones: https://youtu.be/9r1G1mHBljY
## 3.3 Correlacion y causalidad: https://youtu.be/JYM0O_WGK78
## 3.4 Outliers y valores faltantes: https://youtu.be/ibRKZ1dlics
## 3.5 Codificacion de variables y el one hot encoding:
https://youtu.be/HbOFz3Qcgo4
# Data science and statistical analysis
Curso analisis estadistico y ciencia de datos con R /Rstudio:
https://www.youtube.com/playlist?list=PL91sPCWWIYsi_FR-uxUtvlsTYcmVls79m
Machine learning videos
https://www.youtube.com/playlist?list=PL91sPCWWIYshhRyMHUjSHAg8U4aBMFwOf
# mtcars # cars
# statistical analysis
# histograms, Sturges, rule, bins
# data science
# hypothesis test
# visualization visualisation
# causation, association, linear
# relationship visualizacion
# R rstudio estadistica descriptiva #analisis de datos #graficas #curso #estadistica
# excel #R #desdecero #Tutorial #principiante