Sabes como extraer información valiosa de la web con R? Tablas de los Casos de la pandemia de coronavirus covid19 en Mexico?
En este episodio de la serie de videos en el tutorial course - curso de estadistica y ciencia de datos con R / Rstudio, aprendemos sobre el web scraping o extraccion de datos del internet.
-Hacemos uso de la biblioteca rvest para obtener información en HTML / XML2 proveniente de parrafos, tablas y mas
- Que es una etiquetas o tags en un HTML? nodos? atributos? clases?
- Como hacer uso de las funciones html_text, html_nodes
- Coronavirus en Mexico: casos acumulados de muerte, infección, positivos,etc
- Tablas de casos en los diferentes estados mexicanos y transformarlo en un tibble o data frames
- Analisis exploratorio de datos (Exploratory data analysis EDA)
- Utilizacion de herramienta y paquete de trabajo ggplot2
- Analisis exploratorio con graficas de barra: geom_col
- Creacion de graficos comparativos para diversas categorias
- Uso de paquete tidyverse / dplyr para manipulacion de datos
- Limpieza de datos: eliminacion de columnas, filas
- Conversion de variables tipo cadena (string, char) a numero entero
- Uso de funcion sub para sustitucion de valores
# Pagina web de ejemplo en este episodio tutorial
https://en.wikipedia.org/wiki/COVID-19_pandemic_in_Mexico
# view-source:https://en.wikipedia.org/wiki/COVID-19_pandemic_in_Mexico
Ir a tabla: SALUD reported Mexico Totals
# Leer mas sobre Etiquetas en HTML
https://es.wikipedia.org/wiki/HTML#Etiquetas_HTML_b%C3%A1sicas
Discutimos además
- Generar preguntas sobre tus datos.
- Buscar respuestas visualizando, transformando y modelando sus datos.
- Usar lo que aprende para refinar sus preguntas y / o generar nuevas preguntas.
Cualquier comentario o sugerencia bienvenido es.
Contacto: [email protected]
Plotly en R: Como convertir graficos ggplot a plotly | Curso tutorial analisis y ciencia de datos : https://youtu.be/tDt6DD9sQmE
- gráficos de barra con ggplot: https://youtu.be/AAfiiohnbO8
- graficos de pastel/ circular: https://youtu.be/AxEY9PIAQNI
- grafico boxplot diagrama de caja : https://youtu.be/rMyd1g8nWGo
- grafico de dispersion: https://youtu.be/wPK0Ba368wo
- grafico de histograma y densidad: https://youtu.be/hJBcXZf94KA
- Texto en graficos con ggplot2 y ggrepel: https://youtu.be/dj2IiM4Scz4
- Stat Summary Mean geom line bar: https://youtu.be/aU6if1mP384
- Stat summary y error bar estandar : https://youtu.be/A2RQ5wFzN6w
- Graficar Intervalo Confianza y Stat Summary : https://youtu.be/XFrLSf1axyQ
- Plots de Series de tiempo y scatterplot: https://youtu.be/TtIVb-rgh7k
# Data science and statistical analysis
Curso analisis estadistico y ciencia de datos con R /Rstudio:
https://www.youtube.com/playlist?list=PL91sPCWWIYsi_FR-uxUtvlsTYcmVls79m
Machine learning videos
https://www.youtube.com/playlist?list=PL91sPCWWIYshhRyMHUjSHAg8U4aBMFwOf
My youtube channel in English:
https://www.youtube.com/channel/UCfW4cZ2fO4NpRO_8hRxS6Rw/
## 3.1 Tablas y resumenes: https://youtu.be/-5nfpVNBMcE
## 3.2 Plots y visualizaciones: https://youtu.be/9r1G1mHBljY
## 3.3 Correlacion y causalidad: https://youtu.be/JYM0O_WGK78
## 3.4 Outliers y valores faltantes: https://youtu.be/ibRKZ1dlics
## 3.5 Codificacion de variables y el one hot encoding:
https://youtu.be/HbOFz3Qcgo4
# library dplyr, glimpse
# statistical analysis
# Boxplot diagrama de caja relationship
# data science hypothesis test
# visualization visualisation
# rstudio estadistica descriptiva analisis de datos
# graficas curso estadistica tutorial
# excel principiante desde cero
# Tutorial principiante