Módulo 3 - Visualización¶
Descargar el material del módulo acá.
Recomendamos que lxs asistentes del curso usen las versiones en PDF o HTML.
Si les interesa, el código .rmd de cada guía está subsitios de este módulo.
El resto de lo que está en esta página no fue usado en clase.
Librerias¶
La idea es que salgan haciendo gráficos "lindos" con poco código, entonces usamos ggplot2. Sepan que se puede hacer mucho en R base y hay otros paquetes además de ggplot2. Pueden leer opiniones de partidarios de base y de ggplot2 en internet, probar, y decidir por su cuenta.
Quizás conviene tener a mano las cheatsheets y ayudita de ggplot. Se puede sacar ideas de internet, sean buenas o malas, para probar las diferentes maneras de graficar datos, según lo que quieran mostrar.
Programa¶
qplot()¶
Primero con qplot
o quickplot
, una versión simple y limitada de ggplot()
que se parece un poco a plot
de R base.
Idea ejercicio:
- Sacar cachos de código de los ejemplos, y recauchutarlos para hacer otra cosas.
- Buscar algo en StackOverflow, Biostars, etc.
ggplot()¶
1D - Una dimensión¶
Ejercicios:
- Histograma
- Density plot
- Boxplot
- Violin plot
Discusión:
- La importancia de mirar los datos en un histograma: boxplot vs violin.
Obs: se puede usar aes(y=..density..)
en el histograma para superponerlo con un density plot y comprararlos.
2D - Dos dimensiones¶
Ejercicios 2D:
- Scatterplot
- Barplots
- Heatmap
Discusión:
- Problemas de escalas: color/colour, fill, scale_sarasa_discrete, scale_sarasa_continuous, …
3D - Tres dimensiones¶
Solo vamos a hablar de eso para decir lo siguiente: es mala idea hacer un gráfico 3D en papel o pantalla.
Bonus track¶
ggplot2 y más allá:
- Con ggplotly se puede transformar un grafico ggplot() a uno tipo Plotly (interactivo).
- Ggally es una extensión de ggplot2 para hacer gráficos más complicados.
Apps para visualización interactiva:
- Rstudio Shiny
- Plotly Dash
Paradoja de Simpson: Video: https://www.youtube.com/watch?v=ebEkn-BiW5k