~~DISCUSSION~~ > Wiki en construcción.
Taller IFIBYNE (2019)¶
Guías y materiales:
Organización¶
Cada módulo dura ~2 hs, y se dan dos por día a la mañana, con un intervalo entre ellos.
Encuesta de interés y nivel:
- ¿Qué datos tienen?
- ¿Qué es lo que ya saben? ¿Qué usan?
- Evaluar conocimiento previo con interpretación de scripts.
- Evaluar abstracción con preguntas.
Link a la encuesta.
Día 1 - Fundamentos¶
Formato del encuentro:
- Explicación corta y entrega de problemas con cheatsheets específicos (inhouse).
- Experiencia autónoma.
- Puesta en común
Módulo 1 - Intro a R (Martín)¶
Temas:
- Objetos y variables, comparación con Excel.
- Lenguaje de programación, flujo de información.
Ejercicios:
- Cargar variables y datos de un .csv
- ¿Cómo pasar del Excel a un dataframe en R?
- ¿Cómo definir un data.frame?
Nota: aprovechar a los asistentes con experiencia para que asistan a los principiantes.
Módulo 2 - Manejo de datos (Nacho)¶
Temas:
- Manejo de información en dataframes y listas.
- Introducción al Tidyverse.
- Agrupado de datos y estadística básica.
Ejercicios:
- __ply
- group_by
- left join
- transformaciones con mutate y log
Día 2 - Gráficos y Estadística¶
Formato del encuentro:
- Explicación corta y entrega de problemas con cheatsheets específicos (inhouse).
- Experiencia autónoma.
- Puesta en común
Módulo 3 - Visualización y Gráficos (Nico)¶
Materiales acá.
Temas:
- Visualización de datos con ggplot2
- Tipos de gráficos 1D y 2D.
- Transformación de datos con : ¿cuándo? ¿cómo?
Ejercicios :
- Boxplot
- Histograma
- Density
- Violin
Ejercicios 2D:
- Scatterplot
- Barplots
- Heatmap
Discusión:
- Problemas de escalas: color/colour, fill, scale_sarasa_discrete, scale_sarasa_continuous, ...
- La importancia de mirar los datos en un histograma: boxplot vs violin.
Bonus track:
Video: https://www.youtube.com/watch?v=ebEkn-BiW5k
Módulo 4 - Tests estadísticos (Nacho)¶
Temas:
- Pruebas parmétricas y no-paramétricas.
- Muestreo de datos.
- Modelos lineales y ANOVA.
Ejercicio:
- Cada equipo recibirá una muestra de un dataset poblacional.
- Aplicar los tests.
- Puesta en común y discusión: ¿quién tuvo falsos positivos?
Discusión:
- p-hacking
- ¿Cómo
con estadísticas?
Día 3 - Aplicaciones en Biología¶
Formato del encuentro:
- Elige tu propia aventura. Cada participante elegirá un tema de su interés para tratar.
- Temas basados en la encuesta de intereses y disponibilidad de expertise.
- Una mesa está reservada a repaso de temas anteriores, toda la mañana.
Hay dos tipos de datos:
- Pocas muestras con muchas variables.
- Muchas muestras con "pocas" variables.
Módulo 5.A - Bioconductor con Nacho¶
Temas:
- Bioconductor: paquetes "core".
- Manejo de secuencias y rangos: GRanges, Biostrings, ...
- Descubrimiento de motivos: PWM
- RNAseq y Microarrays (limma, dseq2)
Módulo 5.B - Scripting con Nico¶
Temas:
- Scripting: funciones, control de flujo, magrittr...
- ¿Cómo ser prolijo y hacer cosas reproducibles?
- Debugging
Módulo 6.A - Transcriptómica con Martín¶
Temas:
- Análisis de RNAseq: de counts a resultados.
- Clustering, PCA y tSNE.
Módulo 6.B - Bio. Cuantitativa con Nico¶
Temas:
- Citometría de flujo y Microscopía.
- ¿Cómo tratar datos de muchas observaciones? La gente de neuro puede estar interesada.