Skip to content

~~DISCUSSION~~ > Wiki en construcción.

Taller IFIBYNE (2019)

Guías y materiales:

Organización

Cada módulo dura ~2 hs, y se dan dos por día a la mañana, con un intervalo entre ellos.

Encuesta de interés y nivel:

  • ¿Qué datos tienen?
  • ¿Qué es lo que ya saben? ¿Qué usan?
  • Evaluar conocimiento previo con interpretación de scripts.
  • Evaluar abstracción con preguntas.

Link a la encuesta.

20190803-155555.png

Día 1 - Fundamentos

Formato del encuentro:

  1. Explicación corta y entrega de problemas con cheatsheets específicos (inhouse).
  2. Experiencia autónoma.
  3. Puesta en común

Módulo 1 - Intro a R (Martín)

Temas:

  • Objetos y variables, comparación con Excel.
  • Lenguaje de programación, flujo de información.

Ejercicios:

  • Cargar variables y datos de un .csv
  • ¿Cómo pasar del Excel a un dataframe en R?
  • ¿Cómo definir un data.frame?

Nota: aprovechar a los asistentes con experiencia para que asistan a los principiantes.

Módulo 2 - Manejo de datos (Nacho)

Temas:

  • Manejo de información en dataframes y listas.
  • Introducción al Tidyverse.
  • Agrupado de datos y estadística básica.

Ejercicios:

  • __ply
  • group_by
  • left join
  • transformaciones con mutate y log

Día 2 - Gráficos y Estadística

Formato del encuentro:

  1. Explicación corta y entrega de problemas con cheatsheets específicos (inhouse).
  2. Experiencia autónoma.
  3. Puesta en común

Módulo 3 - Visualización y Gráficos (Nico)

Materiales acá.

Temas:

  • Visualización de datos con ggplot2
  • Tipos de gráficos 1D y 2D.
  • Transformación de datos con : ¿cuándo? ¿cómo?

Ejercicios :

  • Boxplot
  • Histograma
  • Density
  • Violin

Ejercicios 2D:

  • Scatterplot
  • Barplots
  • Heatmap

Discusión:

  • Problemas de escalas: color/colour, fill, scale_sarasa_discrete, scale_sarasa_continuous, ...
  • La importancia de mirar los datos en un histograma: boxplot vs violin.

Bonus track:

Video: https://www.youtube.com/watch?v=ebEkn-BiW5k

Módulo 4 - Tests estadísticos (Nacho)

Temas:

  • Pruebas parmétricas y no-paramétricas.
  • Muestreo de datos.
  • Modelos lineales y ANOVA.

Ejercicio:

  • Cada equipo recibirá una muestra de un dataset poblacional.
  • Aplicar los tests.
  • Puesta en común y discusión: ¿quién tuvo falsos positivos?

Discusión:

  • p-hacking
  • ¿Cómo mentir con estadísticas?

Día 3 - Aplicaciones en Biología

Formato del encuentro:

  • Elige tu propia aventura. Cada participante elegirá un tema de su interés para tratar.
  • Temas basados en la encuesta de intereses y disponibilidad de expertise.
  • Una mesa está reservada a repaso de temas anteriores, toda la mañana.

Hay dos tipos de datos:

  • Pocas muestras con muchas variables.
  • Muchas muestras con "pocas" variables.

Módulo 5.A - Bioconductor con Nacho

Temas:

  • Bioconductor: paquetes "core".
  • Manejo de secuencias y rangos: GRanges, Biostrings, ...
  • Descubrimiento de motivos: PWM
  • RNAseq y Microarrays (limma, dseq2)

Módulo 5.B - Scripting con Nico

Temas:

  • Scripting: funciones, control de flujo, magrittr...
  • ¿Cómo ser prolijo y hacer cosas reproducibles?
  • Debugging

Módulo 6.A - Transcriptómica con Martín

Temas:

  • Análisis de RNAseq: de counts a resultados.
  • Clustering, PCA y tSNE.

Módulo 6.B - Bio. Cuantitativa con Nico

Temas:

  • Citometría de flujo y Microscopía.
  • ¿Cómo tratar datos de muchas observaciones? La gente de neuro puede estar interesada.