Fotografía de: Bryony Elena vía unsplash.com

Taller Calidad de datos + biodiversidad

Buenas prácticas para mejores publicaciones.

PRESENTACIÓN

El taller Calidad de datos + biodiversidad busca compartir con la comunidad científica y profesional las buenas prácticas que facilitan el manejo y la gestión de información y datos sobre biodiversidad para su publicación, acceso y uso; siempre de manera gratuita y libre, como parte de la filosofía de trabajo del SiB Colombia.

Contexto

Los especialistas en datos, investigadores y tomadores de decisiones resaltan de manera frecuente la calidad de los datos como una prioridad para garantizar su uso en la generación de nuevo conocimiento, la conservación y el uso sostenible de la biodiversidad y sus servicios ecosistémicos.

Casi todos los datos pueden ser refinados o mejorados, este taller busca mejorar las capacidades y difundir las buenas prácticas que pueden ser aplicadas en diferentes etapas del flujo de trabajo con datos sobre biodiversidad.

Iniciará con conceptos generales sobre qué es la calidad de datos sobre biodiversidad, pasando por su aplicación en procesos tempranos como la toma de datos y la digitalización, para finalizar en procesos de publicación a través de plataformas de acceso abierto como GBIF y de repatriación de los mismos a nivel nacional.

Este taller es posible gracias al proyecto GBIF CESP2020-018.

Objetivo

Mejorar las capacidades de trabajo con datos sobre biodiversidad y compartir las buenas prácticas que pueden ser aplicadas en las diferentes etapas del flujo de trabajo.

Dirigido a

Este taller abarca desde contenidos básicos sobre la calidad de datos de biodiversidad hasta ejercicios prácticos con el uso de herramientas.

En ese sentido, va dirigido a profesionales y estudiantes de habla hispana que trabajan con datos sobre biodiversidad en sus diferentes etapas: recolección, digitalización, publicación o uso, y que tienen un conocimiento base sobre estándares de datos sobre biodiversidad y el modelo de publicación de estos a través de GBIF.

METODOLOGÍA

Metodología de trabajo

Este taller contiene una serie de capítulos en línea que contempla seminarios enfocados en las buenas prácticas para mejorar la calidad de datos sobre biodiversidad, y espacios para responder las inquietudes para su aplicación en casos reales (Consultorio de Calidad de Datos). El desarrollo de los contenidos se realizará en la modalidad e-learning a través de la plataforma Zoom con streaming a través de Youtube para los seminarios.

En el Consultorio de Calidad de Datos los participantes tendrán una oportunidad única de compartir sus inquietudes adicionales sobre la implementación de estas buenas prácticas en su trabajo y exponer sus casos reales para recibir orientación y recomendaciones de los facilitadores.

Certificados

Un certificado del taller confirma que los asistentes han participado del 100% de los seminarios y consultorio de calidad de datos. No se proporcionan certificados para una participación parcial o que no se realice bajo la metodología establecida para cada sesión.

En la primera semana se estima una dedicación de al menos 18 horas, de las cuales 15 estarán concentradas en los seminarios y tres para el Consultorio de Calidad de Datos.

REQUISITOS

Materiales

Todos los materiales de apoyo para el curso estarán disponibles para su consulta y descarga. Entre estos estarán:

  1. Librería Zotero con las referencias bibliográficas usadas.
  2. Grabaciones de los seminarios.
  3. Presentaciones de los seminarios.
  4. Consolidado de preguntas y respuestas de cada sesión.

Prerrequisitos

  1. Curso en línea “Introducción a GBIF”. Disponible aquí.

  2. Algunos de los cursos ofrecidos presencial o virtualmente por los nodos de GBIF sobre estándares y publicación de datos. Aquí algunos de estos:
  3. Para aprovechar al máximo las actividades de este curso, los participantes deben poseer las siguientes habilidades y conocimientos:

    • Competencias básicas en el uso de computadores e Internet y, en particular, en el uso de hojas de cálculo.

    • Conocimientos básicos sobre el estándar Darwin Core y publicación de datos a través de GBIF.

    • Disposición para difundir el conocimiento aprendido en el taller con otras personas de su entorno profesional o académico, adaptando los materiales de capacitación, manteniendo su valor instructivo.

PROGRAMA

Fechas generales

20 de agosto: Publicación de la convocatoria.

19 de septiembre: Cierre de la convocatoria.

15 de octubre: Anuncio de los participantes seleccionados (La fecha fue actualizada debido a que el cierre de la convocatoria fue extendido una semana).

8 de noviembre: Inicio del taller.

16 de noviembre: Finalización del taller.

Seminarios

Lunes 8 de noviembre

  • Introducción a la calidad de datos, principios generales.
    Hora: 8:00 a.m. a 10:30 a.m. (COT).
    Descripción: Definición de conceptos básicos: calidad de datos, fitness for use. Problemas y limitantes comunes. Recomendaciones generales.
    Ponentes: Anabela Plos & Dairo Escobar.

Martes 9 de noviembre

  • BBPP para la toma de datos: planificación
    Hora: 8:00 a.m. a 9:15 a.m. (COT).
    Descripción: Flujo de datos y pasos deseables para evitar pérdida de calidad en los datos. Sugerencias de planificación.
    Ponentes: Anabela Plos.

  • BBPP para la digitalización y almacenamiento de datos.
    Hora: 9:15 a.m. a 10:30 a.m.(COT).
    Descripción: Importancia del diseño de la interfaz de documentación de datos y la necesidad de crear capacidad en los responsables de la transcripción y digitalización.
    Ponentes: Dairo Escobar.

Miércoles 10 de noviembre

  • BBPP para la documentación de información geográfica
    Hora: 8:00 a.m. a 9:15 a.m. (COT).
    Descripción: Importancia de la información geográfica para el uso de datos de biodiversidad. Datos geográficos mínimos y elementos de una buena georreferenciación. Tipos y descripción de localidades, coordenadas, sistemas de referencia e incerteza asociada a una georreferencia. Otros elementos: elevación, profundidad. Errores comunes, cómo evitarlos y cómo repararlos.
    Ponentes: Paula Zermoglio.

  • BBPP para la documentación de metadatos
    Hora: 9:15 a.m. a 10:30 a.m. (COT).
    Descripción: Importancia del contexto de los datos para su publicación, recuperación y uso.
    Ponentes: Diana Hernández.

Jueves 11 de noviembre

  • BBPP para la publicación y actualización de datos (GBIF-OBIS)
    Hora: 8:00 a.m. a 9:15 a.m. (COT).
    Descripción: Importancia de un modelo, procesos, herramientas y mejores prácticas para publicar datos e información a través de sistemas de información.
    Ponentes: Camila Plata.

  • BBPP para la repatriación de datos
    Hora: 9:15 a.m. a 10:30 a.m. (COT).
    Descripción: Integración de datos desde fuentes externas para la consolidación de información sobre biodiversidad.
    Ponentes: Liliana Lara.

Viernes 12 de noviembre

  • Evaluación y limpieza de datos 1/2
    Hora: 8:00 a.m. a 9:15 a.m. (COT).
    Descripción: Flujo de evaluación y limpieza. Herramientas para la limpieza de datos. Herramientas para chequeo de formato y fechas. Herramientas para limpieza de datos geográficos. Herramientas para la limpieza de datos taxonómicos. Uso del GBIF Data Validator.
    Ponentes: Paula Zermoglio & Camila Plata.

  • Evaluación y limpieza de datos 2/2
    Hora: 9:15 a.m. a 10:30 a.m. (COT).
    Descripción: Uso de OpenRefine para la limpieza de datos: funciones básicas.
    Ponentes: Paula Zermoglio & Camila Plata.

Consultorio de Calidad de Datos

Martes 16 de noviembre

  • Consultorio de Calidad de Datos
    Hora: 8:00 a.m. a 11:00 a.m. (COT).
    Descripción: (máx. 3 horas) Tenemos que hablar… con un panel conformado por los facilitadores del taller se abordarán algunos de los casos reales documentados por los participantes respecto la implementación de estas buenas prácticas en su trabajo, generando discusión, orientación y recomendaciones. Incluye 3 sesiones en simultánea/casos priorizados.
    Facilitadores: Todos los facilitadores.

Seminarios recomendados previos al taller

Para obtener el máximo beneficio de los seminarios de este taller, se recomienda que cada participante realice previamente una actualización de sus conocimientos en tipos de datos sobre biodiversidad, estándares y modelos de publicación de estos en plataformas globales.

Tipos de datos:

Eventos de muestreo: ¿cómo publicarlos usando el estándar Darwin Core? [11min, EN]

Biodiversity data origins and types from GBIF on Vimeo.


¿Qué datos sobre nuestra biodiversidad se pueden publicar a través del SiB Colombia? [43min, ES]

Estándares para datos sobre biodiversidad:

Estándares para la información sobre biodiversidad Intro [8 min, ES]

Estándares para la información sobre biodiversidad DarwinCore [16 min, ES]

Biodiversity Data Standards - Biodiversity Data Mobilization Training in Haiti [120min, EN]

Aprendiendo un nuevo idioma, Darwin Core [43min, ES]

Eventos de muestreo: ¿cómo publicarlos usando el estándar Darwin Core? [60min, ES]

El modelo de publicación de datos de GBIF:

Data Publishing Workflow in the GBIF Network - Biodiversity Data Mobilization Training in Haiti [70min, EN]

Crear, compartir, transformar: ¿Cómo publicar a través del SiB Colombia? [60min, ES]

Sobre el modelo de publicación de datos de OBIS:

OBIS Colombia: publicación y acceso a datos sobre biodiversidad marina. [60min, ES]

Sobre GBIF:

GBIF: La biblioteca de la vida [3min, ES]

Sobre OBIS:

OBIS - GBIF introduction 5min, EN]

OBIS - GBIF introduction from GBIF on Vimeo.


Introduction to the Ocean Biodiversity Information System (OBIS) [2min, EN subtitulado]

OBIS and GBIF commonalities and differences [4min, EN]

OBIS and GBIF commonalities and differences from GBIF on Vimeo.


FACILITADORES

   
Anabela Plos: Licenciada y doctora en Ciencias Biológicas de la Facultad de Ciencias Naturales y Museo, Universidad Nacional de La Plata (Argentina). Realizó su postdoctorado en el Museo de La Plata (Argentina) y el New York Botanical Garden (Estados Unidos). Administradora del Nodo Argentino de GBIF y miembro del Consejo Asesor del Sistema Nacional de Datos Biológicos (SNDB-MinCyT, Argentina). Representante Regional de Nodos de Latinoamérica y el Caribe de GBIF. Mentora en el programa BID para el Caribe (Biodiversity Information for Development). Áreas de formación: sistemática, taxonomía, SIG, conservación y digitalización de colecciones. Intereses: Ciencia ciudadana, datos abiertos, entre otros.
Camila Plata: Bióloga e ingeniera ambiental de formación con una maestría en Biología Evolutiva. Desde el SiB Colombia lidera la línea de Administración de Contenidos asegurando que los datos publicados a través del sistema sean de la mejor calidad para ser utilizados en investigación y toma de decisiones, además de liderar procesos de análisis y síntesis de cifras.
Dairo Escobar: Biólogo de formación con una maestría en ciencias biológicas con experiencia en el campo de la informática de la biodiversidad y datos abiertos, consolidando sistemas y redes de información a escala país que faciliten el acceso libre a datos sobre biodiversidad para la investigación, la educación y toma de decisiones. En su posición actual coordina el Sistema de Información sobre Biodiversidad de Colombia y el nodo GBIF para el país.
Paula Zermoglio: Doctora en ciencias biológicas de la Universidad de Buenos Aires y de la Universidad de Tours, Francia. Su área de estudio es la ecología de insectos, y está llevando a cabo un postdoctorado en el Instituto de Ecología, Genética y Evolución de Buenos Aires (IEGEBA, CONICET-UBA) y en el Instituto de Investigaciones en Recursos Naturales, Agroecología y Desarrollo Rural (IRNAD, CONICET-UNRN), evaluando el efecto de la ganadería holística sobre la entomofauna en Patagonia. Sus intereses incluyen además el intercambio de datos de biodiversidad, el desarrollo de estándares de datos y la evaluación y mejoramiento de la calidad de los datos. Participa activamente en la comunidad del Global Biodiversity Information Facility (GBIF) como mentora y a través de diversos proyectos. Ha organizado y dictado diversas capacitaciones en movilización, estándares y calidad de datos y georreferenciación. Paula es representante regional en el comité ejecutivo del Biodiversity Information Standards (TDWG), donde trabaja en el desarrollo de estándares de datos.
Liliana Lara: Bióloga y maestra en ciencias egresada de la Facultad de Ciencias de la Universidad Nacional Autónoma de México. El grupo de trabajo que coordina, centra sus actividades en el análisis y desarrollo de procesos de control de calidad de los datos obtenidos a partir de los proyectos que son apoyados por la CONABIO y que integran la información de especímenes recolectados u observados principalmente en el territorio nacional. Esta información es la columna vertebral del Sistema Nacional de Información sobre Biodiversidad (SNIB), cuya instrumentación, operación y actualización corresponde a una de las funciones principales de la CONABIO, como lo establece el artículo 80, fracción V de la Ley General del Equilibrio Ecológico y la Protección al Ambiente.
Diana Hernández: Bióloga egresada de la Facultad de Estudios Superiores Zaragoza, Universidad Nacional Autónoma de México (UNAM). Maestra en Ciencias en Biología Marina por el Instituto de Ciencias del Mar y Limnología de la UNAM con taxonomía y ecología de tanaidáceos (Crustacea) de mar profundo del Golfo de México. Ha trabajado más de 15 años en la CONABIO compilando información de biodiversidad de invertebrados marinos. Desde 2011 está a cargo de la Subcoordinación de Catálogos de Autoridades Taxonómicas y dentro de sus principales funciones está la planeación estratégica del desarrollo y actualización del catálogo taxonómico de especies de flora y fauna de México, coordinando un equipo de trabajo de taxónomos mediante desarrollo de proyectos, asesorías o estancias postdoctorales financiados por la CONABIO. Ha coordinado talleres, simposios y reuniones técnicas con taxónomos especialistas en distintos grupos biológicos. Forma parte del grupo técnico de trabajo del Sistema Nacional de Información sobre Biodiversidad (SNIB). Recientemente designada como staff del Nodo GBIF de México y como Punto Focal Nacional para la Global Taxonomy Iniciative. Ha sido profesora de la Carrera de Biología de la Facultad de Ciencias de la UNAM.

INSCRIPCIÓN

Cupos

El taller contará con máximo 60 cupos.

Proceso de postulación y selección

Para participar en el taller los postulantes deberán realizar los siguientes pasos:

  • Enviar el formulario de aplicación. Es necesario ser explícito y detallado para facilitar la evaluación de su candidatura.

  • La selección de los participantes estará a cargo de un comité evaluador conformado por los nodos organizadores, que tendrá en cuenta los siguientes criterios:

    • Experiencia del candidato con el manejo de datos sobre biodiversidad.

    • Experiencia en la publicación de datos sobre biodiversidad (evidencia de publicaciones realizadas a través de GBIF).

    • Capacidad de réplica de lo aprendido en el taller (evidencia de actividades de capacitación y divulgación previas, en el papel de expositor y facilitador).

    • Potencial de aplicación de los conocimientos del taller en el mejoramiento de datos pre-existentes (evidencia de manejo de datos sobre biodiversidad, como curador o encargado).

    • Potencial de publicación de nuevos datos a través de GBIF implementando los conocimientos del taller.

    • Cumplimiento de los prerrequisitos establecidos.

    • Representatividad de diferentes países y organizaciones hispanohablantes de Latinoamérica y el Caribe.

A todos los participantes se les informará el resultado de la evaluación, vía correo electrónico, dentro de los plazos establecidos en el calendario de la convocatoria.