QC-tips-and-tricks

This repo contains a couple of scripts for establishing quality control (QC'ing) over datasets. There's one in R tidyverse and the other is in Python pandas. I basically use five steps for most of my QC work: (1) load data, (2) select columns, (3) create unique lists for text data, (4) create group by counts for categorical data and (5) create histograms for numerical and dates. I re-use these basic operations over and over again.

The example data is an ecological monitoring dataset containing bird point counts by David Peitz and coworkers. It is available here: https://doi.org/10.57830/2300777

Name		Name	Last commit message	Last commit date
Latest commit History 118 Commits
.gitignore		.gitignore
BirdObservationsThru2022_3.csv		BirdObservationsThru2022_3.csv
QCingMonitoringData.R		QCingMonitoringData.R
QCingMonitoringData.py		QCingMonitoringData.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QC-tips-and-tricks

About

Releases

Packages

Languages

garethrowell/QC-tips-and-tricks

Folders and files

Latest commit

History

Repository files navigation

QC-tips-and-tricks

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages