HOPE-UIB-BIO
diff --git a/‎R/00_config.R
+103 b/‎R/00_config.R
+103
diff --git a/‎R/01_data_creation.R
+109 b/‎R/01_data_creation.R
+109
diff --git a/‎R/02_ROC_of_simulated_data.R
+108 b/‎R/02_ROC_of_simulated_data.R
+108
@@ -0,0 +1,103 @@
+#----------------------------------------------------------#
+#
+#
+#             Rate-of-change in palaeoecology 
+#
+#                     Project config
+#
+#                     Ondrej Mottl 
+#                         2020
+#
+#----------------------------------------------------------#
+
+#----------------------------------------------------------#
+# 1. Load libraries and functions -----
+#----------------------------------------------------------#
+
+# delete existing workspace to start clean
+rm(list = ls())
+
+# Package version control
+library(renv)
+# renv::init()
+# renv::snapshot(lockfile = "data/lock/revn.lock")
+renv::restore(lockfile = "data/lock/revn.lock")
+
+# libraries
+library(tidyverse)
+library(devtools)
+library(glmmTMB)
+library(parallel)
+library(MuMIn)
+library(emmeans)
+library(performance)
+library(RColorBrewer)
+
+
+# instal RRatepol package download and attach
+# devtools::install_github("HOPE-UIB-BIO/R-Ratepol-package")
+
+library(RRatepol)
+
+#----------------------------------------------------------#
+# 2. Load example data and custom function -----
+#----------------------------------------------------------#
+
+data_example <- RRatepol::example_data
+
+files_sources <- list.files("R/functions/") 
+sapply(paste0("R/functions/", files_sources, sep =""), source)
+
+#----------------------------------------------------------#
+# 3. Definition of variables -----
+#----------------------------------------------------------#
+
+# Number of simulated enviromental variables
+N_env <-  4
+
+# diversity of pollen taxat in simulated data
+low_diversity <-  5
+high_diversity <-  50
+
+# position of the enviromental change in the sequence 
+breaks_recent <-  c(2000, 3000)
+breaks_late <-  c(5500, 6500)
+
+# Number of simulated datasest of pollen data
+N_rep <-  100
+
+# template of time sequence with uneven distribution of points
+time_seq <-  data_example$list_ages[[4]]$ages$age
+
+# number of cores
+n_cores <-  parallel::detectCores()
+
+# value for beta family values
+very_small_value <-  .Machine$double.eps*100
+
+#----------------------------------------------------------#
+# 4. Graphical setings  -----
+#----------------------------------------------------------#
+
+theme_set(theme_classic())
+
+text_size <- 12
+
+color_legen_segment <- brewer.pal(n = 3, name = 'Set2')
+names(color_legen_segment) <- c("correct detection", "false positives")
+
+
+color_legen_dataset_type <- brewer.pal(n = 4, name = 'Set1')
+names(color_legen_dataset_type) <- 
+  c("high density level_high richness",
+    "high density level_low richness",
+    "low_density level_high richness",
+    "low_density level_low richness"
+  )
+
+color_legen_smooth <- brewer.pal(n = 5, name = 'Set3')
+names(color_legen_smooth) <- c("None","M.avg","Grimm","Age.w","Shep")
+
+
+
+
@@ -0,0 +1,109 @@
+#----------------------------------------------------------#
+#
+#
+#             Rate-of-change in palaeoecology 
+#
+#                   Data preparation
+#
+#                     Ondrej Mottl 
+#                         2020
+#
+#----------------------------------------------------------#
+
+# load config 
+source("R/00_config.R")
+
+#----------------------------------------------------------#
+# 1. Simulate datasets -----
+#----------------------------------------------------------#
+
+# low diversity recent
+
+sim_ld_recent <- 
+  fc_simulate_pollen_data_in_multiple_datasets(
+    time = time_seq, 
+    nforc = N_env, 
+    nprox = low_diversity, 
+    manual_edit = TRUE,
+    breaks = breaks_recent,
+    jitter = TRUE,
+    rarity = TRUE,
+    N_datasets = N_rep)
+
+
+sim_ld_late <- 
+  fc_simulate_pollen_data_in_multiple_datasets(
+    time=time_seq, 
+    nforc=N_env, 
+    nprox=high_diversity, 
+    manual_edit = T,
+    breaks=breaks_late,
+    jitter = T,
+    rarity=T,
+    N_datasets=N_rep)
+
+
+sim_hd_recent <- 
+  fc_simulate_pollen_data_in_multiple_datasets(
+    time=time_seq, 
+    nforc=N_env, 
+    nprox=high_diversity, 
+    manual_edit = T,
+    breaks=breaks_recent,
+    jitter = T,
+    rarity=T,
+    N_datasets=N_rep)
+
+
+sim_hd_late <- 
+  fc_simulate_pollen_data_in_multiple_datasets(
+    time=time_seq, 
+    nforc=N_env, 
+    nprox=high_diversity, 
+    manual_edit = T,
+    breaks=breaks_late,
+    jitter = T,
+    rarity=T,
+    N_datasets=N_rep)
+
+
+#----------------------------------------------------------#
+# 2. Merge datasets -----
+#----------------------------------------------------------#
+
+simulated_dataset <- 
+  dpyr::bind_rows(
+    
+    tibble::tibble(
+      sim_ld_recent,
+      diversity = "low_diversity",
+      position = "breaks_recent"),
+    
+    tibble::tibble(
+      sim_ld_late,
+      diversity = "low_diversity",
+      position = "breaks_late"),
+    
+    tibble::tibble(
+      sim_ld_recent,
+      diversity = "high_diversity",
+      position = "breaks_recent"),
+    
+    tibble::tibble(
+      sim_ld_late,
+      diversity = "high_diversity",
+      position = "breaks_late")) %>% 
+  mutate(
+    dataset_ID = paste(ID,diversity, position) %>% 
+      as.factor() %>% 
+      as.numeric()) %>% 
+  arrange(dataset_ID) %>% 
+  dplyr::select(dataset_ID, diversity, position, community_data, list_ages) %>% 
+  mutate(dataset_ID = as.character(dataset_ID)) 
+
+simulated_dataset
+
+#----------------------------------------------------------#
+# 3. Save datasets -----
+#----------------------------------------------------------#
+write_rds(simulated_dataset,"data/output/datasets/simulated_dataset.rds")
@@ -0,0 +1,108 @@
+#----------------------------------------------------------#
+#
+#
+#             Rate-of-change in palaeoecology 
+#
+#                 RoC in simulated datasets
+#                 & peak detection success
+#
+#                     Ondrej Mottl 
+#                         2020
+#
+#----------------------------------------------------------#
+
+# load config 
+source("R/00_config.R")
+
+#----------------------------------------------------------#
+# 1. Load data -----
+#----------------------------------------------------------#
+
+list_files_output <-  list.files("data/output/datasets/")
+
+if(any(list_files_output %in% "simulated_dataset.rds")){
+  simulated_dataset <-  read_rds("data/output/datasets/simulated_dataset.rds") 
+} else {
+  source("R/01_data_creation.R")
+}
+
+#----------------------------------------------------------#
+# 2. Calculate RoC -----
+#----------------------------------------------------------#
+
+sim_ROC_levels <- 
+  fc_estimate_RoC_by_all_methods(
+    simulated_dataset,
+    Working_Unit = "levels", 
+    interest_threshold = 8000)
+
+write_rds(
+  sim_ROC_levels,
+  "data/output/datasets/sim_ROC_levels_compress.rds",
+  compress = "gz")
+
+sim_ROC_bins <- 
+  fc_estimate_RoC_by_all_methods(
+    simulated_dataset,
+    Working_Unit = "bins",
+    bin_size = 500, 
+    Number_of_shifts = 1,
+    interest_threshold = 8000)
+
+write_rds(
+  sim_ROC_bins,
+  "data/output/datasets/sim_ROC_bins_compress.rds",
+  compress = "gz")
+
+
+sim_ROC_MW <- 
+  fc_estimate_RoC_by_all_methods(
+    simulated_dataset,
+    Working_Unit = "MW",
+    bin_size = 500, 
+    Number_of_shifts = 5,
+    interest_threshold = 8000)
+
+write_rds(
+  sim_ROC_MW,
+  "data/output/datasets/sim_ROC_MW_compress.rds",
+  compress = "gz")
+
+
+#----------------------------------------------------------#
+# 3. Merge files -----
+#----------------------------------------------------------#
+sim_ROC_all <-
+  bind_rows(
+    tibble(sim_ROC_levels, WU = "levels"),
+    tibble(sim_ROC_bins, WU = "bins"),
+    tibble(sim_ROC_MW, WU = "MW")
+  ) %>% 
+  mutate(
+    calculation_ID = paste0(WU, calculation_number) %>% 
+      as.factor() %>% 
+      as.numeric())  %>% 
+  dplyr::select(dataset_ID, calculation_ID, everything()) %>% 
+  arrange(dataset_ID, calculation_ID)
+
+sim_ROC_all$calculation_ID %>% 
+  unique() %>% 
+  length()
+
+sim_ROC_all$dataset_ID %>% 
+  unique() %>% 
+  length()
+
+write_rds(
+  sim_ROC_all,
+  "data/output/datasets/simulated_roc.rds",
+  compress = "gz")
+
+#----------------------------------------------------------#
+# 4. Detect sucesss of peak points  -----
+#----------------------------------------------------------#
+
+perform_sim <-  fc_test_success_in_simulated_data(sim_ROC_all)
+
+write_rds(perform_sim, "data/output/datasets/simulated_success.rds")
+