##Introducci?n a R ##Modulo 4 ##Video 4 ##Importar tabla desde pdf online library(tabulizer) library(tibble) library(openxlsx) #esta es la direcci?n del archivo de donde se extraer? (tabla de inter?s en las pp 28 a 31) germanwatch <- "https://germanwatch.org/sites/germanwatch.org/files/Global%20Climate%20Risk%20Index%202019_2.pdf" out <- extract_tables(germanwatch) #tambi?n se podr?a utilizar con un pdf en el computador #out es una lista que contiene todas los elementos extraidos desde el archivo PDF. #Al analizar esta lista es posible identificar que los elementos de inter?s #est?n en los objetos 7, 8, 9 y 10. #Sabiendo esto podemos extraer estos objetos y manipularlos para lograr obtener un *data frame* out <- out[7:10] # seleccionando los objetos de inter?s # Transformaci?n de listas a tibble/dataframe con un loop out1 <- as_tibble(out[[1]][-c(1:3),c(1:3)]) for (i in 2:4){ nom <- paste("out", i, sep = "") #esta funci?n ya la vimos assign(nom, as_tibble(out[[i]][-c(1:2),c(2:4)])) #?assign } #Un ejemplo básico de loop como referencia for (i in 1:5) { print(i) } #Cada uno de estos *data frame* representa una parte de toda la tabla de inter?s. # Unir los data frame en uno solo CRI <- rbind(out1, out2, out3, out4) #o bind_rows del paquete dplyr (tambi?n de tidyverse) colnames(CRI) <- c("CRI Rank", "Country", "CRI Score") # Asignando nombres a cada columna write.xlsx(CRI, "datos_exportados/CRI.xlsx")