Presentación de dos librerías con funciones del paquete estadístico R, desarrolladas por la Dirección Nacional de Mercados y Estadística del Ministerio de Turismo y Deportes de la Nación
A lo largo del último año y medio, la DNMyE se ha puesto como objetivo mejorar los productos ya existentes, desarrollar nuevos y avanzar en la sistematización y automatización de los flujos de trabajo que hacen posible lo mencionado anteriormente. Un primer gran resultado que hemos alcanzado con este proyecto es la creación del Sistema de Información Turística de la Argentina (SINTA).
En paralelo, esta oficina estadística se ha propuesto avanzar en la transparencia y apertura tanto de los datos que produce como de los procesos que se llevan adelante para la generación de información. En este camino hemos decidido incorporar como herramienta de trabajo para el procesamiento de datos (y más) al lenguaje de programación estadística R1 y la plataforma Rstudio2. Esto nos permitió, por un lado, disponer del basto conjunto de librerías disponibles tanto para el procesamiento de datos en general como para todo aquello que lo rodea (validación y visualización de la información, diseño de plataformas para la presentación de los productos, organización de flujos de trabajo, entre otros).
Por otro lado, una de las potencialidades de los esquemas del software de código abierto con licencia libre es la capacidad que tienen las personas, institutos, empresas y también diferentes organismos del Estado para contribuir en el desarrollo de herramientas, sea tanto para uso interno como externo. Es en este sentido que desde la DNMyE avanzamos en la creación de dos librerías en R que nos faciliten el día a día en dos aspectos esenciales para la Dirección: el procesamiento de datos y la comunicación de la información.
{comunicacion}
{comunicacion}
ofrece un set de funciones que facilitan la visualización y presentación de la información estadística en la DNMyE, basados en el conjunto de lineamientos del Manual de marca institucional de Presidencia de la Nación Argentina, sea para logotipos, paletas de colores o piezas de comunicación.
crear_informes()
ponemos a disposición un esqueleto de la estructura de nuestros informes. La idea es que los y las técnicas de la DNMyE no tengan que preocuparse por configuraciónes de formato, estética y se puedan enfocar, principalmente, en el procesamiento y análisis de la información.scale_fill_dnmye()
podemos alinear el conjunto de visualizaciones que producimos con los lineamientos del manual de estilo. Por ejemplo:Además, creamos funciones para setear de forma manual los colores institucionales, como dnmye_colores()
y otras para, por ejemplo, generar el código necesario que permita agrupar múltiples fragmentos de Rmarkdown en pestañas, como rmdautotabs()
3.
{herramientas}
El objetivo del paquete es proveer a la Dirección Nacional de Mercados y Estadísticas de un set de funciones para el procesamiento de datos. Entre las principales se pueden encontrar:
remover_tildes()
: Función que elimina tildes de las vocales y la letra “y”:herramientas::remover_tildes("Uná oráción lléná de tíldes")
[1] "Una oracion llena de tildes"
numeros_en_palabras()
: Función que transforma dígitos del 0 al 100 en palabras:herramientas::numeros_en_palabras(c(1, 01, 54, "25 de mayo"))
[1] "uno" "uno" "cincuenta y cuatro"
[4] "veinticinco de mayo"
limpiar_texto()
: Función que aplica limpieza general del texto:herramientas::limpiar_texto("Téxtó lleno de tíldés mál puestás y eñes por todos ñados")
[1] "texto lleno de tildes mal puestas y enes por todos nados"
%out%
: Valores no contenidos dentro de un conjunto.
tasa_variacion()
: Calcula la tasa de variación con respecto al período previo según se defina.
set_user_srv()
: Guía para la configuración de las credenciales en .Renviron
archivo_plano_srv()
Devuelve las líneas de una archivo plano en el server, es para usar junto a read.csv()
y otras funciones de lectura de archivos plano.
read_rds_srv()
y read_sav_srv()
: Leen especificamente esos tipo de archivos mediante gzcon()
y getBinaryURL()
write_file_srv
: Hace una conexión a la ruta indicada dentro del servidor de la DNMyE y escribe un archivo .csv, .rds, .txt o .sav
Para facilitar el acceso a estas funciones a diferentes usuarios por fuera de la DNMyE, hemos abierto el repositorio desde el cual desarrollamos la librería y, también, hemos puesto a disposición la documentación correspondiente para entender y aplicar estas herramientas. También abrimos un espacio para que, quien lo desee, pueda contribuir con aportes al desarrollo de los paquetes. Para ello recomendamos leer la documentación del repositorio y la guía para contribuir
Con este camino recorrido, la DNMyE se ha propuesto avanzar en el desarrollo de herramientas para facilitar y mejorar el procesamiento de datos y, al mismo tiempo, continuar con la apertura de datos y procesos.
R Core Team (2022). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.↩︎
RStudio Team (2022). RStudio: Integrated Development Environment for R. RStudio, PBC, Boston, MA. URL http://www.rstudio.com/.↩︎
Tomado del paquete sknifedatar↩︎