Saltar al contenido

Funciones repetitivas en R

Para iniciar esta serie sobre las funciones loop en R vamos a usar un archivo que contiene los datos sobre la epidemia COVID-19 en Tlaxcala, que está disponible en este enlace.

El archivo se ve de esta manera:

fecha, positivos, negativos, sospechosos, recuperados, defunciones
2020-07-01, 2541, 3565, 817, 1659, 367
2020-07-02, 2591, 3612, 873, 1659, 382
2020-07-03, 2668, 3701, 977, 1659, 389

Y sobre estos datos vamos a ejecutar las funciones loop iniciando con la función lapply().

Lo que hace esta función es que itera sobre una lista (de ahí viene la l, de lista), creando un ciclo para cada elemento de esa lista; aplica la función especificada a cada elemento; por último, regresa una lista. El propotipo de la función es el siguiente:

lapply(x, función, ...)

El primer argumento es una lista x; el segundo función es el nombre de la función que se va a aplicar y el tercer argumento, ... son otros argumentos que se van a pasar función. Si x no es una lista, se transformará en una usando la función as.list().

Algo importante a tener en cuenta es que la función lapply() siempre regresa una lista, sin importar el tipo de entrada que reciba.

La funciones *apply() (lapplysapplymapplyvapply y tapply) ofrecen una forma muy conveniente de implementar estrategias de Dividir-Aplicar-Combinar para análisis de datos.

Cada una de estas funciones dividen los datos en partes más pequeñas, se aplica la función a cada pieza, luego se combinan los resultados. Esta estrategía se definió en el documento “The Split-Apply-Combine Strategy for Data Analysis” de Hadley Wickman publicado en el Journal of Statistical Software.

Foto de Road Ahead en Unsplash

Etiquetas:

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.