Importar, explorar y limpiar datos
0. Objetivo del práctico
Este práctico tiene por objeto introducir a las y los estudiantes del curso en herramientas que les permitan a) importar bases de datos en diversos formatos; b)seleccionar variables de las bases de datos importadas; c) limpiar los datos, eliminando las filas con casos perdidos; y d) exportar bases de datos procesadas. Para ello, se trabajará con los paquetes haven
(que forma parte, a su vez, del mundo de paquetes tidyverse
), y dplyr
, para poder importar y exportar los datos, y manipular estos datos, respectivamente.
1. Recursos de la práctica
Para el correcto trabajo de estos materiales, deben descargar los datos de la Encuesta de Caracterización Socioeconómica (CASEN) en su versión 2020. Para ello, deben dirigirse al siguiente enlace, descargar el archivo en .zip y luego input/data de su repositorio. Para descomprimir los archivos revisen. Cuando lo hayan logrado verán la base en formato SPPS Casen en Pandemia 2020 SPSS.sav
o en STATA Casen en Pandemia 2020 SPSS.dta
Recuerden siempre consultar el manual/libro de códigos antes de trabajar una base de datos.
2. Librerias a utilizar
En este práctico utilizaremos cuatro paquetes
-
pacman
: este facilita y agiliza la lectura de los paquetes a utilizar en R -
sjmisc
: explorar datos -
tidyverse
: colección de paquetes, del cuál utilizaremosdplyr
yhaven
-
haven
: cargar y exportar bases de datos en formatos .sav y .dta -
readxl
ywritexl
: para cargar y exportar bases de datos en formato .xlsx y .xls -
dplyr
: nos permite seleccionar variables de un set de datos
Pasos del procesamiento
1. Cargar librerías
Dado que ya cargamos pacman
en el práctico anterior, no lo debemos volver a instalar. Ahora bien, si cargaremos los nuevos paquetes. Les recordamos que cuando luego de un paquete ponemos ::
esto se refiere a que se “fuerza” que esa función provenga de ese paquete
pacman::p_load(sjmisc,
sjPlot,
tidyverse,
haven,
readxl,
writexl)
2. Importar datos
Para poder realizar análisis estadístico de cualquier tipo, el primer paso - sin considerar, por supuesto, la formulación de un problema de investigación, y la búsqueda de datos que permitan resolverlo - es importar una base de datos. Por razones obvias, si no hemos cargados los datos en el entorno, no seremos capaces de realizar ningún otro procedimiento, ni de preparación de los datos - por ejemplo, seleccionar variables, recodificarlas, construir variables sumativas, entre otros -, ni de análisis de estos - ya sean descriptivos, relacionales, explicativos, y así.
Una de las bondades de R es que es posible importar fácilmente datos que se encuentren en cualquier formato: ya sea .csv, .dta, .sav, .xlsx y, por supuesto, .RData. Para poder hacerlo, sin embargo, lo primero es instalar y cargar las librerías que contienen las funciones necesarias para la importación de distintos tipos de archivos.
2.1. Cargar set de datos
Una vez cargado el paquete haven
, procedemos a importar los datos anteriormente mencionados. Para ello, en nuestro script, dejamos indicado que a partir de la lectura de los datos con read_sav()
, crearemos un objeto llamado datos
. Si este procedimiento se logra, esto aparecerá en el Enviroment.
Antes ¿dónde están nuestros datos? Por lo general, nuestros datos los dejaremos en la carpeta input/data
. En el siguiente enlace podrán descargar el archivo .zip que contiene la base de CASEN. Si aún no sabes como descomprimir datos, por favor revisa aquí.
Luego de que hayas descargado y descomprimido los datos asegurate de dejar el archivo .sav
y .dta
en la carpeta de tu proyecto input/data
. Los datos se llamarán en formato SPPS Casen en Pandemia 2020 SPSS.sav
o en STATA Casen en Pandemia 2020 SPSS.dta
.
Para importar los datos en R debemos tener en consideración tres cosas:
-
Cómo se llaman los datos (en nuestro caso Casen en Pandemia 2020 SPSS)
-
El formato de nuestros datos (en nuestro caso .sav)
-
El lugar de donde están alojados nuestros datos.
El paquete haven
tiene una serie de funciones para cargar datos llamadas read_*
(el asterisco indica el formato). Para oculparlo solo debes tener en claro los puntos anteriores
`read_*(“ruta_hacia_archivo/nombre_archivo.*"``. En nuestro caso:
datos <- read_sav("Casen en Pandemia 2020 SPSS.sav") # No funciona
datos <- read_sav("input/data/casen en pandemia 2020 SPSS.sav") # No funciona
datos <- read_sav("input/data/Casen en Pandemia 2020 SPSS.sav")
Los dos primeros comandos no funcionan porque
-
La ruta no está bien definida
-
El nombre de la base no es exacto
¡Dos errores muy frecuentes cuando uno se inicia! Ahora, ¿cómo se si está bien mi base? Primero, notarás que en tu Enviroment se ha creado un objeto. En nuestro caso objeto posee650 variables (columnas), pero conserva las filas 185.437 (u observaciones)
¡Ahora es tu turno! Intenta hacer este procedimiento con los datos en .dta
. También puedes encontrar este archivo en el enlace.
2.1.1 Cargar set de datos en otros formatos.
Ahora bien, no siempre este procedimiento será tan fácil sobre todo pues no siempre vendrán en formatos “limpios”. La gran forma de lidiar con eso es con la manipulación de datos (algo que nos tomará tiempo en este curso), pero de todas formas es de gran ayuda utilizar de manera correcta la importación de datos. Nos puede solucionar varios problemas de codificación y lectura.
Para poder abordar esto de la mejor manera es necesario utilizar funciones ad hoc al formato de nuestros datos. Como se mencionó anteriormente, con R es muy flexible en esto. En los siguientes pasos les mostraremos como cargar en otros formatos y reconociendo algunos de los problemas comunes con los cuáles te encontrarás (de seguro…)
a) .dta
Este es el formato específico de base de datos para STATA. Por ello, utilizaremos la función read_dta()
(también está como read_stata()
), incluida en el paquete haven
.
b) .RData y .rds
¿Y R tiene formato de datos? ¡Sí! Como son propios del programa no es necesario cargar paquetes pues sus funciones provienen del paquete base
. La diferencia básica entre .RData
y .rds
es que .rds
puede contener solo un objeto del Enviroment de R, mientras que .RData
puede contener múltiples objetos que han sido guardados en .rds
.
Leer un objeto proveniente de un archivo
readRDS(file = “datos.rds”)
Leer múltiples objetos a un archivo load(file = “datos.RData”)
Además de nunca olvidar la ruta, no debes olvidar una diferencia de codificación entre ambas funciones: con load()
los objetos se cargan automáticamente en el ambiente, mientras que en readRDS()
no. Solamente “llama” a los archivos, pero no los deja como un objeto dentro del Enviroment.
load(file = "input/data/CASEN.RData")
readRDS(file = "input/data/CASEN.rds")
## # A tibble: 100 x 5
## id region sexo pobreza ocupacion
## <dbl> <dbl+lbl> <dbl+lbl> <dbl+lbl> <chr>
## 1 502 16 [Región de Ñuble] 2 [Mujer] 3 [No pobre~ <NA>
## 2 184 6 [Región del Libertador~ 2 [Mujer] 3 [No pobre~ <NA>
## 3 308 8 [Región del Biobío] 2 [Mujer] 3 [No pobre~ <NA>
## 4 531 6 [Región del Libertador~ 1 [Hombr~ 3 [No pobre~ COSECHA DE GUINDAS
## 5 115 3 [Región de Atacama] 2 [Mujer] 3 [No pobre~ <NA>
## 6 261 5 [Región de Valparaíso] 2 [Mujer] 3 [No pobre~ <NA>
## 7 171 3 [Región de Atacama] 1 [Hombr~ 3 [No pobre~ ATENCIÓN PARADERO CO~
## 8 333 7 [Región del Maule] 1 [Hombr~ 1 [Pobres e~ RECOLECTOR DE HORTAL~
## 9 69 14 [Región de Los Ríos] 1 [Hombr~ 3 [No pobre~ EMPRESARIO DISTRIBUC~
## 10 440 4 [Región de Coquimbo] 1 [Hombr~ 2 [Pobres n~ <NA>
## # ... with 90 more rows
datos <- readRDS(file = "input/data/CASEN.rds")
¿Solo contiene datos? ¡No! Además de que puede contener múltiples datos, puede guardar otros objetos que se creen en su proceso estadístico. Por ejemplo, modelos ¡Lo veremos más adelante!
c) .csv
Los archivos en .csv
o .txt
son de frecuente uso dado que son más livianos que un archivo en .dta
o .sav
por el meta-data que contienen (información adicional, además de columnas-filas). El paquete utils
de R base
tiene una función de muy buena calidad llamada read.table
(read.csv()
para archivos en .csv
y read.delim()
para archivos en .txt
)
Su estructura es muy simple read.*(file = "datos.*")
. Ahora bien tiene una serie de argumentos que permiten leer de mejor manera los archivos y de seguro los ocuparás:
-
[
sep
]: indica con qué están separadas las columnas (; , -) -
[
dec
]: indica como están separados los decimales (. ,) -
[
na-strings
]: indica como están codificados losNA
(¡podría ser más de una forma!) -
[
encoding
]:puede serUTF-8
oLatin-1
-
[
skip
]: indica el número de filas que hay que saltarse (no siempre los csv y excel parten en la primera fila). El argumentonrow
indica el número de filas máximas a leer -
[
stringsAsFactors
]: si se indica verdadero (TRUE
) los carácteres serán transformados en factores, lo cuál será muy útil en caso de necesitar hacer análisis.
datos <- read.csv("input/data/CASEN.csv", sep=",",
encoding = "UTF-8", stringsAsFactors = F)
head(datos)
Muchos problemas, ¡vamos solucionado!
datos <- read.csv("input/data/CASEN.csv", sep=";",
encoding = "Latin-1", stringsAsFactors = F, na.strings = c("No sabe", NA))
d) .xlsx
A partir del paquete readxl
de tidyverse
podremos obtener datos que provienen de Excel (tanto en formato .xls
como .xlsx
). Ocuparemos la función read_excel()
, la cual tiene similares argumentos a read.csv()
read_excel("datos.xlsx", sheet = "Hoja 1", range = "A1:C40")
read_excel("datos.xlsx", sheet = 2, skip = 4, na = "No sabe")
datos <- readxl::read_excel(path = "input/data/CASEN.xlsx")
¡Hemos sido engañados/as! ¿Cómo solucionar?
datos <- readxl::read_excel(path = "input/data/CASEN.xlsx", sheet = "Hoja1", skip = 1)
datos <- readxl::read_excel(path = "input/data/CASEN.xlsx", sheet = "Hoja1", skip = 1, na = "NA")
Para seguir con este ejercicio volvamos a utilizar la base original en .dta
datos <- read_dta("input/data/Casen en Pandemia 2020 SPSS.dta")
3. Explorar datos
Lo más probable es que, una vez importados los datos a utilizar, no trabajemos con el total de variables incluidas en estos (que, en este caso, suman un total de 650 columnas). Es por ello, que debemos seleccionar las variables de interés para resolver nuestro problema de investigación (sea el que sea).
Antes de seleccionar las variables debemos explorar nuestros datos, si no ¿cómo saber qué seleccionar y qué no? En R base las funciones clásicas para explorar datos son
View(datos) # Ver datos
names(datos) # Nombre de columnas
dim(datos) # Dimensiones
str(datos) # Estructura de los datos (las clases y categorias de repuesta)
A pesar de que son fáciles de aprender, no tienen una visualización muy amena. Un excelente paquete para explorar datos es sjmisc
quien tiene tres funciones claves:
-
[
View_df()
]: que en el visor “Viewer” les mostrará una tabla que tiene el nombre de variable, etiqueta y categorías de respuesta -
[
find_var()
]: que permite indagar en variables que estamos buscando según sus temáticas -
[
frq()
]: nos otorga la distribución univariada de variables categóricas que estamos explorando -
[
descr()
]: nos otorga estadísticos de tendencia central para la variable numérica seleccionada.
Ver datos en el visor
sjPlot::view_df(datos)
Buscar variables sobre temáticas relacionadas a “vivienda” (no olvides dejarla entre comillas)
find_var(datos, "pobreza")
## col.nr var.name
## 1 584 pobreza
## 2 586 pobreza_sinte
## 3 579 lp
## var.label
## 1 Situación de pobreza por ingresos
## 2 Situación de pobreza por ingresos sin transferencia Covid
## 3 Línea de pobreza
find_var(datos, "salario")
## col.nr var.name
## 1 108 y1
## 2 375 y0101
## 3 465 y0101h
## 4 557 y0101c
## 5 563 y0101ch
## var.label
## 1 y1. Mes pasado, monto Sueldo o salario líquido en su trabajo principal
## 2 Asalariados principal - Sueldos y salarios monetario
## 3 Asalariados principal - Sueldos y salarios monetario
## 4 Asalariados principal - Sueldos y salarios monetario corregido
## 5 Asalariados principal - Sueldos y salarios monetario corregido
Explorar distirbución de las variables
frq(datos$pobreza)
##
## Situación de pobreza por ingresos (x) <numeric>
## # total N=185437 valid N=185339 mean=2.84 sd=0.48
##
## Value | Label | N | Raw % | Valid % | Cum. %
## --------------------------------------------------------------
## 1 | Pobres extremos | 8439 | 4.55 | 4.55 | 4.55
## 2 | Pobres no extremos | 12891 | 6.95 | 6.96 | 11.51
## 3 | No pobres | 164009 | 88.44 | 88.49 | 100.00
## <NA> | <NA> | 98 | 0.05 | <NA> | <NA>
frq(datos$y1) #¡Qué feo!
## [[1]]
## val label frq raw.prc valid.prc cum.prc
## 1 1200 <none> 1 0.00 0.00 0.00
## 2 1800 <none> 1 0.00 0.00 0.00
## 3 2000 <none> 1 0.00 0.00 0.01
## 4 2222 <none> 1 0.00 0.00 0.01
## 5 6000 <none> 2 0.00 0.00 0.01
## 6 7000 <none> 1 0.00 0.00 0.02
## 7 8073 <none> 1 0.00 0.00 0.02
## 8 10000 <none> 6 0.00 0.01 0.03
## 9 12000 <none> 1 0.00 0.00 0.04
## 10 14000 <none> 1 0.00 0.00 0.04
## 11 15000 <none> 11 0.01 0.03 0.07
## 12 16000 <none> 2 0.00 0.00 0.07
## 13 17000 <none> 2 0.00 0.00 0.08
## 14 18000 <none> 2 0.00 0.00 0.08
## 15 20000 <none> 22 0.01 0.05 0.14
## 16 21800 <none> 1 0.00 0.00 0.14
## 17 22000 <none> 1 0.00 0.00 0.14
## 18 24000 <none> 3 0.00 0.01 0.15
## 19 25000 <none> 9 0.00 0.02 0.17
## 20 25300 <none> 1 0.00 0.00 0.17
## 21 26000 <none> 1 0.00 0.00 0.18
## 22 27000 <none> 1 0.00 0.00 0.18
## 23 27900 <none> 1 0.00 0.00 0.18
## 24 28000 <none> 3 0.00 0.01 0.19
## 25 29000 <none> 1 0.00 0.00 0.19
## 26 30000 <none> 47 0.03 0.12 0.31
## 27 31000 <none> 1 0.00 0.00 0.31
## 28 32000 <none> 4 0.00 0.01 0.32
## 29 32050 <none> 1 0.00 0.00 0.32
## 30 32650 <none> 1 0.00 0.00 0.32
## 31 33000 <none> 2 0.00 0.00 0.33
## 32 34000 <none> 2 0.00 0.00 0.33
## 33 35000 <none> 8 0.00 0.02 0.35
## 34 36000 <none> 2 0.00 0.00 0.36
## 35 37000 <none> 1 0.00 0.00 0.36
## 36 38000 <none> 1 0.00 0.00 0.36
## 37 40000 <none> 54 0.03 0.13 0.50
## 38 41000 <none> 1 0.00 0.00 0.50
## 39 42000 <none> 3 0.00 0.01 0.51
## 40 43000 <none> 1 0.00 0.00 0.51
## 41 44000 <none> 1 0.00 0.00 0.51
## 42 44600 <none> 1 0.00 0.00 0.51
## 43 45000 <none> 17 0.01 0.04 0.56
## 44 46000 <none> 1 0.00 0.00 0.56
## 45 47000 <none> 1 0.00 0.00 0.56
## 46 48000 <none> 1 0.00 0.00 0.56
## 47 49000 <none> 1 0.00 0.00 0.57
## 48 50000 <none> 102 0.06 0.25 0.82
## 49 52000 <none> 1 0.00 0.00 0.82
## 50 53000 <none> 1 0.00 0.00 0.82
## 51 55000 <none> 3 0.00 0.01 0.83
## 52 56000 <none> 2 0.00 0.00 0.84
## 53 57000 <none> 2 0.00 0.00 0.84
## 54 58000 <none> 1 0.00 0.00 0.84
## 55 60000 <none> 110 0.06 0.27 1.12
## 56 62000 <none> 4 0.00 0.01 1.13
## 57 63000 <none> 1 0.00 0.00 1.13
## 58 64000 <none> 5 0.00 0.01 1.14
## 59 65000 <none> 6 0.00 0.01 1.16
## 60 68000 <none> 4 0.00 0.01 1.17
## 61 70000 <none> 57 0.03 0.14 1.31
## 62 70500 <none> 1 0.00 0.00 1.31
## 63 71000 <none> 2 0.00 0.00 1.31
## 64 72000 <none> 5 0.00 0.01 1.33
## 65 74000 <none> 2 0.00 0.00 1.33
## 66 75000 <none> 18 0.01 0.04 1.38
## 67 77000 <none> 2 0.00 0.00 1.38
## 68 78000 <none> 2 0.00 0.00 1.39
## 69 79000 <none> 1 0.00 0.00 1.39
## 70 80000 <none> 137 0.07 0.34 1.73
## 71 82000 <none> 3 0.00 0.01 1.73
## 72 83000 <none> 1 0.00 0.00 1.74
## 73 84000 <none> 2 0.00 0.00 1.74
## 74 85000 <none> 3 0.00 0.01 1.75
## 75 86000 <none> 2 0.00 0.00 1.75
## 76 87000 <none> 1 0.00 0.00 1.76
## 77 88000 <none> 1 0.00 0.00 1.76
## 78 89000 <none> 1 0.00 0.00 1.76
## 79 90000 <none> 47 0.03 0.12 1.88
## 80 92000 <none> 2 0.00 0.00 1.88
## 81 95000 <none> 6 0.00 0.01 1.90
## 82 96000 <none> 6 0.00 0.01 1.91
## 83 97000 <none> 1 0.00 0.00 1.91
## 84 97500 <none> 2 0.00 0.00 1.92
## 85 98000 <none> 6 0.00 0.01 1.93
## 86 100000 <none> 328 0.18 0.81 2.75
## 87 100003 <none> 1 0.00 0.00 2.75
## 88 100008 <none> 1 0.00 0.00 2.75
## 89 101000 <none> 1 0.00 0.00 2.75
## 90 104000 <none> 3 0.00 0.01 2.76
## 91 105000 <none> 7 0.00 0.02 2.78
## 92 106000 <none> 2 0.00 0.00 2.78
## 93 107000 <none> 2 0.00 0.00 2.79
## 94 108000 <none> 1 0.00 0.00 2.79
## 95 109000 <none> 2 0.00 0.00 2.80
## 96 110000 <none> 38 0.02 0.09 2.89
## 97 111000 <none> 1 0.00 0.00 2.89
## 98 112000 <none> 2 0.00 0.00 2.90
## 99 112500 <none> 1 0.00 0.00 2.90
## 100 113000 <none> 3 0.00 0.01 2.91
## 101 114000 <none> 1 0.00 0.00 2.91
## 102 115000 <none> 5 0.00 0.01 2.92
## 103 116000 <none> 2 0.00 0.00 2.93
## 104 117000 <none> 1 0.00 0.00 2.93
## 105 118000 <none> 2 0.00 0.00 2.93
## 106 118800 <none> 1 0.00 0.00 2.94
## 107 120000 <none> 237 0.13 0.59 3.52
## 108 120300 <none> 1 0.00 0.00 3.53
## 109 121000 <none> 1 0.00 0.00 3.53
## 110 122000 <none> 1 0.00 0.00 3.53
## 111 123000 <none> 3 0.00 0.01 3.54
## 112 124000 <none> 2 0.00 0.00 3.54
## 113 125000 <none> 11 0.01 0.03 3.57
## 114 126000 <none> 2 0.00 0.00 3.58
## 115 127000 <none> 1 0.00 0.00 3.58
## 116 128000 <none> 6 0.00 0.01 3.59
## 117 129000 <none> 1 0.00 0.00 3.59
## 118 130000 <none> 100 0.05 0.25 3.84
## 119 131000 <none> 1 0.00 0.00 3.84
## 120 132000 <none> 7 0.00 0.02 3.86
## 121 133000 <none> 4 0.00 0.01 3.87
## 122 134000 <none> 3 0.00 0.01 3.88
## 123 135000 <none> 10 0.01 0.02 3.90
## 124 136000 <none> 1 0.00 0.00 3.91
## 125 140000 <none> 63 0.03 0.16 4.06
## 126 141000 <none> 1 0.00 0.00 4.07
## 127 141681 <none> 1 0.00 0.00 4.07
## 128 142000 <none> 3 0.00 0.01 4.07
## 129 143000 <none> 1 0.00 0.00 4.08
## 130 144000 <none> 5 0.00 0.01 4.09
## 131 144444 <none> 1 0.00 0.00 4.09
## 132 145000 <none> 7 0.00 0.02 4.11
## 133 146000 <none> 5 0.00 0.01 4.12
## 134 147000 <none> 2 0.00 0.00 4.13
## 135 148000 <none> 1 0.00 0.00 4.13
## 136 150000 <none> 416 0.22 1.03 5.16
## 137 150090 <none> 1 0.00 0.00 5.16
## 138 151000 <none> 2 0.00 0.00 5.17
## 139 152000 <none> 2 0.00 0.00 5.17
## 140 153000 <none> 1 0.00 0.00 5.17
## 141 154000 <none> 1 0.00 0.00 5.18
## 142 155000 <none> 1 0.00 0.00 5.18
## 143 156000 <none> 5 0.00 0.01 5.19
## 144 157000 <none> 2 0.00 0.00 5.20
## 145 157388 <none> 1 0.00 0.00 5.20
## 146 158000 <none> 2 0.00 0.00 5.20
## 147 159000 <none> 1 0.00 0.00 5.21
## 148 159479 <none> 1 0.00 0.00 5.21
## 149 160000 <none> 124 0.07 0.31 5.51
## 150 160250 <none> 1 0.00 0.00 5.52
## 151 161000 <none> 1 0.00 0.00 5.52
## 152 162000 <none> 2 0.00 0.00 5.52
## 153 163000 <none> 2 0.00 0.00 5.53
## 154 164000 <none> 3 0.00 0.01 5.54
## 155 165000 <none> 16 0.01 0.04 5.58
## 156 165800 <none> 1 0.00 0.00 5.58
## 157 166556 <none> 1 0.00 0.00 5.58
## 158 167000 <none> 3 0.00 0.01 5.59
## 159 168000 <none> 3 0.00 0.01 5.60
## 160 169999 <none> 1 0.00 0.00 5.60
## 161 170000 <none> 66 0.04 0.16 5.76
## 162 172000 <none> 4 0.00 0.01 5.77
## 163 173000 <none> 5 0.00 0.01 5.78
## 164 174000 <none> 4 0.00 0.01 5.79
## 165 175000 <none> 13 0.01 0.03 5.83
## 166 176000 <none> 3 0.00 0.01 5.83
## 167 177000 <none> 1 0.00 0.00 5.84
## 168 178000 <none> 6 0.00 0.01 5.85
## 169 179000 <none> 2 0.00 0.00 5.86
## 170 180000 <none> 246 0.13 0.61 6.46
## 171 182000 <none> 7 0.00 0.02 6.48
## 172 183000 <none> 2 0.00 0.00 6.49
## 173 184000 <none> 3 0.00 0.01 6.49
## 174 185000 <none> 4 0.00 0.01 6.50
## 175 186000 <none> 4 0.00 0.01 6.51
## 176 187000 <none> 2 0.00 0.00 6.52
## 177 188000 <none> 3 0.00 0.01 6.53
## 178 189000 <none> 3 0.00 0.01 6.53
## 179 190000 <none> 57 0.03 0.14 6.68
## 180 191000 <none> 1 0.00 0.00 6.68
## 181 192000 <none> 5 0.00 0.01 6.69
## 182 193000 <none> 1 0.00 0.00 6.69
## 183 194000 <none> 3 0.00 0.01 6.70
## 184 195000 <none> 4 0.00 0.01 6.71
## 185 196000 <none> 7 0.00 0.02 6.73
## 186 196736 <none> 1 0.00 0.00 6.73
## 187 197000 <none> 2 0.00 0.00 6.73
## 188 198000 <none> 3 0.00 0.01 6.74
## 189 200000 <none> 854 0.46 2.11 8.85
## 190 200002 <none> 1 0.00 0.00 8.86
## 191 201000 <none> 1 0.00 0.00 8.86
## 192 202000 <none> 1 0.00 0.00 8.86
## 193 203156 <none> 1 0.00 0.00 8.86
## 194 204000 <none> 3 0.00 0.01 8.87
## 195 204800 <none> 1 0.00 0.00 8.87
## 196 205000 <none> 9 0.00 0.02 8.90
## 197 206000 <none> 1 0.00 0.00 8.90
## 198 208000 <none> 3 0.00 0.01 8.91
## 199 209000 <none> 3 0.00 0.01 8.91
## 200 210000 <none> 62 0.03 0.15 9.07
## 201 211000 <none> 4 0.00 0.01 9.08
## 202 212000 <none> 4 0.00 0.01 9.09
## 203 213000 <none> 7 0.00 0.02 9.10
## 204 214000 <none> 5 0.00 0.01 9.12
## 205 215000 <none> 11 0.01 0.03 9.14
## 206 216000 <none> 7 0.00 0.02 9.16
## 207 217000 <none> 4 0.00 0.01 9.17
## 208 218000 <none> 6 0.00 0.01 9.19
## 209 219000 <none> 5 0.00 0.01 9.20
## 210 220000 <none> 174 0.09 0.43 9.63
## 211 221000 <none> 1 0.00 0.00 9.63
## 212 222000 <none> 1 0.00 0.00 9.63
## 213 222400 <none> 1 0.00 0.00 9.64
## 214 223000 <none> 2 0.00 0.00 9.64
## 215 224000 <none> 4 0.00 0.01 9.65
## 216 225000 <none> 50 0.03 0.12 9.78
## 217 226000 <none> 6 0.00 0.01 9.79
## 218 227000 <none> 3 0.00 0.01 9.80
## 219 228000 <none> 2 0.00 0.00 9.80
## 220 229000 <none> 1 0.00 0.00 9.81
## 221 230000 <none> 121 0.07 0.30 10.10
## 222 230500 <none> 1 0.00 0.00 10.11
## 223 231000 <none> 1 0.00 0.00 10.11
## 224 233000 <none> 1 0.00 0.00 10.11
## 225 234000 <none> 2 0.00 0.00 10.12
## 226 235000 <none> 7 0.00 0.02 10.13
## 227 236000 <none> 5 0.00 0.01 10.15
## 228 236858 <none> 1 0.00 0.00 10.15
## 229 237000 <none> 1 0.00 0.00 10.15
## 230 238000 <none> 2 0.00 0.00 10.16
## 231 240000 <none> 168 0.09 0.42 10.57
## 232 241000 <none> 1 0.00 0.00 10.57
## 233 242000 <none> 3 0.00 0.01 10.58
## 234 245000 <none> 14 0.01 0.03 10.62
## 235 246000 <none> 2 0.00 0.00 10.62
## 236 247000 <none> 3 0.00 0.01 10.63
## 237 248000 <none> 7 0.00 0.02 10.65
## 238 249000 <none> 3 0.00 0.01 10.65
## 239 250000 <none> 655 0.35 1.62 12.27
## 240 251000 <none> 2 0.00 0.00 12.28
## 241 252000 <none> 7 0.00 0.02 12.30
## 242 253000 <none> 3 0.00 0.01 12.30
## 243 254000 <none> 4 0.00 0.01 12.31
## 244 255000 <none> 8 0.00 0.02 12.33
## 245 255293 <none> 1 0.00 0.00 12.34
## 246 255760 <none> 1 0.00 0.00 12.34
## 247 256000 <none> 7 0.00 0.02 12.36
## 248 257000 <none> 3 0.00 0.01 12.36
## 249 258000 <none> 3 0.00 0.01 12.37
## 250 259000 <none> 5 0.00 0.01 12.38
## 251 260000 <none> 190 0.10 0.47 12.85
## 252 261000 <none> 5 0.00 0.01 12.87
## 253 261200 <none> 1 0.00 0.00 12.87
## 254 262000 <none> 2 0.00 0.00 12.87
## 255 263000 <none> 6 0.00 0.01 12.89
## 256 263681 <none> 1 0.00 0.00 12.89
## 257 264000 <none> 8 0.00 0.02 12.91
## 258 265000 <none> 8 0.00 0.02 12.93
## 259 266000 <none> 4 0.00 0.01 12.94
## 260 267000 <none> 1 0.00 0.00 12.94
## 261 268000 <none> 1 0.00 0.00 12.94
## 262 269000 <none> 1 0.00 0.00 12.95
## 263 270000 <none> 179 0.10 0.44 13.39
## 264 271000 <none> 2 0.00 0.00 13.40
## 265 272000 <none> 3 0.00 0.01 13.40
## 266 273000 <none> 4 0.00 0.01 13.41
## 267 274000 <none> 3 0.00 0.01 13.42
## 268 275000 <none> 12 0.01 0.03 13.45
## 269 276000 <none> 5 0.00 0.01 13.46
## 270 277000 <none> 7 0.00 0.02 13.48
## 271 278000 <none> 3 0.00 0.01 13.49
## 272 279000 <none> 1 0.00 0.00 13.49
## 273 280000 <none> 457 0.25 1.13 14.62
## 274 280088 <none> 1 0.00 0.00 14.62
## 275 281000 <none> 2 0.00 0.00 14.63
## 276 282000 <none> 5 0.00 0.01 14.64
## 277 283000 <none> 2 0.00 0.00 14.64
## 278 283883 <none> 1 0.00 0.00 14.65
## 279 284000 <none> 3 0.00 0.01 14.65
## 280 285000 <none> 20 0.01 0.05 14.70
## 281 286000 <none> 5 0.00 0.01 14.72
## 282 287000 <none> 3 0.00 0.01 14.72
## 283 288000 <none> 4 0.00 0.01 14.73
## 284 289000 <none> 3 0.00 0.01 14.74
## 285 289460 <none> 1 0.00 0.00 14.74
## 286 289737 <none> 1 0.00 0.00 14.75
## 287 290000 <none> 137 0.07 0.34 15.08
## 288 290500 <none> 1 0.00 0.00 15.09
## 289 291000 <none> 3 0.00 0.01 15.09
## 290 292000 <none> 5 0.00 0.01 15.11
## 291 293000 <none> 2 0.00 0.00 15.11
## 292 293790 <none> 1 0.00 0.00 15.11
## 293 294000 <none> 4 0.00 0.01 15.12
## 294 295000 <none> 14 0.01 0.03 15.16
## 295 296000 <none> 5 0.00 0.01 15.17
## 296 297000 <none> 4 0.00 0.01 15.18
## 297 298000 <none> 12 0.01 0.03 15.21
## 298 299000 <none> 1 0.00 0.00 15.21
## 299 300000 <none> 2304 1.24 5.70 20.91
## 300 300002 <none> 1 0.00 0.00 20.92
## 301 300003 <none> 1 0.00 0.00 20.92
## 302 300008 <none> 1 0.00 0.00 20.92
## 303 300500 <none> 1 0.00 0.00 20.92
## 304 301000 <none> 284 0.15 0.70 21.63
## 305 302000 <none> 15 0.01 0.04 21.66
## 306 303000 <none> 4 0.00 0.01 21.67
## 307 304000 <none> 6 0.00 0.01 21.69
## 308 305000 <none> 37 0.02 0.09 21.78
## 309 306000 <none> 25 0.01 0.06 21.84
## 310 307000 <none> 8 0.00 0.02 21.86
## 311 308000 <none> 12 0.01 0.03 21.89
## 312 308300 <none> 1 0.00 0.00 21.89
## 313 309000 <none> 10 0.01 0.02 21.92
## 314 310000 <none> 341 0.18 0.84 22.76
## 315 310504 <none> 1 0.00 0.00 22.76
## 316 311000 <none> 6 0.00 0.01 22.78
## 317 311100 <none> 1 0.00 0.00 22.78
## 318 312000 <none> 16 0.01 0.04 22.82
## 319 312500 <none> 1 0.00 0.00 22.82
## 320 313000 <none> 3 0.00 0.01 22.83
## 321 314000 <none> 13 0.01 0.03 22.86
## 322 315000 <none> 60 0.03 0.15 23.01
## 323 315692 <none> 1 0.00 0.00 23.01
## 324 316000 <none> 15 0.01 0.04 23.05
## 325 317000 <none> 6 0.00 0.01 23.07
## 326 318000 <none> 9 0.00 0.02 23.09
## 327 318027 <none> 1 0.00 0.00 23.09
## 328 318572 <none> 1 0.00 0.00 23.09
## 329 319000 <none> 61 0.03 0.15 23.24
## 330 320000 <none> 2873 1.55 7.11 30.35
## 331 320031 <none> 1 0.00 0.00 30.36
## 332 320500 <none> 60 0.03 0.15 30.50
## 333 321000 <none> 20 0.01 0.05 30.55
## 334 322000 <none> 32 0.02 0.08 30.63
## 335 323000 <none> 7 0.00 0.02 30.65
## 336 323500 <none> 1 0.00 0.00 30.65
## 337 324000 <none> 12 0.01 0.03 30.68
## 338 324345 <none> 1 0.00 0.00 30.68
## 339 325000 <none> 192 0.10 0.48 31.16
## 340 325090 <none> 1 0.00 0.00 31.16
## 341 326000 <none> 248 0.13 0.61 31.78
## 342 326500 <none> 107 0.06 0.26 32.04
## 343 327000 <none> 8 0.00 0.02 32.06
## 344 328000 <none> 5 0.00 0.01 32.07
## 345 328888 <none> 1 0.00 0.00 32.07
## 346 329000 <none> 6 0.00 0.01 32.09
## 347 329500 <none> 1 0.00 0.00 32.09
## 348 330000 <none> 306 0.17 0.76 32.85
## 349 331000 <none> 7 0.00 0.02 32.87
## 350 332000 <none> 6 0.00 0.01 32.88
## 351 332636 <none> 1 0.00 0.00 32.88
## 352 332703 <none> 1 0.00 0.00 32.89
## 353 333000 <none> 7 0.00 0.02 32.90
## 354 334000 <none> 5 0.00 0.01 32.92
## 355 335000 <none> 20 0.01 0.05 32.97
## 356 336000 <none> 10 0.01 0.02 32.99
## 357 336500 <none> 1 0.00 0.00 32.99
## 358 337000 <none> 3 0.00 0.01 33.00
## 359 338000 <none> 12 0.01 0.03 33.03
## 360 338500 <none> 1 0.00 0.00 33.03
## 361 339000 <none> 1 0.00 0.00 33.03
## 362 340000 <none> 270 0.15 0.67 33.70
## 363 341000 <none> 1 0.00 0.00 33.71
## 364 342000 <none> 6 0.00 0.01 33.72
## 365 343000 <none> 8 0.00 0.02 33.74
## 366 344000 <none> 4 0.00 0.01 33.75
## 367 345000 <none> 19 0.01 0.05 33.80
## 368 346000 <none> 5 0.00 0.01 33.81
## 369 347000 <none> 3 0.00 0.01 33.82
## 370 347336 <none> 1 0.00 0.00 33.82
## 371 348000 <none> 5 0.00 0.01 33.83
## 372 349000 <none> 4 0.00 0.01 33.84
## 373 349600 <none> 1 0.00 0.00 33.84
## 374 350000 <none> 2104 1.13 5.21 39.05
## 375 351000 <none> 4 0.00 0.01 39.06
## 376 352000 <none> 4 0.00 0.01 39.07
## 377 353320 <none> 1 0.00 0.00 39.07
## 378 354000 <none> 6 0.00 0.01 39.09
## 379 355000 <none> 10 0.01 0.02 39.11
## 380 356000 <none> 16 0.01 0.04 39.15
## 381 356947 <none> 1 0.00 0.00 39.15
## 382 357000 <none> 5 0.00 0.01 39.17
## 383 358000 <none> 11 0.01 0.03 39.19
## 384 359000 <none> 7 0.00 0.02 39.21
## 385 360000 <none> 327 0.18 0.81 40.02
## 386 361000 <none> 3 0.00 0.01 40.03
## 387 361350 <none> 1 0.00 0.00 40.03
## 388 362000 <none> 3 0.00 0.01 40.04
## 389 363000 <none> 2 0.00 0.00 40.04
## 390 364000 <none> 2 0.00 0.00 40.05
## 391 365000 <none> 23 0.01 0.06 40.10
## 392 365500 <none> 1 0.00 0.00 40.11
## 393 367000 <none> 6 0.00 0.01 40.12
## 394 367200 <none> 1 0.00 0.00 40.12
## 395 368000 <none> 6 0.00 0.01 40.14
## 396 369000 <none> 2 0.00 0.00 40.14
## 397 369364 <none> 1 0.00 0.00 40.15
## 398 369975 <none> 1 0.00 0.00 40.15
## 399 370000 <none> 212 0.11 0.52 40.67
## 400 371000 <none> 7 0.00 0.02 40.69
## 401 372000 <none> 5 0.00 0.01 40.70
## 402 373000 <none> 1 0.00 0.00 40.70
## 403 374000 <none> 3 0.00 0.01 40.71
## 404 375000 <none> 20 0.01 0.05 40.76
## 405 376000 <none> 3 0.00 0.01 40.77
## 406 377000 <none> 3 0.00 0.01 40.78
## 407 378000 <none> 9 0.00 0.02 40.80
## 408 379000 <none> 7 0.00 0.02 40.82
## 409 379663 <none> 1 0.00 0.00 40.82
## 410 380000 <none> 692 0.37 1.71 42.53
## 411 381000 <none> 2 0.00 0.00 42.54
## 412 381649 <none> 1 0.00 0.00 42.54
## 413 382000 <none> 3 0.00 0.01 42.55
## 414 383000 <none> 4 0.00 0.01 42.56
## 415 384000 <none> 6 0.00 0.01 42.57
## 416 385000 <none> 25 0.01 0.06 42.63
## 417 386000 <none> 6 0.00 0.01 42.65
## 418 387000 <none> 7 0.00 0.02 42.66
## 419 388000 <none> 7 0.00 0.02 42.68
## 420 389000 <none> 4 0.00 0.01 42.69
## 421 390000 <none> 160 0.09 0.40 43.09
## 422 391000 <none> 1 0.00 0.00 43.09
## 423 392000 <none> 3 0.00 0.01 43.10
## 424 393000 <none> 1 0.00 0.00 43.10
## 425 394000 <none> 4 0.00 0.01 43.11
## 426 395000 <none> 14 0.01 0.03 43.14
## 427 395850 <none> 1 0.00 0.00 43.15
## 428 396000 <none> 3 0.00 0.01 43.15
## 429 397000 <none> 1 0.00 0.00 43.16
## 430 398000 <none> 8 0.00 0.02 43.18
## 431 399000 <none> 6 0.00 0.01 43.19
## 432 400000 <none> 2774 1.50 6.86 50.05
## 433 400005 <none> 1 0.00 0.00 50.06
## 434 400600 <none> 1 0.00 0.00 50.06
## 435 401000 <none> 3 0.00 0.01 50.07
## 436 401500 <none> 1 0.00 0.00 50.07
## 437 402000 <none> 5 0.00 0.01 50.08
## 438 402810 <none> 1 0.00 0.00 50.08
## 439 403000 <none> 2 0.00 0.00 50.09
## 440 403800 <none> 1 0.00 0.00 50.09
## 441 403838 <none> 1 0.00 0.00 50.09
## 442 404000 <none> 1 0.00 0.00 50.10
## 443 405000 <none> 9 0.00 0.02 50.12
## 444 406000 <none> 3 0.00 0.01 50.13
## 445 407000 <none> 2 0.00 0.00 50.13
## 446 408000 <none> 2 0.00 0.00 50.14
## 447 409000 <none> 5 0.00 0.01 50.15
## 448 410000 <none> 78 0.04 0.19 50.34
## 449 412000 <none> 8 0.00 0.02 50.36
## 450 413000 <none> 4 0.00 0.01 50.37
## 451 413971 <none> 1 0.00 0.00 50.37
## 452 414000 <none> 2 0.00 0.00 50.38
## 453 415000 <none> 13 0.01 0.03 50.41
## 454 416000 <none> 5 0.00 0.01 50.42
## 455 416365 <none> 1 0.00 0.00 50.43
## 456 417000 <none> 7 0.00 0.02 50.44
## 457 418000 <none> 7 0.00 0.02 50.46
## 458 419000 <none> 7 0.00 0.02 50.48
## 459 420000 <none> 324 0.17 0.80 51.28
## 460 421000 <none> 1 0.00 0.00 51.28
## 461 422000 <none> 3 0.00 0.01 51.29
## 462 423000 <none> 5 0.00 0.01 51.30
## 463 424000 <none> 2 0.00 0.00 51.31
## 464 425000 <none> 22 0.01 0.05 51.36
## 465 426000 <none> 2 0.00 0.00 51.37
## 466 427000 <none> 7 0.00 0.02 51.38
## 467 428000 <none> 2 0.00 0.00 51.39
## 468 429000 <none> 2 0.00 0.00 51.39
## 469 430000 <none> 172 0.09 0.43 51.82
## 470 432000 <none> 6 0.00 0.01 51.83
## 471 433000 <none> 3 0.00 0.01 51.84
## 472 434000 <none> 2 0.00 0.00 51.85
## 473 435000 <none> 14 0.01 0.03 51.88
## 474 436000 <none> 2 0.00 0.00 51.89
## 475 438000 <none> 3 0.00 0.01 51.89
## 476 439000 <none> 4 0.00 0.01 51.90
## 477 440000 <none> 53 0.03 0.13 52.03
## 478 440009 <none> 1 0.00 0.00 52.04
## 479 440215 <none> 1 0.00 0.00 52.04
## 480 442000 <none> 2 0.00 0.00 52.04
## 481 443000 <none> 1 0.00 0.00 52.05
## 482 444000 <none> 3 0.00 0.01 52.05
## 483 445000 <none> 9 0.00 0.02 52.08
## 484 445800 <none> 1 0.00 0.00 52.08
## 485 446000 <none> 5 0.00 0.01 52.09
## 486 447000 <none> 4 0.00 0.01 52.10
## 487 448000 <none> 4 0.00 0.01 52.11
## 488 449000 <none> 2 0.00 0.00 52.12
## 489 449550 <none> 1 0.00 0.00 52.12
## 490 450000 <none> 1287 0.69 3.18 55.30
## 491 452000 <none> 2 0.00 0.00 55.31
## 492 453000 <none> 3 0.00 0.01 55.31
## 493 454000 <none> 2 0.00 0.00 55.32
## 494 455000 <none> 3 0.00 0.01 55.33
## 495 456000 <none> 6 0.00 0.01 55.34
## 496 457000 <none> 2 0.00 0.00 55.35
## 497 458000 <none> 6 0.00 0.01 55.36
## 498 459000 <none> 2 0.00 0.00 55.37
## 499 460000 <none> 96 0.05 0.24 55.60
## 500 460585 <none> 1 0.00 0.00 55.61
## 501 461000 <none> 2 0.00 0.00 55.61
## 502 462000 <none> 4 0.00 0.01 55.62
## 503 462500 <none> 1 0.00 0.00 55.62
## 504 463000 <none> 1 0.00 0.00 55.63
## 505 464000 <none> 1 0.00 0.00 55.63
## 506 465000 <none> 9 0.00 0.02 55.65
## 507 465312 <none> 1 0.00 0.00 55.65
## 508 466000 <none> 1 0.00 0.00 55.66
## 509 468000 <none> 1 0.00 0.00 55.66
## 510 470000 <none> 94 0.05 0.23 55.89
## 511 472000 <none> 1 0.00 0.00 55.89
## 512 473000 <none> 2 0.00 0.00 55.90
## 513 474000 <none> 1 0.00 0.00 55.90
## 514 475000 <none> 14 0.01 0.03 55.94
## 515 476000 <none> 2 0.00 0.00 55.94
## 516 477000 <none> 3 0.00 0.01 55.95
## 517 478000 <none> 2 0.00 0.00 55.95
## 518 479000 <none> 3 0.00 0.01 55.96
## 519 480000 <none> 288 0.16 0.71 56.67
## 520 482000 <none> 3 0.00 0.01 56.68
## 521 483000 <none> 1 0.00 0.00 56.68
## 522 484000 <none> 2 0.00 0.00 56.69
## 523 485000 <none> 7 0.00 0.02 56.70
## 524 487000 <none> 4 0.00 0.01 56.71
## 525 488000 <none> 2 0.00 0.00 56.72
## 526 489000 <none> 2 0.00 0.00 56.72
## 527 490000 <none> 68 0.04 0.17 56.89
## 528 491000 <none> 3 0.00 0.01 56.90
## 529 495000 <none> 10 0.01 0.02 56.93
## 530 495200 <none> 1 0.00 0.00 56.93
## 531 496000 <none> 5 0.00 0.01 56.94
## 532 497000 <none> 2 0.00 0.00 56.94
## 533 498000 <none> 4 0.00 0.01 56.95
## 534 499318 <none> 1 0.00 0.00 56.96
## 535 500000 <none> 2213 1.19 5.48 62.43
## 536 500002 <none> 1 0.00 0.00 62.44
## 537 500003 <none> 1 0.00 0.00 62.44
## 538 500005 <none> 1 0.00 0.00 62.44
## 539 501000 <none> 3 0.00 0.01 62.45
## 540 502000 <none> 1 0.00 0.00 62.45
## 541 503000 <none> 1 0.00 0.00 62.45
## 542 503640 <none> 1 0.00 0.00 62.45
## 543 505000 <none> 6 0.00 0.01 62.47
## 544 505189 <none> 1 0.00 0.00 62.47
## 545 506000 <none> 4 0.00 0.01 62.48
## 546 507000 <none> 2 0.00 0.00 62.49
## 547 508000 <none> 3 0.00 0.01 62.49
## 548 509000 <none> 2 0.00 0.00 62.50
## 549 510000 <none> 22 0.01 0.05 62.55
## 550 511000 <none> 2 0.00 0.00 62.56
## 551 512000 <none> 4 0.00 0.01 62.57
## 552 513000 <none> 4 0.00 0.01 62.58
## 553 513700 <none> 1 0.00 0.00 62.58
## 554 515000 <none> 7 0.00 0.02 62.60
## 555 516000 <none> 4 0.00 0.01 62.61
## 556 517000 <none> 5 0.00 0.01 62.62
## 557 518000 <none> 5 0.00 0.01 62.63
## 558 519000 <none> 2 0.00 0.00 62.64
## 559 520000 <none> 117 0.06 0.29 62.93
## 560 522000 <none> 2 0.00 0.00 62.93
## 561 522002 <none> 1 0.00 0.00 62.93
## 562 523000 <none> 2 0.00 0.00 62.94
## 563 524000 <none> 1 0.00 0.00 62.94
## 564 525000 <none> 8 0.00 0.02 62.96
## 565 526000 <none> 3 0.00 0.01 62.97
## 566 527000 <none> 3 0.00 0.01 62.98
## 567 528000 <none> 4 0.00 0.01 62.99
## 568 529000 <none> 1 0.00 0.00 62.99
## 569 530000 <none> 74 0.04 0.18 63.17
## 570 531000 <none> 1 0.00 0.00 63.17
## 571 532000 <none> 1 0.00 0.00 63.18
## 572 533000 <none> 1 0.00 0.00 63.18
## 573 533583 <none> 1 0.00 0.00 63.18
## 574 534000 <none> 1 0.00 0.00 63.18
## 575 535000 <none> 11 0.01 0.03 63.21
## 576 536000 <none> 4 0.00 0.01 63.22
## 577 537000 <none> 3 0.00 0.01 63.23
## 578 538000 <none> 5 0.00 0.01 63.24
## 579 540000 <none> 66 0.04 0.16 63.40
## 580 541000 <none> 1 0.00 0.00 63.41
## 581 543000 <none> 1 0.00 0.00 63.41
## 582 545000 <none> 10 0.01 0.02 63.43
## 583 546000 <none> 1 0.00 0.00 63.44
## 584 547000 <none> 5 0.00 0.01 63.45
## 585 548000 <none> 2 0.00 0.00 63.45
## 586 550000 <none> 483 0.26 1.20 64.65
## 587 551000 <none> 2 0.00 0.00 64.65
## 588 552000 <none> 3 0.00 0.01 64.66
## 589 554000 <none> 2 0.00 0.00 64.67
## 590 556000 <none> 4 0.00 0.01 64.68
## 591 557000 <none> 2 0.00 0.00 64.68
## 592 558000 <none> 3 0.00 0.01 64.69
## 593 560000 <none> 54 0.03 0.13 64.82
## 594 561000 <none> 1 0.00 0.00 64.83
## 595 563000 <none> 1 0.00 0.00 64.83
## 596 564000 <none> 1 0.00 0.00 64.83
## 597 565000 <none> 4 0.00 0.01 64.84
## 598 568000 <none> 1 0.00 0.00 64.84
## 599 569000 <none> 1 0.00 0.00 64.84
## 600 570000 <none> 41 0.02 0.10 64.95
## 601 572000 <none> 1 0.00 0.00 64.95
## 602 574000 <none> 1 0.00 0.00 64.95
## 603 575000 <none> 6 0.00 0.01 64.97
## 604 575760 <none> 1 0.00 0.00 64.97
## 605 575900 <none> 1 0.00 0.00 64.97
## 606 576000 <none> 2 0.00 0.00 64.98
## 607 577000 <none> 1 0.00 0.00 64.98
## 608 578000 <none> 1 0.00 0.00 64.98
## 609 579000 <none> 1 0.00 0.00 64.98
## 610 580000 <none> 98 0.05 0.24 65.23
## 611 581000 <none> 1 0.00 0.00 65.23
## 612 581866 <none> 1 0.00 0.00 65.23
## 613 582000 <none> 1 0.00 0.00 65.23
## 614 583000 <none> 1 0.00 0.00 65.24
## 615 584000 <none> 2 0.00 0.00 65.24
## 616 584600 <none> 1 0.00 0.00 65.24
## 617 585000 <none> 2 0.00 0.00 65.25
## 618 586000 <none> 4 0.00 0.01 65.26
## 619 587000 <none> 1 0.00 0.00 65.26
## 620 588000 <none> 1 0.00 0.00 65.26
## 621 589000 <none> 4 0.00 0.01 65.27
## 622 590000 <none> 30 0.02 0.07 65.35
## 623 592000 <none> 3 0.00 0.01 65.35
## 624 594576 <none> 1 0.00 0.00 65.36
## 625 595000 <none> 2 0.00 0.00 65.36
## 626 598000 <none> 2 0.00 0.00 65.37
## 627 599000 <none> 2 0.00 0.00 65.37
## 628 600000 <none> 1585 0.85 3.92 69.29
## 629 600005 <none> 1 0.00 0.00 69.30
## 630 600048 <none> 1 0.00 0.00 69.30
## 631 601000 <none> 1 0.00 0.00 69.30
## 632 603000 <none> 1 0.00 0.00 69.30
## 633 604000 <none> 1 0.00 0.00 69.31
## 634 606000 <none> 1 0.00 0.00 69.31
## 635 607000 <none> 1 0.00 0.00 69.31
## 636 608000 <none> 2 0.00 0.00 69.32
## 637 610000 <none> 18 0.01 0.04 69.36
## 638 612000 <none> 3 0.00 0.01 69.37
## 639 613000 <none> 3 0.00 0.01 69.38
## 640 614000 <none> 2 0.00 0.00 69.38
## 641 615000 <none> 4 0.00 0.01 69.39
## 642 616000 <none> 1 0.00 0.00 69.39
## 643 618000 <none> 3 0.00 0.01 69.40
## 644 619000 <none> 1 0.00 0.00 69.40
## 645 620000 <none> 69 0.04 0.17 69.57
## 646 623000 <none> 1 0.00 0.00 69.58
## 647 624000 <none> 3 0.00 0.01 69.58
## 648 625000 <none> 2 0.00 0.00 69.59
## 649 626000 <none> 1 0.00 0.00 69.59
## 650 628000 <none> 1 0.00 0.00 69.59
## 651 630000 <none> 38 0.02 0.09 69.69
## 652 631000 <none> 1 0.00 0.00 69.69
## 653 632000 <none> 1 0.00 0.00 69.69
## 654 634000 <none> 1 0.00 0.00 69.69
## 655 634459 <none> 1 0.00 0.00 69.70
## 656 635000 <none> 1 0.00 0.00 69.70
## 657 637000 <none> 1 0.00 0.00 69.70
## 658 638000 <none> 1 0.00 0.00 69.70
## 659 640000 <none> 31 0.02 0.08 69.78
## 660 643000 <none> 1 0.00 0.00 69.78
## 661 645000 <none> 2 0.00 0.00 69.79
## 662 647000 <none> 1 0.00 0.00 69.79
## 663 649000 <none> 1 0.00 0.00 69.79
## 664 650000 <none> 459 0.25 1.14 70.93
## 665 657000 <none> 1 0.00 0.00 70.93
## 666 658000 <none> 1 0.00 0.00 70.93
## 667 659000 <none> 1 0.00 0.00 70.94
## 668 660000 <none> 23 0.01 0.06 70.99
## 669 664761 <none> 1 0.00 0.00 71.00
## 670 665000 <none> 2 0.00 0.00 71.00
## 671 666000 <none> 1 0.00 0.00 71.00
## 672 666666 <none> 1 0.00 0.00 71.01
## 673 667000 <none> 1 0.00 0.00 71.01
## 674 668000 <none> 2 0.00 0.00 71.01
## 675 668800 <none> 1 0.00 0.00 71.02
## 676 669000 <none> 2 0.00 0.00 71.02
## 677 670000 <none> 42 0.02 0.10 71.12
## 678 671000 <none> 3 0.00 0.01 71.13
## 679 672000 <none> 2 0.00 0.00 71.14
## 680 672196 <none> 1 0.00 0.00 71.14
## 681 675000 <none> 2 0.00 0.00 71.14
## 682 676000 <none> 1 0.00 0.00 71.15
## 683 677000 <none> 1 0.00 0.00 71.15
## 684 679000 <none> 1 0.00 0.00 71.15
## 685 680000 <none> 71 0.04 0.18 71.33
## 686 680458 <none> 1 0.00 0.00 71.33
## 687 682000 <none> 1 0.00 0.00 71.33
## 688 683000 <none> 2 0.00 0.00 71.34
## 689 684000 <none> 1 0.00 0.00 71.34
## 690 686000 <none> 1 0.00 0.00 71.34
## 691 687000 <none> 1 0.00 0.00 71.34
## 692 688117 <none> 1 0.00 0.00 71.35
## 693 690000 <none> 28 0.02 0.07 71.42
## 694 691000 <none> 1 0.00 0.00 71.42
## 695 692000 <none> 1 0.00 0.00 71.42
## 696 693000 <none> 1 0.00 0.00 71.42
## 697 694000 <none> 1 0.00 0.00 71.43
## 698 694109 <none> 1 0.00 0.00 71.43
## 699 695000 <none> 1 0.00 0.00 71.43
## 700 697000 <none> 2 0.00 0.00 71.44
## 701 700000 <none> 1227 0.66 3.04 74.47
## 702 700050 <none> 1 0.00 0.00 74.47
## 703 702000 <none> 1 0.00 0.00 74.48
## 704 703000 <none> 1 0.00 0.00 74.48
## 705 708000 <none> 1 0.00 0.00 74.48
## 706 709000 <none> 1 0.00 0.00 74.48
## 707 710000 <none> 7 0.00 0.02 74.50
## 708 711000 <none> 1 0.00 0.00 74.50
## 709 713000 <none> 3 0.00 0.01 74.51
## 710 714000 <none> 1 0.00 0.00 74.51
## 711 715000 <none> 6 0.00 0.01 74.53
## 712 718000 <none> 1 0.00 0.00 74.53
## 713 718508 <none> 1 0.00 0.00 74.53
## 714 720000 <none> 76 0.04 0.19 74.72
## 715 721000 <none> 2 0.00 0.00 74.73
## 716 725000 <none> 4 0.00 0.01 74.74
## 717 730000 <none> 32 0.02 0.08 74.82
## 718 733000 <none> 1 0.00 0.00 74.82
## 719 734000 <none> 1 0.00 0.00 74.82
## 720 735000 <none> 2 0.00 0.00 74.83
## 721 737000 <none> 1 0.00 0.00 74.83
## 722 738000 <none> 2 0.00 0.00 74.83
## 723 739000 <none> 2 0.00 0.00 74.84
## 724 740000 <none> 22 0.01 0.05 74.89
## 725 742184 <none> 1 0.00 0.00 74.89
## 726 743000 <none> 1 0.00 0.00 74.90
## 727 743831 <none> 1 0.00 0.00 74.90
## 728 745000 <none> 2 0.00 0.00 74.90
## 729 746000 <none> 2 0.00 0.00 74.91
## 730 747000 <none> 1 0.00 0.00 74.91
## 731 748000 <none> 1 0.00 0.00 74.91
## 732 750000 <none> 350 0.19 0.87 75.78
## 733 752000 <none> 1 0.00 0.00 75.78
## 734 754000 <none> 1 0.00 0.00 75.79
## 735 756804 <none> 1 0.00 0.00 75.79
## 736 759000 <none> 1 0.00 0.00 75.79
## 737 760000 <none> 26 0.01 0.06 75.85
## 738 763000 <none> 2 0.00 0.00 75.86
## 739 768000 <none> 1 0.00 0.00 75.86
## 740 769000 <none> 2 0.00 0.00 75.87
## 741 770000 <none> 22 0.01 0.05 75.92
## 742 774000 <none> 1 0.00 0.00 75.92
## 743 775000 <none> 1 0.00 0.00 75.93
## 744 776000 <none> 2 0.00 0.00 75.93
## 745 780000 <none> 58 0.03 0.14 76.08
## 746 782032 <none> 1 0.00 0.00 76.08
## 747 785000 <none> 1 0.00 0.00 76.08
## 748 787000 <none> 1 0.00 0.00 76.08
## 749 788000 <none> 2 0.00 0.00 76.09
## 750 790000 <none> 24 0.01 0.06 76.15
## 751 795000 <none> 1 0.00 0.00 76.15
## 752 797000 <none> 1 0.00 0.00 76.15
## 753 798000 <none> 2 0.00 0.00 76.16
## 754 799000 <none> 1 0.00 0.00 76.16
## 755 800000 <none> 1250 0.67 3.09 79.25
## 756 803000 <none> 2 0.00 0.00 79.26
## 757 805000 <none> 2 0.00 0.00 79.26
## 758 808698 <none> 1 0.00 0.00 79.26
## 759 809000 <none> 1 0.00 0.00 79.27
## 760 810000 <none> 3 0.00 0.01 79.27
## 761 812000 <none> 1 0.00 0.00 79.28
## 762 814000 <none> 1 0.00 0.00 79.28
## 763 818000 <none> 1 0.00 0.00 79.28
## 764 820000 <none> 35 0.02 0.09 79.37
## 765 821000 <none> 1 0.00 0.00 79.37
## 766 822000 <none> 1 0.00 0.00 79.37
## 767 823000 <none> 2 0.00 0.00 79.38
## 768 824000 <none> 2 0.00 0.00 79.38
## 769 825000 <none> 3 0.00 0.01 79.39
## 770 827000 <none> 1 0.00 0.00 79.39
## 771 828000 <none> 1 0.00 0.00 79.40
## 772 829000 <none> 1 0.00 0.00 79.40
## 773 830000 <none> 34 0.02 0.08 79.48
## 774 832000 <none> 2 0.00 0.00 79.49
## 775 832405 <none> 1 0.00 0.00 79.49
## 776 834000 <none> 2 0.00 0.00 79.49
## 777 835000 <none> 1 0.00 0.00 79.50
## 778 838000 <none> 1 0.00 0.00 79.50
## 779 840000 <none> 13 0.01 0.03 79.53
## 780 845000 <none> 3 0.00 0.01 79.54
## 781 847000 <none> 1 0.00 0.00 79.54
## 782 850000 <none> 254 0.14 0.63 80.17
## 783 852000 <none> 1 0.00 0.00 80.17
## 784 853000 <none> 2 0.00 0.00 80.18
## 785 854000 <none> 1 0.00 0.00 80.18
## 786 858463 <none> 1 0.00 0.00 80.18
## 787 859000 <none> 3 0.00 0.01 80.19
## 788 860000 <none> 24 0.01 0.06 80.25
## 789 861000 <none> 1 0.00 0.00 80.25
## 790 863000 <none> 2 0.00 0.00 80.26
## 791 865000 <none> 1 0.00 0.00 80.26
## 792 869000 <none> 1 0.00 0.00 80.26
## 793 870000 <none> 15 0.01 0.04 80.30
## 794 871000 <none> 1 0.00 0.00 80.30
## 795 873000 <none> 1 0.00 0.00 80.30
## 796 874481 <none> 1 0.00 0.00 80.31
## 797 876000 <none> 1 0.00 0.00 80.31
## 798 879000 <none> 1 0.00 0.00 80.31
## 799 880000 <none> 15 0.01 0.04 80.35
## 800 884000 <none> 1 0.00 0.00 80.35
## 801 885000 <none> 3 0.00 0.01 80.36
## 802 886000 <none> 1 0.00 0.00 80.36
## 803 890000 <none> 28 0.02 0.07 80.43
## 804 892000 <none> 3 0.00 0.01 80.44
## 805 894805 <none> 1 0.00 0.00 80.44
## 806 899000 <none> 1 0.00 0.00 80.44
## 807 900000 <none> 693 0.37 1.71 82.16
## 808 900005 <none> 1 0.00 0.00 82.16
## 809 902000 <none> 1 0.00 0.00 82.16
## 810 903000 <none> 1 0.00 0.00 82.16
## 811 905000 <none> 1 0.00 0.00 82.17
## 812 907000 <none> 1 0.00 0.00 82.17
## 813 910000 <none> 2 0.00 0.00 82.17
## 814 915000 <none> 6 0.00 0.01 82.19
## 815 916000 <none> 1 0.00 0.00 82.19
## 816 917000 <none> 1 0.00 0.00 82.19
## 817 919000 <none> 1 0.00 0.00 82.20
## 818 920000 <none> 34 0.02 0.08 82.28
## 819 923000 <none> 1 0.00 0.00 82.28
## 820 924000 <none> 1 0.00 0.00 82.29
## 821 925000 <none> 2 0.00 0.00 82.29
## 822 930000 <none> 17 0.01 0.04 82.33
## 823 932000 <none> 1 0.00 0.00 82.33
## 824 934000 <none> 1 0.00 0.00 82.34
## 825 935000 <none> 1 0.00 0.00 82.34
## 826 936000 <none> 2 0.00 0.00 82.34
## 827 937000 <none> 1 0.00 0.00 82.35
## 828 938000 <none> 2 0.00 0.00 82.35
## 829 940000 <none> 20 0.01 0.05 82.40
## 830 944000 <none> 1 0.00 0.00 82.40
## 831 945000 <none> 1 0.00 0.00 82.41
## 832 948000 <none> 1 0.00 0.00 82.41
## 833 949000 <none> 1 0.00 0.00 82.41
## 834 950000 <none> 112 0.06 0.28 82.69
## 835 952000 <none> 1 0.00 0.00 82.69
## 836 953000 <none> 1 0.00 0.00 82.69
## 837 956000 <none> 1 0.00 0.00 82.70
## 838 960000 <none> 16 0.01 0.04 82.74
## 839 962000 <none> 1 0.00 0.00 82.74
## 840 963000 <none> 1 0.00 0.00 82.74
## 841 964000 <none> 1 0.00 0.00 82.74
## 842 965000 <none> 1 0.00 0.00 82.75
## 843 968000 <none> 1 0.00 0.00 82.75
## 844 969000 <none> 1 0.00 0.00 82.75
## 845 970000 <none> 17 0.01 0.04 82.79
## 846 971000 <none> 2 0.00 0.00 82.80
## 847 973000 <none> 1 0.00 0.00 82.80
## 848 976641 <none> 1 0.00 0.00 82.80
## 849 978000 <none> 1 0.00 0.00 82.80
## 850 980000 <none> 44 0.02 0.11 82.91
## 851 980777 <none> 1 0.00 0.00 82.92
## 852 983000 <none> 1 0.00 0.00 82.92
## 853 985000 <none> 1 0.00 0.00 82.92
## 854 990000 <none> 7 0.00 0.02 82.94
## 855 992000 <none> 2 0.00 0.00 82.94
## 856 993000 <none> 1 0.00 0.00 82.95
## 857 995000 <none> 4 0.00 0.01 82.96
## 858 996000 <none> 2 0.00 0.00 82.96
## 859 998000 <none> 3 0.00 0.01 82.97
## 860 999000 <none> 1 0.00 0.00 82.97
## 861 1000000 <none> 1252 0.68 3.10 86.07
## 862 1000050 <none> 3 0.00 0.01 86.08
## 863 1000100 <none> 2 0.00 0.00 86.08
## 864 1000500 <none> 1 0.00 0.00 86.08
## 865 1003000 <none> 1 0.00 0.00 86.09
## 866 1005000 <none> 1 0.00 0.00 86.09
## 867 1008000 <none> 3 0.00 0.01 86.10
## 868 1009000 <none> 1 0.00 0.00 86.10
## 869 1010000 <none> 1 0.00 0.00 86.10
## 870 1012000 <none> 2 0.00 0.00 86.11
## 871 1014000 <none> 1 0.00 0.00 86.11
## 872 1017000 <none> 2 0.00 0.00 86.11
## 873 1020000 <none> 8 0.00 0.02 86.13
## 874 1022000 <none> 1 0.00 0.00 86.13
## 875 1024000 <none> 2 0.00 0.00 86.14
## 876 1025000 <none> 1 0.00 0.00 86.14
## 877 1027000 <none> 2 0.00 0.00 86.15
## 878 1028000 <none> 1 0.00 0.00 86.15
## 879 1029000 <none> 1 0.00 0.00 86.15
## 880 1030000 <none> 4 0.00 0.01 86.16
## 881 1036000 <none> 2 0.00 0.00 86.17
## 882 1039000 <none> 1 0.00 0.00 86.17
## 883 1040000 <none> 5 0.00 0.01 86.18
## 884 1046000 <none> 1 0.00 0.00 86.18
## 885 1048000 <none> 1 0.00 0.00 86.19
## 886 1049000 <none> 2 0.00 0.00 86.19
## 887 1050000 <none> 33 0.02 0.08 86.27
## 888 1056000 <none> 2 0.00 0.00 86.28
## 889 1060000 <none> 8 0.00 0.02 86.30
## 890 1070000 <none> 5 0.00 0.01 86.31
## 891 1072000 <none> 1 0.00 0.00 86.31
## 892 1080000 <none> 12 0.01 0.03 86.34
## 893 1082000 <none> 2 0.00 0.00 86.35
## 894 1083000 <none> 1 0.00 0.00 86.35
## 895 1085000 <none> 1 0.00 0.00 86.35
## 896 1089613 <none> 1 0.00 0.00 86.36
## 897 1090000 <none> 4 0.00 0.01 86.36
## 898 1092000 <none> 1 0.00 0.00 86.37
## 899 1094000 <none> 1 0.00 0.00 86.37
## 900 1100000 <none> 346 0.19 0.86 87.23
## 901 1102000 <none> 1 0.00 0.00 87.23
## 902 1110000 <none> 3 0.00 0.01 87.24
## 903 1120000 <none> 8 0.00 0.02 87.26
## 904 1123000 <none> 1 0.00 0.00 87.26
## 905 1125378 <none> 1 0.00 0.00 87.26
## 906 1130000 <none> 7 0.00 0.02 87.28
## 907 1133000 <none> 1 0.00 0.00 87.28
## 908 1138000 <none> 1 0.00 0.00 87.28
## 909 1139000 <none> 1 0.00 0.00 87.29
## 910 1140000 <none> 1 0.00 0.00 87.29
## 911 1143000 <none> 1 0.00 0.00 87.29
## 912 1148000 <none> 1 0.00 0.00 87.29
## 913 1150000 <none> 30 0.02 0.07 87.37
## 914 1155000 <none> 1 0.00 0.00 87.37
## 915 1160000 <none> 7 0.00 0.02 87.39
## 916 1160250 <none> 1 0.00 0.00 87.39
## 917 1163000 <none> 1 0.00 0.00 87.39
## 918 1169000 <none> 1 0.00 0.00 87.39
## 919 1170000 <none> 4 0.00 0.01 87.40
## 920 1176000 <none> 1 0.00 0.00 87.41
## 921 1180000 <none> 7 0.00 0.02 87.42
## 922 1185000 <none> 2 0.00 0.00 87.43
## 923 1190000 <none> 5 0.00 0.01 87.44
## 924 1197000 <none> 1 0.00 0.00 87.44
## 925 1200000 <none> 737 0.40 1.82 89.27
## 926 1220000 <none> 1 0.00 0.00 89.27
## 927 1230000 <none> 1 0.00 0.00 89.27
## 928 1238000 <none> 1 0.00 0.00 89.27
## 929 1240000 <none> 4 0.00 0.01 89.28
## 930 1242000 <none> 1 0.00 0.00 89.29
## 931 1244273 <none> 1 0.00 0.00 89.29
## 932 1250000 <none> 31 0.02 0.08 89.37
## 933 1253000 <none> 1 0.00 0.00 89.37
## 934 1258000 <none> 2 0.00 0.00 89.37
## 935 1260000 <none> 1 0.00 0.00 89.38
## 936 1268000 <none> 2 0.00 0.00 89.38
## 937 1270000 <none> 3 0.00 0.01 89.39
## 938 1280000 <none> 5 0.00 0.01 89.40
## 939 1287275 <none> 1 0.00 0.00 89.40
## 940 1288000 <none> 1 0.00 0.00 89.41
## 941 1290000 <none> 3 0.00 0.01 89.41
## 942 1298000 <none> 1 0.00 0.00 89.42
## 943 1300000 <none> 374 0.20 0.93 90.34
## 944 1304144 <none> 1 0.00 0.00 90.34
## 945 1307000 <none> 2 0.00 0.00 90.35
## 946 1313354 <none> 1 0.00 0.00 90.35
## 947 1320000 <none> 3 0.00 0.01 90.36
## 948 1330000 <none> 2 0.00 0.00 90.36
## 949 1333000 <none> 1 0.00 0.00 90.37
## 950 1338182 <none> 1 0.00 0.00 90.37
## 951 1340000 <none> 1 0.00 0.00 90.37
## 952 1350000 <none> 50 0.03 0.12 90.49
## 953 1360000 <none> 1 0.00 0.00 90.50
## 954 1370000 <none> 1 0.00 0.00 90.50
## 955 1373000 <none> 1 0.00 0.00 90.50
## 956 1380000 <none> 3 0.00 0.01 90.51
## 957 1386000 <none> 1 0.00 0.00 90.51
## 958 1390000 <none> 1 0.00 0.00 90.51
## 959 1395000 <none> 1 0.00 0.00 90.52
## 960 1397000 <none> 1 0.00 0.00 90.52
## 961 1399000 <none> 1 0.00 0.00 90.52
## 962 1400000 <none> 274 0.15 0.68 91.20
## 963 1420000 <none> 2 0.00 0.00 91.20
## 964 1423000 <none> 1 0.00 0.00 91.21
## 965 1425000 <none> 1 0.00 0.00 91.21
## 966 1437000 <none> 1 0.00 0.00 91.21
## 967 1450000 <none> 16 0.01 0.04 91.25
## 968 1458000 <none> 1 0.00 0.00 91.25
## 969 1460000 <none> 1 0.00 0.00 91.26
## 970 1476000 <none> 1 0.00 0.00 91.26
## 971 1480000 <none> 4 0.00 0.01 91.27
## 972 1488000 <none> 1 0.00 0.00 91.27
## 973 1490000 <none> 1 0.00 0.00 91.27
## 974 1500000 <none> 768 0.41 1.90 93.17
## 975 1514000 <none> 1 0.00 0.00 93.18
## 976 1520000 <none> 2 0.00 0.00 93.18
## 977 1525000 <none> 1 0.00 0.00 93.18
## 978 1526000 <none> 1 0.00 0.00 93.19
## 979 1535000 <none> 1 0.00 0.00 93.19
## 980 1550000 <none> 6 0.00 0.01 93.20
## 981 1556000 <none> 1 0.00 0.00 93.21
## 982 1560000 <none> 4 0.00 0.01 93.22
## 983 1560800 <none> 1 0.00 0.00 93.22
## 984 1570000 <none> 1 0.00 0.00 93.22
## 985 1578000 <none> 1 0.00 0.00 93.22
## 986 1580000 <none> 3 0.00 0.01 93.23
## 987 1586000 <none> 1 0.00 0.00 93.23
## 988 1590000 <none> 3 0.00 0.01 93.24
## 989 1595000 <none> 1 0.00 0.00 93.24
## 990 1600000 <none> 220 0.12 0.54 93.79
## 991 1608000 <none> 1 0.00 0.00 93.79
## 992 1620000 <none> 2 0.00 0.00 93.79
## 993 1630000 <none> 1 0.00 0.00 93.80
## 994 1650000 <none> 9 0.00 0.02 93.82
## 995 1657000 <none> 1 0.00 0.00 93.82
## 996 1660000 <none> 1 0.00 0.00 93.82
## 997 1670000 <none> 2 0.00 0.00 93.83
## 998 1690000 <none> 2 0.00 0.00 93.83
## 999 1700000 <none> 166 0.09 0.41 94.25
## 1000 1720000 <none> 1 0.00 0.00 94.25
## 1001 1750000 <none> 14 0.01 0.03 94.28
## 1002 1758000 <none> 1 0.00 0.00 94.28
## 1003 1770000 <none> 2 0.00 0.00 94.29
## 1004 1780000 <none> 3 0.00 0.01 94.30
## 1005 1785000 <none> 1 0.00 0.00 94.30
## 1006 1790000 <none> 1 0.00 0.00 94.30
## 1007 1799000 <none> 1 0.00 0.00 94.30
## 1008 1800000 <none> 330 0.18 0.82 95.12
## 1009 1819437 <none> 1 0.00 0.00 95.12
## 1010 1825000 <none> 1 0.00 0.00 95.13
## 1011 1850000 <none> 9 0.00 0.02 95.15
## 1012 1860000 <none> 2 0.00 0.00 95.15
## 1013 1870000 <none> 2 0.00 0.00 95.16
## 1014 1876000 <none> 1 0.00 0.00 95.16
## 1015 1890000 <none> 2 0.00 0.00 95.17
## 1016 1891781 <none> 1 0.00 0.00 95.17
## 1017 1894000 <none> 1 0.00 0.00 95.17
## 1018 1900000 <none> 85 0.05 0.21 95.38
## 1019 1920000 <none> 1 0.00 0.00 95.38
## 1020 1940000 <none> 1 0.00 0.00 95.39
## 1021 1950000 <none> 5 0.00 0.01 95.40
## 1022 1980000 <none> 1 0.00 0.00 95.40
## 1023 1990000 <none> 1 0.00 0.00 95.40
## 1024 1995000 <none> 1 0.00 0.00 95.41
## 1025 2000000 <none> 456 0.25 1.13 96.53
## 1026 2000008 <none> 1 0.00 0.00 96.54
## 1027 2030000 <none> 1 0.00 0.00 96.54
## 1028 2050000 <none> 4 0.00 0.01 96.55
## 1029 2060000 <none> 1 0.00 0.00 96.55
## 1030 2072000 <none> 1 0.00 0.00 96.55
## 1031 2080000 <none> 1 0.00 0.00 96.56
## 1032 2088808 <none> 1 0.00 0.00 96.56
## 1033 2090000 <none> 1 0.00 0.00 96.56
## 1034 2100000 <none> 65 0.04 0.16 96.72
## 1035 2107000 <none> 1 0.00 0.00 96.72
## 1036 2150000 <none> 2 0.00 0.00 96.73
## 1037 2170000 <none> 1 0.00 0.00 96.73
## 1038 2180000 <none> 1 0.00 0.00 96.73
## 1039 2190000 <none> 1 0.00 0.00 96.74
## 1040 2200000 <none> 73 0.04 0.18 96.92
## 1041 2220000 <none> 1 0.00 0.00 96.92
## 1042 2250000 <none> 4 0.00 0.01 96.93
## 1043 2290000 <none> 1 0.00 0.00 96.93
## 1044 2300000 <none> 77 0.04 0.19 97.12
## 1045 2320000 <none> 1 0.00 0.00 97.13
## 1046 2350000 <none> 3 0.00 0.01 97.13
## 1047 2400000 <none> 51 0.03 0.13 97.26
## 1048 2410000 <none> 1 0.00 0.00 97.26
## 1049 2460000 <none> 1 0.00 0.00 97.26
## 1050 2470000 <none> 2 0.00 0.00 97.27
## 1051 2500000 <none> 206 0.11 0.51 97.78
## 1052 2550000 <none> 1 0.00 0.00 97.78
## 1053 2600000 <none> 32 0.02 0.08 97.86
## 1054 2700000 <none> 36 0.02 0.09 97.95
## 1055 2750000 <none> 2 0.00 0.00 97.95
## 1056 2770000 <none> 1 0.00 0.00 97.96
## 1057 2800000 <none> 51 0.03 0.13 98.08
## 1058 2866000 <none> 1 0.00 0.00 98.09
## 1059 2900000 <none> 20 0.01 0.05 98.13
## 1060 2930000 <none> 1 0.00 0.00 98.14
## 1061 2983550 <none> 1 0.00 0.00 98.14
## 1062 3000000 <none> 197 0.11 0.49 98.63
## 1063 3000200 <none> 1 0.00 0.00 98.63
## 1064 3050000 <none> 1 0.00 0.00 98.63
## 1065 3060000 <none> 1 0.00 0.00 98.63
## 1066 3100000 <none> 7 0.00 0.02 98.65
## 1067 3196000 <none> 1 0.00 0.00 98.65
## 1068 3200000 <none> 31 0.02 0.08 98.73
## 1069 3280000 <none> 1 0.00 0.00 98.73
## 1070 3300000 <none> 8 0.00 0.02 98.75
## 1071 3400000 <none> 11 0.01 0.03 98.78
## 1072 3412000 <none> 1 0.00 0.00 98.78
## 1073 3459000 <none> 1 0.00 0.00 98.79
## 1074 3460000 <none> 1 0.00 0.00 98.79
## 1075 3500000 <none> 99 0.05 0.24 99.03
## 1076 3600000 <none> 12 0.01 0.03 99.06
## 1077 3670000 <none> 1 0.00 0.00 99.06
## 1078 3677137 <none> 1 0.00 0.00 99.07
## 1079 3700000 <none> 9 0.00 0.02 99.09
## 1080 3800000 <none> 20 0.01 0.05 99.14
## 1081 3900000 <none> 1 0.00 0.00 99.14
## 1082 4000000 <none> 99 0.05 0.24 99.39
## 1083 4100000 <none> 5 0.00 0.01 99.40
## 1084 4200000 <none> 11 0.01 0.03 99.43
## 1085 4300000 <none> 2 0.00 0.00 99.43
## 1086 4400000 <none> 2 0.00 0.00 99.44
## 1087 4500000 <none> 34 0.02 0.08 99.52
## 1088 4600000 <none> 8 0.00 0.02 99.54
## 1089 4700000 <none> 4 0.00 0.01 99.55
## 1090 4800000 <none> 5 0.00 0.01 99.56
## 1091 5000000 <none> 65 0.04 0.16 99.72
## 1092 5100000 <none> 1 0.00 0.00 99.73
## 1093 5200000 <none> 4 0.00 0.01 99.74
## 1094 5300000 <none> 1 0.00 0.00 99.74
## 1095 5500000 <none> 12 0.01 0.03 99.77
## 1096 5600000 <none> 3 0.00 0.01 99.77
## 1097 5700000 <none> 4 0.00 0.01 99.78
## 1098 5800000 <none> 1 0.00 0.00 99.79
## 1099 5900000 <none> 1 0.00 0.00 99.79
## 1100 6000000 <none> 41 0.02 0.10 99.89
## 1101 6100000 <none> 1 0.00 0.00 99.89
## 1102 6500000 <none> 2 0.00 0.00 99.90
## 1103 6800000 <none> 1 0.00 0.00 99.90
## 1104 7000000 <none> 11 0.01 0.03 99.93
## 1105 7800000 <none> 1 0.00 0.00 99.93
## 1106 8000000 <none> 8 0.00 0.02 99.95
## 1107 9000000 <none> 3 0.00 0.01 99.96
## 1108 9500000 <none> 2 0.00 0.00 99.96
## 1109 9800000 <none> 1 0.00 0.00 99.97
## 1110 10000000 <none> 5 0.00 0.01 99.98
## 1111 12000000 <none> 4 0.00 0.01 99.99
## 1112 15000000 <none> 3 0.00 0.01 100.00
## 1113 17700000 <none> 1 0.00 0.00 100.00
## 1114 25000000 <none> 1 0.00 0.00 100.00
## 1115 NA <NA> 145019 78.20 NA NA
Para las variables numeric, en cambio, podemos utilizar la función descr()
del mismo paquete, que nos indicará las medidas de tendencia central, dispersión y posición de la variable.
Sobre las clases de las variables
Un punto que ya se hace evidente de empezar a trabajar son como reconocer y trabajar los distintos tipos de variables en R. Si bien al inicio no es tan intuitivo ¡no te preocupes! Cuando uno avanza en el aprendizaje del programa de a poco estos conceptos se asimilan más.
Partamos por lo básico que ustedes ya saben de sus cursos de estadística: los niveles de medición: sabemos que el nivel de medición de la variable género es nominal y, por lo tanto, sólo nos permite clasificar a unas personas u otras. Por ello, no podemos, por ejemplo, calcular el promedio del género de una muestra. Por otra parte, la variable edad presenta un nivel de medición de razón, por lo cual sí podemos realizar con ella operaciones aritméticas y, en consecuencia, es posible, por ejemplo, calcular el promedio de edad de la muestra con que estamos trabajando.
La función class()
, incluido en el paquete base de R, nos permite saber la clase de una variable determinada con la cual deseemos trabajar. También nos permite conocer la clase de otros objetos en R, pero no es algo que utilizaremos (aún).
a) numeric
Una variable puede presentar la clase numeric
, lo cual significa que sus datos sólo incorporan números. Así, es posible, por ejemplo, calcular el promedio para este tipo de variables. En Casen en Pandemia 2020, una de las variables numeric
incluidas es Ingreso total per cápita del hogar corregido (codificada como ypchtotcor).
class(datos$ypchtotcor)
## [1] "numeric"
b) character
Una variable de clase character
puede incluir tanto números como letras. Si bien con estas variables no es posible calcular, por ejemplo, promedios, sí podemos calcular frecuencias (absolutas y relativas), entre otros.
c) Logic
Una variable de clase Logic
incluye valores lógicos, como TRUE (T) o FALSE (F). Los valores nulos (NA) también son valores lógicos. Este tipo de variables nos pueden servir a la hora de crear funciones, lo cual no se revisará en este práctico.
d) factor
Una variable de clase factor
puede incluir tanto números como letras. Es una especie de variable character
, pero recodificada de modo que los posibles valores sean etiquetados. Las bases de datos no suelen incluirlas a priori, por lo que lo usual es que debamos realizar un proceso de recodificación para poder trabajar una variable como factor. ¡Esto último será tratado en el siguiente práctico!
En resumen:
Clase | Tipo de variable |
---|---|
numeric |
Cuantitativa |
character |
Categórica |
Logic |
Lógica (TRUE, FALSE, NA) |
factor |
Categórica con niveles y etiquetas |
3.1. Selección de variables
Luego de revisar el nivel de medición de las variables y reconociendo la distribución de los datos que tenemos, es evidente que lo mejor es solamente trabajar con un subset de una base de datos con las variables que queremos transformar.
Para asegurarnos que variables queremos utilizar deberíamos ir al libro de códigos, pero también podemos elegir y decidir de manera más certera qué variables incorporar a partir de la revisión con find_var()
. En esta sección no profundizaremos distintas formas de seleccionar datos. Solo les mostraremos de manera simple como seleccionar dos variables de nuestro interés:
ypchtotcor
: Ingresos del hogarv13
: “Su hogar, ¿bajo qué situación ocupa la vivienda?”v29
: “¿Cuántos dormitorios de uso exclusivo ocupa su hogar en esta vivienda?”p6
: “¿Cuántas personas viven habitualmente en esta vivienda?”
Crearemos una base procesada llamado datos_proc
, que sólo incluirá estas tres variables.
Como podemos ver en el ambiente (Environment), se creó un nuevo objeto llamado datos_proc
, que tiene la misma cantidad de observaciones (filas) que datos, pero que sólo incluye 4 de las 650 variables iniciales.
4. Limpieza de datos
Los datos con los que trabajamos suelen incorporar valores nulos (NA
), casos perdidos ingresados como valores de clase Logic
. Estos valores no nos entregan información útil para nuestros análisis, y pueden generar problemas al momento de, por ejemplo, calcular medidas de tendencia central, u otros procedimientos estadísticos.
Hay diversas maneras de trabajar los valores nulos, tales como realizar procesos de imputación, entre otros. Sin embargo, la más sencilla consiste en eliminar los valores nulos que se encuentran presentes en nuestros datos (aunque no recomendable)
Para ello, lo primero es identificar valores nulos en el set de datos en general, o en alguna variable en específico. Para ello, empleamos la función is.na()
.
is.na(datos_proc) #Revisamos si hay casos perdidos en el total del set de datos
is.na(datos_proc$ypchtotcor) #Revisamos si hay casos perdidos en Ingresos per cápita
Sin embargo, esto no resulta muy práctico para el análisis. Es por ello que emplearemos la función sum()
para contar cuántos valores nulos hay en el set de datos en general, o en alguna variable en particular.
sum(is.na(datos_proc)) #Contamos los valores nulos del set de datos en general, que suman un total de 180.148
## [1] 180148
sum(is.na(datos_proc$ypchtotcor)) #Contaremos los valores nulos de la variable Ingresos per cápita, que alcanzan un total de 98
## [1] 98
Una vez identificamos los valores nulos, podemos proceder a eliminarlos del set de datos. El comando na.omit()
eliminará todas las filas que presenten casos perdidos.
nrow(datos_proc)
## [1] 185437
datos_proc <- na.omit(datos_proc) #Eliminamos las filas con casos perdidos
nrow(datos_proc) #La nueva base de datos tiene 5.387 filas y 4 columnas
## [1] 5387
¡La próxima sesión aprenderemos a recodificarlas!
5. Guardar y exportar datos
Por último, una vez que hayamos procesado los datos, es importante que los guardemos en una nueva base de datos procesada, para no tener que llevar a cabo el procesamiento otra vez.
Al igual que en el paso de carga de datos, y a partir del flujo de input-R-output
propuesto, es esperable que estos datos procesados (o intermedios) los guardemos en output/data
para que se entienda que provienen de un proceso de manipulación personal
El archivo se puede guardar en distintos formatos:
a) .RData y .rds
Guardar un objeto a un archivo
saveRDS(objecto, file = “datos.rds”)
Guardar un objeto a un archivo save(objeto1, objeto2, file = “datos.RData)
Es lo recomendable, si el resto del análisis lo realizaremos en R.
save(datos_proc, file = "output/data/datos_proc.RData") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.RData.
saveRDS(datos_proc, file= "output/data/datos_proc.rds") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.rds.
b) .sav (haven
)
write_sav(datos_proc, "output/data/datos_proc.sav") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.sav.
b) .dta (haven
)
write_dta(datos_proc, "output/data/datos_proc.dta") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.dta.
b) .csv
write.csv(datos_proc, "output/data/datos_proc.csv") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.csv.
b) .xlsx
writexl::write_xlsx(datos_proc, "output/data/datos_proc.xlsx") #Guardamos el objeto datos_proc en la ruta de trabajo actual, bajo el nombre de datos_proc.xlsx.
Resumen
¡Eso es todo por este práctico! Aquí, aprendimos a:
-
- Importar datos en diferentes formatos.
-
- Seleccionar variables (y hacer una revisión de ciertos aspectos de estas).
-
- Limpiar los datos, eliminando casos perdidos
-
- Guardar y exportar los datos procesados, en distintos formatos.
Reporte de progreso
¡Recuerda rellenar tu reporte de progreso. Te llegó un código único a tu correo electrónico. Mediante él debes acceder para actualizar tu estado de avance del curso.