{
"cells": [
{
"cell_type": "markdown",
"id": "161e30de",
"metadata": {},
"source": [
"
\n",
"\n",
"\n",
"# Hands-on with socio4health: effects of hydrometeorologigcal hazards and urbanization on dengue risk in Brazil \n",
"\n"
]
},
{
"cell_type": "markdown",
"id": "0696ab2e",
"metadata": {},
"source": [
"**Run the tutorial via free cloud platforms:** [](https://mybinder.org/v2/gh/harmonize-tools/socio4health/HEAD?urlpath=%2Fdoc%2Ftree%2Fdocs%2Fsource%2Fnotebooks%2Fexample_brazil.ipynb) \n",
" \n",
""
]
},
{
"cell_type": "markdown",
"id": "7d0056d2",
"metadata": {},
"source": [
"This notebook provides a real-world example of how to use **socio4health** to **retrieve**, **harmonize** and **analyze** **socioeconomic and demographic** variables, such as the level of urbanization and access to water supply in Brazil, to recreate the dataset used in the publication *Combined effects of hydrometeorological hazards and urbanisation on dengue risk in Brazil: a spatiotemporal modelling study* by Lowe et al., published in *The Lancet Planetary Health* in 2021 ([DOI](https://doi.org/10.1016/S2542-5196(20)30292-8)). The study evaluated how the association between hydrometeorological events and **dengue** risk varies with these variables. This tutorial assumes an **intermediate** or **advanced** understanding of **Python** and data manipulation.\n",
"\n",
"## Setting up the environment\n",
"\n",
"To run this notebook, you need to have the following prerequisites:\n",
"\n",
"- **Python 3.10+**\n",
"\n",
"Additionally, you need to install the `socio4health` and `pandas` package, which can be done using ``pip``:\n",
"\n"
]
},
{
"cell_type": "code",
"execution_count": 1,
"id": "936cbd3c",
"metadata": {
"ExecuteTime": {
"end_time": "2025-09-24T15:47:04.783758Z",
"start_time": "2025-09-24T15:47:00.244317Z"
}
},
"outputs": [],
"source": [
"!pip install socio4health pandas -q"
]
},
{
"metadata": {},
"cell_type": "markdown",
"source": "In case you want to run this notebook in **Google Colab**, you also need to run the following command to use your files stored in **Google Drive**:",
"id": "a6bf4e15a2607598"
},
{
"metadata": {},
"cell_type": "code",
"outputs": [],
"execution_count": null,
"source": [
"from google.colab import drive\n",
"drive.mount('/content/drive')"
],
"id": "5e413e59ab16bedc"
},
{
"cell_type": "markdown",
"id": "83710eb4",
"metadata": {},
"source": [
"## Import Libraries\n",
"\n",
"To perform the data extraction, the `socio4health` library provides the `Extractor` class for data extraction, and the `Harmonizer` class for data harmonization of the retrieved date. `pandas` will be used for data manipulation. Additionally, we will use some utility functions from the `socio4health.utils.harmonizer_utils` module to **standardize** and **translate** the dictionary.\n"
]
},
{
"cell_type": "code",
"execution_count": 2,
"id": "ce028ae1",
"metadata": {
"ExecuteTime": {
"end_time": "2025-09-24T15:47:34.053624Z",
"start_time": "2025-09-24T15:47:10.194253Z"
}
},
"outputs": [],
"source": [
"import re\n",
"import pandas as pd\n",
"import dask.dataframe as dd\n",
"import matplotlib.pyplot as plt\n",
"from matplotlib.ticker import FuncFormatter\n",
"from socio4health import Extractor\n",
"from socio4health.harmonizer import Harmonizer\n",
"from socio4health.utils import harmonizer_utils, extractor_utils"
]
},
{
"cell_type": "markdown",
"id": "877441c8",
"metadata": {},
"source": [
"## 1. Load and standardize the dictionary\n",
"To harmonize the data, provide a dictionary that describes the variables in the dataset. The study retrieved data from the 2010 census, from Instituto Brasileiro de Geografia e Estatística (**IBGE**). The dictionary for the census data can be found [here](https://ftp.ibge.gov.br/Censos/Censo_Demografico_2010/Resultados_Gerais_da_Amostra/Microdados/Documentacao.zip). Follow the steps in the tutorial [\"How to Create a Raw Dictionary for Data Harmonization\"](https://harmonize-tools.github.io/socio4health/dictionary.html) to create a raw dictionary in Excel format.\n",
"\n",
"This dictionary must be standardized and translated to English. The `socio4health.utils.harmonizer_utils` module provides utility functions to perform these tasks. Additionally, the `socio4health.utils.extractor_utils` module provides utility functions to parse fixed-width file (FWF) dictionaries, which is the format used in the **IBGE** census data.\n"
]
},
{
"cell_type": "markdown",
"id": "b58f709ed499f61f",
"metadata": {},
"source": []
},
{
"cell_type": "code",
"execution_count": 3,
"id": "d2b84f67",
"metadata": {
"ExecuteTime": {
"end_time": "2025-09-24T15:47:40.379186Z",
"start_time": "2025-09-24T15:47:39.366302Z"
}
},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"c:\\Users\\Juan\\anaconda3\\envs\\social4health\\Lib\\site-packages\\socio4health\\utils\\harmonizer_utils.py:98: FutureWarning: DataFrameGroupBy.apply operated on the grouping columns. This behavior is deprecated, and in a future version of pandas the grouping columns will be excluded from the operation. Either pass `include_groups=False` to exclude the groupings or explicitly select the grouping columns after groupby to silence this warning.\n",
" .apply(_process_group, include_groups=True)\\\n"
]
}
],
"source": [
"raw_dic = pd.read_excel(\"raw_dictionary_br_2010.xlsx\")\n",
"dic=harmonizer_utils.s4h_standardize_dict(raw_dic)\n",
"colnames, colspecs =extractor_utils.s4h_parse_fwf_dict(dic)\n"
]
},
{
"cell_type": "markdown",
"id": "9ae230acce982f32",
"metadata": {},
"source": [
"This is how the standardized dictionary looks:"
]
},
{
"cell_type": "code",
"execution_count": 4,
"id": "21a8b4b0d057b20b",
"metadata": {
"ExecuteTime": {
"end_time": "2025-09-24T15:47:57.294782Z",
"start_time": "2025-09-24T15:47:57.253131Z"
}
},
"outputs": [
{
"data": {
"application/vnd.microsoft.datawrangler.viewer.v0+json": {
"columns": [
{
"name": "index",
"rawType": "int64",
"type": "integer"
},
{
"name": "variable_name",
"rawType": "object",
"type": "string"
},
{
"name": "question",
"rawType": "object",
"type": "string"
},
{
"name": "description",
"rawType": "float64",
"type": "float"
},
{
"name": "value",
"rawType": "object",
"type": "unknown"
},
{
"name": "initial_position",
"rawType": "object",
"type": "unknown"
},
{
"name": "final_position",
"rawType": "float64",
"type": "float"
},
{
"name": "size",
"rawType": "object",
"type": "unknown"
},
{
"name": "dec",
"rawType": "float64",
"type": "float"
},
{
"name": "type",
"rawType": "object",
"type": "string"
},
{
"name": "possible_answers",
"rawType": "object",
"type": "unknown"
}
],
"ref": "db429a7c-65ff-4cce-89d6-f580cb8fdab0",
"rows": [
[
"0",
"V0402",
"a responsabilidade pelo domicílio é de:",
null,
"1.0; 2.0; 9.0",
"107.0",
"107.0",
"1.0",
null,
"C",
"apenas um morador; mais de um morador; ignorado"
],
[
"1",
"V0209",
"abastecimento de água, canalização:",
null,
"1.0; 2.0; 3.0",
"90.0",
"90.0",
"1.0",
null,
"C",
"sim, em pelo menos um cômodo; sim, só na propriedade ou terreno; não"
],
[
"2",
"V0208",
"abastecimento de água, forma:",
null,
"1.0; 2.0; 3.0; 4.0; 5.0; 6.0; 7.0; 8.0; 9.0; 10.0",
"88.0",
"89.0",
"2.0",
null,
"C",
"rede geral de distribuição; poço ou nascente na propriedade; poço ou nascente fora da propriedade; carro-pipa; água da chuva armazenada em cisterna; água da chuva armazenada de outra forma; rios, açudes, lagos e igarapés; outra; poço ou nascente na aldeia; poço ou nascente fora da aldeia"
],
[
"3",
"V6210",
"adequação da moradia",
null,
"1.0; 2.0; 3.0",
"144.0",
"144.0",
"1.0",
null,
"C",
"adequada; semi-adequada; inadequada"
],
[
"4",
"V0301",
"alguma pessoa que morava com você(s) estava morando em outro país em 31 de julho de 2010:",
null,
"1.0; 2.0",
"104.0",
"104.0",
"1.0",
null,
"C",
"sim; não"
],
[
"5",
"V2012",
"aluguel em nº de salários mínimos",
null,
null,
"65.0",
"73.0",
"4.0",
"5.0",
"N",
null
],
[
"6",
"V0222",
"automóvel para uso particular, existência:",
null,
"1.0; 2.0",
"103.0",
"103.0",
"1.0",
null,
"C",
"sim; não"
],
[
"7",
"V0205",
"banheiros de uso exclusivo, número:",
null,
"0.0; 1.0; 2.0; 3.0; 4.0; 5.0; 6.0; 7.0; 8.0; 9.0",
"85.0",
"85.0",
"1.0",
null,
"C\n",
"zero banheiros; um banheiro; dois banheiros; três banheiros; quatro banheiros; cinco banheiros; seis banheiros; sete banheiros; oito banheiros; nove ou mais banheiros"
],
[
"8",
"V0300",
"controle",
null,
null,
"21.0",
"28.0",
"8.0",
null,
"N",
null
],
[
"9",
"V1002",
"código da mesorregião:",
null,
null,
"46.0",
"47.0",
"2.0",
null,
"A",
null
],
[
"10",
"V1003",
"código da microrregião:",
null,
null,
"48.0",
"50.0",
"3.0",
null,
"A",
null
],
[
"11",
"V1004",
"código da região metropolitana:",
null,
null,
"51.0",
"52.0",
"2.0",
null,
"A",
null
],
[
"12",
"V0002",
"código do município",
null,
null,
"3.0",
"7.0",
"5.0",
null,
"A",
null
],
[
"13",
"V0204",
"cômodos como dormitório, número:",
null,
null,
"80.0",
"81.0",
"2.0",
null,
"N",
null
],
[
"14",
"V0203",
"cômodos, número:",
null,
null,
"75.0",
"76.0",
"2.0",
null,
"N",
null
],
[
"15",
"V0701",
"de agosto de 2009 a julho de 2010, faleceu alguma pessoa que morava com você(s) (inclusive crianças recém-nascidas e idosos):",
null,
"1.0; 2.0",
"108.0",
"108.0",
"1.0",
null,
"C",
"sim; não"
],
[
"16",
"V6204",
"densidade de morador / dormitório",
null,
null,
"82.0",
"84.0",
"2.0",
"1.0",
"N",
null
],
[
"17",
"V6203",
"densidade de morador/cômodo",
null,
null,
"77.0",
"79.0",
"2.0",
"1.0",
"N",
null
],
[
"18",
"V0201",
"domicílio, condição de ocupação:",
null,
"1.0; 2.0; 3.0; 4.0; 5.0; 6.0",
"58.0",
"58.0",
"1.0",
null,
"C\n",
"próprio de algum morador - já pago; próprio de algum morador - ainda pagando; alugado; cedido por empregador; cedido de outra forma; outra condição"
],
[
"19",
"V0211",
"energia elétrica, existência:",
null,
"1.0; 2.0; 3.0",
"92.0",
"92.0",
"1.0",
null,
"C",
"sim, de companhia distribuidora; sim, de outras fontes; não existe energia elétrica"
],
[
"20",
"V0207",
"esgotamento sanitário, tipo:",
null,
"1.0; 2.0; 3.0; 4.0; 5.0; 6.0",
"87.0",
"87.0",
"1.0",
null,
"C\n",
"rede geral de esgoto ou pluvial; fossa séptica; fossa rudimentar; vala; rio, lago ou mar; outro"
],
[
"21",
"V6600",
"espécie da unidade doméstica",
null,
"1.0; 2.0; 3.0; 4.0",
"143.0",
"143.0",
"1.0",
null,
"C",
"unipessoal; nuclear; estendida; composta"
],
[
"22",
"V4001",
"espécie de unidade visitada:",
null,
"1.0; 2.0; 5.0; 6.0",
"54.0",
"55.0",
"2.0",
null,
"C\n",
"domicílio particular permanente ocupado; domicílio particular permanente ocupado sem entrevista realizada; domicílio particular improvisado ocupado; domicílio coletivo com morador"
],
[
"23",
"V0212",
"existência de medidor ou relógio, energia elétrica, companhia distribuidora:",
null,
"1.0; 2.0; 3.0",
"93.0",
"93.0",
"1.0",
null,
"C\n",
"sim, de uso exclusivo; sim, de uso comum; não tem medidor ou relógio"
],
[
"24",
"V0216",
"geladeira, existência:",
null,
"1.0; 2.0",
"97.0",
"97.0",
"1.0",
null,
"C",
"sim; não"
],
[
"25",
"V0210",
"lixo, destino:",
null,
"1.0; 2.0; 3.0; 4.0; 5.0; 6.0; 7.0",
"91.0",
"91.0",
"1.0",
null,
"C\n",
"coletado diretamente por serviço de limpeza; colocado em caçamba de serviço de limpeza; queimado (na propriedade); enterrado (na propriedade); jogado em terreno baldio ou logradouro; jogado em rio, lago ou mar; tem outro destino"
],
[
"26",
"M0201",
"marca de imputação na v0201:",
null,
"1.0; 2.0",
"145.0",
"145.0",
"1.0",
null,
"C",
"sim; não"
],
[
"27",
"M0202",
"marca de imputação na v0202:",
null,
"1.0; 2.0",
"147.0",
"147.0",
"1.0",
null,
"C",
"sim; não"
],
[
"28",
"M0203",
"marca de imputação na v0203:",
null,
"1.0; 2.0",
"148.0",
"148.0",
"1.0",
null,
"C",
"sim; não"
],
[
"29",
"M0204",
"marca de imputação na v0204:",
null,
"1.0; 2.0",
"149.0",
"149.0",
"1.0",
null,
"C",
"sim; não"
],
[
"30",
"M0205",
"marca de imputação na v0205:",
null,
"1.0; 2.0",
"150.0",
"150.0",
"1.0",
null,
"C",
"sim; não"
],
[
"31",
"M0206",
"marca de imputação na v0206:",
null,
"1.0; 2.0",
"151.0",
"151.0",
"1.0",
null,
"C",
"sim; não"
],
[
"32",
"M0207",
"marca de imputação na v0207:",
null,
"1.0; 2.0",
"152.0",
"152.0",
"1.0",
null,
"C",
"sim; não"
],
[
"33",
"M0208",
"marca de imputação na v0208:",
null,
"1.0; 2.0",
"153.0",
"153.0",
"1.0",
null,
"C",
"sim; não"
],
[
"34",
"M0209",
"marca de imputação na v0209:",
null,
"1.0; 2.0",
"154.0",
"154.0",
"1.0",
null,
"C",
"sim; não"
],
[
"35",
"M0210",
"marca de imputação na v0210:",
null,
"1.0; 2.0",
"155.0",
"155.0",
"1.0",
null,
"C",
"sim; não"
],
[
"36",
"M0211",
"marca de imputação na v0211:",
null,
"1.0; 2.0",
"156.0",
"156.0",
"1.0",
null,
"C",
"sim; não"
],
[
"37",
"M0212",
"marca de imputação na v0212:",
null,
"1.0; 2.0",
"157.0",
"157.0",
"1.0",
null,
"C",
"sim; não"
],
[
"38",
"M0213",
"marca de imputação na v0213:",
null,
"1.0; 2.0",
"158.0",
"158.0",
"1.0",
null,
"C",
"sim; não"
],
[
"39",
"M0214",
"marca de imputação na v0214:",
null,
"1.0; 2.0",
"159.0",
"159.0",
"1.0",
null,
"C",
"sim; não"
],
[
"40",
"M0215",
"marca de imputação na v0215:",
null,
"1.0; 2.0",
"160.0",
"160.0",
"1.0",
null,
"C",
"sim; não"
],
[
"41",
"M0216",
"marca de imputação na v0216:",
null,
"1.0; 2.0",
"161.0",
"161.0",
"1.0",
null,
"C",
"sim; não"
],
[
"42",
"M0217",
"marca de imputação na v0217:",
null,
"1.0; 2.0",
"162.0",
"162.0",
"1.0",
null,
"C",
"sim; não"
],
[
"43",
"M0218",
"marca de imputação na v0218:",
null,
"1.0; 2.0",
"163.0",
"163.0",
"1.0",
null,
"C",
"sim; não"
],
[
"44",
"M0219",
"marca de imputação na v0219:",
null,
"1.0; 2.0",
"164.0",
"164.0",
"1.0",
null,
"C",
"sim; não"
],
[
"45",
"M0220",
"marca de imputação na v0220:",
null,
"1.0; 2.0",
"165.0",
"165.0",
"1.0",
null,
"C",
"sim; não"
],
[
"46",
"M0221",
"marca de imputação na v0221:",
null,
"1.0; 2.0",
"166.0",
"166.0",
"1.0",
null,
"C",
"sim; não"
],
[
"47",
"M0222",
"marca de imputação na v0222:",
null,
"1.0; 2.0",
"167.0",
"167.0",
"1.0",
null,
"C",
"sim; não"
],
[
"48",
"M0301",
"marca de imputação na v0301:",
null,
"1.0; 2.0",
"168.0",
"168.0",
"1.0",
null,
"C",
"sim; não"
],
[
"49",
"M0401",
"marca de imputação na v0401:",
null,
"1.0; 2.0",
"169.0",
"169.0",
"1.0",
null,
"C",
"sim; não"
]
],
"shape": {
"columns": 10,
"rows": 76
}
},
"text/html": [
"
| \n", " | variable_name | \n", "question | \n", "description | \n", "value | \n", "initial_position | \n", "final_position | \n", "size | \n", "dec | \n", "type | \n", "possible_answers | \n", "
|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "V0402 | \n", "a responsabilidade pelo domicílio é de: | \n", "NaN | \n", "1.0; 2.0; 9.0 | \n", "107.0 | \n", "107.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "apenas um morador; mais de um morador; ignorado | \n", "
| 1 | \n", "V0209 | \n", "abastecimento de água, canalização: | \n", "NaN | \n", "1.0; 2.0; 3.0 | \n", "90.0 | \n", "90.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim, em pelo menos um cômodo; sim, só na propr... | \n", "
| 2 | \n", "V0208 | \n", "abastecimento de água, forma: | \n", "NaN | \n", "1.0; 2.0; 3.0; 4.0; 5.0; 6.0; 7.0; 8.0; 9.0; 10.0 | \n", "88.0 | \n", "89.0 | \n", "2.0 | \n", "NaN | \n", "C | \n", "rede geral de distribuição; poço ou nascente n... | \n", "
| 3 | \n", "V6210 | \n", "adequação da moradia | \n", "NaN | \n", "1.0; 2.0; 3.0 | \n", "144.0 | \n", "144.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "adequada; semi-adequada; inadequada | \n", "
| 4 | \n", "V0301 | \n", "alguma pessoa que morava com você(s) estava mo... | \n", "NaN | \n", "1.0; 2.0 | \n", "104.0 | \n", "104.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim; não | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 71 | \n", "V0214 | \n", "televisão, existência: | \n", "NaN | \n", "1.0; 2.0 | \n", "95.0 | \n", "95.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim; não | \n", "
| 72 | \n", "V4002 | \n", "tipo de espécie: | \n", "NaN | \n", "11.0; 12.0; 13.0; 14.0; 15.0; 51.0; 52.0; 53.0... | \n", "56.0 | \n", "57.0 | \n", "2.0 | \n", "NaN | \n", "C\\n | \n", "casa; casa de vila ou em condomínio; apartamen... | \n", "
| 73 | \n", "V0001 | \n", "unidade da federação: | \n", "NaN | \n", "11.0; 12.0; 13.0; 14.0; 15.0; 16.0; 17.0; 21.0... | \n", "1.0 | \n", "2.0 | \n", "2.0 | \n", "NaN | \n", "A | \n", "rondônia; acre; amazonas; roraima; pará; amapá... | \n", "
| 74 | \n", "V2011 | \n", "valor do aluguel (em reais) | \n", "NaN | \n", "NaN | \n", "59.0 | \n", "64.0 | \n", "6.0 | \n", "NaN | \n", "N | \n", "NaN | \n", "
| 75 | \n", "V0011 | \n", "área de ponderação | \n", "NaN | \n", "NaN | \n", "8.0 | \n", "20.0 | \n", "13.0 | \n", "NaN | \n", "A | \n", "NaN | \n", "
76 rows × 10 columns
\n", "| \n", " | variable_name | \n", "question | \n", "description | \n", "value | \n", "initial_position | \n", "final_position | \n", "size | \n", "dec | \n", "type | \n", "possible_answers | \n", "question_en | \n", "description_en | \n", "possible_answers_en | \n", "category | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "V0402 | \n", "a responsabilidade pelo domicílio é de: | \n", "NaN | \n", "1.0; 2.0; 9.0 | \n", "107.0 | \n", "107.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "apenas um morador; mais de um morador; ignorado | \n", "Responsibility for the home is: | \n", "NaN | \n", "just one resident; more than one resident; ign... | \n", "Housing | \n", "
| 1 | \n", "V0209 | \n", "abastecimento de água, canalização: | \n", "NaN | \n", "1.0; 2.0; 3.0 | \n", "90.0 | \n", "90.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim, em pelo menos um cômodo; sim, só na propr... | \n", "water supply, plumbing: | \n", "NaN | \n", "yes, in at least one room; yes, only on the pr... | \n", "Housing | \n", "
| 2 | \n", "V0208 | \n", "abastecimento de água, forma: | \n", "NaN | \n", "1.0; 2.0; 3.0; 4.0; 5.0; 6.0; 7.0; 8.0; 9.0; 10.0 | \n", "88.0 | \n", "89.0 | \n", "2.0 | \n", "NaN | \n", "C | \n", "rede geral de distribuição; poço ou nascente n... | \n", "water supply, form: | \n", "NaN | \n", "general distribution network; well or spring o... | \n", "Business | \n", "
| 3 | \n", "V6210 | \n", "adequação da moradia | \n", "NaN | \n", "1.0; 2.0; 3.0 | \n", "144.0 | \n", "144.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "adequada; semi-adequada; inadequada | \n", "suitability of housing | \n", "NaN | \n", "adequate; semi-adequate; inappropriate | \n", "Housing | \n", "
| 4 | \n", "V0301 | \n", "alguma pessoa que morava com você(s) estava mo... | \n", "NaN | \n", "1.0; 2.0 | \n", "104.0 | \n", "104.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim; não | \n", "someone who lived with you was living in anoth... | \n", "NaN | \n", "Yes; no | \n", "Business | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 71 | \n", "V0214 | \n", "televisão, existência: | \n", "NaN | \n", "1.0; 2.0 | \n", "95.0 | \n", "95.0 | \n", "1.0 | \n", "NaN | \n", "C | \n", "sim; não | \n", "television, existence: | \n", "NaN | \n", "Yes; no | \n", "Identification | \n", "
| 72 | \n", "V4002 | \n", "tipo de espécie: | \n", "NaN | \n", "11.0; 12.0; 13.0; 14.0; 15.0; 51.0; 52.0; 53.0... | \n", "56.0 | \n", "57.0 | \n", "2.0 | \n", "NaN | \n", "C\\n | \n", "casa; casa de vila ou em condomínio; apartamen... | \n", "species type: | \n", "NaN | \n", "home; town house or condominium; apartment; ho... | \n", "Housing | \n", "
| 73 | \n", "V0001 | \n", "unidade da federação: | \n", "NaN | \n", "11.0; 12.0; 13.0; 14.0; 15.0; 16.0; 17.0; 21.0... | \n", "1.0 | \n", "2.0 | \n", "2.0 | \n", "NaN | \n", "A | \n", "rondônia; acre; amazonas; roraima; pará; amapá... | \n", "federation unit: | \n", "NaN | \n", "Rondônia; acre; Amazons; roraima; to; amapá; t... | \n", "Business | \n", "
| 74 | \n", "V2011 | \n", "valor do aluguel (em reais) | \n", "NaN | \n", "NaN | \n", "59.0 | \n", "64.0 | \n", "6.0 | \n", "NaN | \n", "N | \n", "NaN | \n", "rental value (in reais) | \n", "NaN | \n", "NaN | \n", "Business | \n", "
| 75 | \n", "V0011 | \n", "área de ponderação | \n", "NaN | \n", "NaN | \n", "8.0 | \n", "20.0 | \n", "13.0 | \n", "NaN | \n", "A | \n", "NaN | \n", "weighting area | \n", "NaN | \n", "NaN | \n", "Housing | \n", "
76 rows × 14 columns
\n", "| \n", " | V0001 | \n", "V0208 | \n", "V0301 | \n", "V2012 | \n", "V0222 | \n", "V0701 | \n", "V0211 | \n", "V0207 | \n", "V0212 | \n", "M0201 | \n", "... | \n", "V0202 | \n", "V0221 | \n", "V0401 | \n", "V6531 | \n", "V6532 | \n", "V6530 | \n", "V6529 | \n", "V0206 | \n", "V1005 | \n", "V2011 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "11 | \n", "05 | \n", "0 | \n", "011000308 | \n", "3 | \n", "0 | \n", "3 | \n", "0 | \n", "3 | \n", "<NA> | \n", "... | \n", "6 | \n", "0 | \n", "30 | \n", "<NA> | \n", "<NA> | \n", "532 | \n", "0838202 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 1 | \n", "11 | \n", "01 | \n", "0 | \n", "001000030 | \n", "1 | \n", "0 | \n", "5 | \n", "0 | \n", "0 | \n", "<NA> | \n", "... | \n", "1 | \n", "0 | \n", "10 | \n", "<NA> | \n", "<NA> | \n", "043 | \n", "0949157 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 2 | \n", "11 | \n", "00 | \n", "0 | \n", "003000025 | \n", "2 | \n", "0 | \n", "3 | \n", "0 | \n", "3 | \n", "<NA> | \n", "... | \n", "0 | \n", "0 | \n", "10 | \n", "<NA> | \n", "<NA> | \n", "251 | \n", "0893810 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 3 | \n", "11 | \n", "02 | \n", "0 | \n", "002000074 | \n", "1 | \n", "0 | \n", "6 | \n", "0 | \n", "7 | \n", "<NA> | \n", "... | \n", "0 | \n", "0 | \n", "20 | \n", "<NA> | \n", "<NA> | \n", "187 | \n", "1250810 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 4 | \n", "11 | \n", "02 | \n", "0 | \n", "002000095 | \n", "1 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "<NA> | \n", "... | \n", "3 | \n", "0 | \n", "30 | \n", "<NA> | \n", "<NA> | \n", "185 | \n", "1132514 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 600041 | \n", "35 | \n", "01 | \n", "0 | \n", "002000035 | \n", "1 | \n", "0 | \n", "3 | \n", "0 | \n", "3 | \n", "<NA> | \n", "... | \n", "8 | \n", "0 | \n", "20 | \n", "<NA> | \n", "<NA> | \n", "796 | \n", "0596965 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 600042 | \n", "35 | \n", "02 | \n", "0 | \n", "004000094 | \n", "2 | \n", "0 | \n", "2 | \n", "0 | \n", "5 | \n", "<NA> | \n", "... | \n", "5 | \n", "0 | \n", "20 | \n", "<NA> | \n", "<NA> | \n", "683 | \n", "0400864 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 600043 | \n", "35 | \n", "01 | \n", "0 | \n", "011000072 | \n", "2 | \n", "0 | \n", "1 | \n", "0 | \n", "7 | \n", "<NA> | \n", "... | \n", "7 | \n", "0 | \n", "40 | \n", "<NA> | \n", "<NA> | \n", "832 | \n", "0788861 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 600044 | \n", "35 | \n", "06 | \n", "0 | \n", "003000189 | \n", "2 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "<NA> | \n", "... | \n", "3 | \n", "0 | \n", "10 | \n", "<NA> | \n", "<NA> | \n", "017 | \n", "0995361 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
| 600045 | \n", "35 | \n", "01 | \n", "0 | \n", "202000067 | \n", "3 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "<NA> | \n", "... | \n", "0 | \n", "0 | \n", "20 | \n", "<NA> | \n", "<NA> | \n", "683 | \n", "0692803 | \n", "0 | \n", "<NA> | \n", "001001 | \n", "
32004235 rows × 46 columns
\n", "