Apresentação da Biblioteca Pandas utilizando dados do AirBnB

Apresentação da Biblioteca Pandas utilizando dados do AirBnB

07-Aug-2020    

Esse projeto consiste em apresentar as funcionalidades da biblioteca Pandas utilizando os dados do AirBnb disponíveis para a Cidade do Rio de Janeiro.

Neste notebook irei apresentar os passos para importar uma base de dados diretamente para o Colab. A partir desses dados iremos utilizar ferramentas exploratórias como resumos estatísticos e histogramas. Adiante com apenas uma linha de comando faremos um gráfico em forma de mapa de calor que mostra a correlação entre as variáveis (por exemplo reviews x preço). Ao final serão apresentados exemplos de como variáveis não tratada prejudicam a análise do conjunto, assim como ferramentas para identificar e tratar esses desvios.

o post completo pode ser acessado aqui

A seguir são apresentados alguns resultados obtidos com a biblioteca durante os estudos:

Distribuição das Vairáveis

# plotar o histograma das variáveis numéricas
df.hist(bins = 15, figsize=(15,10));

Correlação entre as Variáveis Para plotar um mapa de calor que indica visualmente a correlação entre as variáveis usamos

sns.heatmap(corr, cmap='RdBu', fmt='.2f', square=True, linecolor='white', annot=True);