Apresentação da Biblioteca Pandas utilizando dados do AirBnB
Esse projeto consiste em apresentar as funcionalidades da biblioteca Pandas utilizando os dados do AirBnb disponíveis para a Cidade do Rio de Janeiro.
Neste notebook irei apresentar os passos para importar uma base de dados diretamente para o Colab. A partir desses dados iremos utilizar ferramentas exploratórias como resumos estatísticos e histogramas. Adiante com apenas uma linha de comando faremos um gráfico em forma de mapa de calor que mostra a correlação entre as variáveis (por exemplo reviews x preço). Ao final serão apresentados exemplos de como variáveis não tratada prejudicam a análise do conjunto, assim como ferramentas para identificar e tratar esses desvios.
o post completo pode ser acessado aqui
A seguir são apresentados alguns resultados obtidos com a biblioteca durante os estudos:
Distribuição das Vairáveis
# plotar o histograma das variáveis numéricas
df.hist(bins = 15, figsize=(15,10));
Correlação entre as Variáveis Para plotar um mapa de calor que indica visualmente a correlação entre as variáveis usamos
sns.heatmap(corr, cmap='RdBu', fmt='.2f', square=True, linecolor='white', annot=True);