flaviaggp's picture
Update README.md
3bf5058
metadata
language:
  - pt
library_name: sklearn
model_format: pickle
model_file: model.pkl
datasets:
  - fetch_california_housing
pipeline_tag: tabular-regression
tags:
  - Regressão
  - Califórnia
  - sklearn

Descrição do modelo:

Este é um modelo de regressão linear treinado no conjunto de dados de habitação da Califórnia. O modelo foi treinado para prever o valor mediano das casas em um determinado bairro na Califórnia com base em várias características do bairro, como a renda média, a idade média da casa, o número médio de quartos, o número médio de ocupantes por casa, a latitude e a longitude.

O modelo foi avaliado usando várias métricas de erro, incluindo o Erro Quadrático Médio (MSE), o Erro Absoluto Médio (MAE) e o Coeficiente de Determinação (R^2). Além disso, a validação cruzada foi usada para obter uma estimativa mais robusta do desempenho do modelo.

Os coeficientes do modelo fornecem uma indicação da importância relativa de cada característica na previsão do valor mediano das casas. Por exemplo, um coeficiente positivo para a renda média sugere que bairros com maior renda média tendem a ter casas mais caras, enquanto um coeficiente negativo para a latitude sugere que bairros mais ao norte tendem a ter casas menos caras.

Este modelo é um exemplo de um modelo de aprendizado de máquina simples e interpretable que pode ser usado como um ponto de partida para tarefas de previsão mais complexas.

Métricas de avaliação:

Erro Quadrático Médio: 0.5558915986952441

Erro Absoluto Médio: 0.5332001304956565

Coeficiente de Determinação (R^2): 0.575787706032451

Erro Quadrático Médio Médio da Validação Cruzada: 0.5582901717686553

MedInc 0.852382

HouseAge 0.122382

AveRooms -0.305116

AveBedrms 0.371132

Population -0.002298

AveOccup -0.036624

Latitude -0.896635

Longitude -0.868927

Análise dos resultados:

Erro Quadrático Médio (MSE): O MSE é uma medida comum de erro de previsão que penaliza grandes erros mais do que pequenos erros. Seu valor é 0.5558915986952441, o que significa que, em média, as previsões do seu modelo estão cerca de 0.56 unidades distantes do valor real.

Erro Absoluto Médio (MAE): O MAE é outra medida de erro de previsão que é menos sensível a grandes erros do que o MSE. Seu valor é 0.5332001304956565, o que significa que, em média, as previsões do seu modelo estão cerca de 0.53 unidades distantes do valor real.

Coeficiente de Determinação (R^2): O R^2 é uma medida de quão bem as previsões do seu modelo se ajustam aos dados reais. Seu valor é 0.575787706032451, o que significa que seu modelo explica cerca de 57.6% da variância na variável alvo.

Erro Quadrático Médio Médio da Validação Cruzada: Este é o MSE médio calculado através da validação cruzada. Seu valor é 0.5582901717686553, o que é ligeiramente maior do que o MSE calculado no conjunto de teste. Isso sugere que seu modelo pode estar um pouco sobreajustado aos dados de treinamento.

Coeficientes do Modelo: Os coeficientes do modelo de regressão linear representam a relação entre as características (ou variáveis independentes) e a variável alvo. Por exemplo, um coeficiente de 0.852382 para ‘MedInc’ sugere que um aumento de uma unidade em ‘MedInc’ está associado a um aumento de 0.852382 na variável alvo. Isso sugere que a renda média é um forte preditor positivo da variável alvo. Da mesma forma, um coeficiente de -0.305116 para ‘AveRooms’ sugere que um aumento de uma unidade em ‘AveRooms’ está associado a uma diminuição de 0.305116 na variável alvo, indicando uma relação negativa.