Regressão Linear Simples
A regressão linear simples modela o valor esperado de um desfecho contínuo como uma função linear de uma única variável explicativa. Ela estima um intercepto e uma inclinação (coeficiente angular) pelo método dos mínimos quadrados, onde a inclinação expressa o quanto o desfecho muda, em média, para cada aumento de uma unidade no preditor. É o modelo de regressão fundamental a partir do qual modelos mais elaborados são construídos.
Definition
A regressão linear simples ajusta o modelo E(Y) = a + bX, estimando o intercepto 'a' e a inclinação 'b' ao minimizar a soma dos quadrados dos resíduos (mínimos quadrados ordinários), de modo que a inclinação quantifica a mudança média no desfecho contínuo Y por cada aumento de uma unidade no preditor único X.
Scope
Esta entrada aborda o modelo de linha reta com um preditor: o significado do intercepto e da inclinação, a estimação por mínimos quadrados, os pressupostos de linearidade, independência, variância constante e resíduos aproximadamente normais, e a interpretação do ajuste através de intervalos de confiança, previsão e o coeficiente de determinação. É um tópico metodológico, não uma orientação clínica.
Core questions
- Como uma linha reta é ajustada aos dados e o que os 'mínimos quadrados' minimizam?
- O que o intercepto e a inclinação significam substantivamente?
- Quais pressupostos devem ser válidos para que as estimativas e seus intervalos de confiança sejam válidos?
- Como a regressão linear simples se relaciona com o coeficiente de correlação?
- Como a linha ajustada é usada para estimação versus previsão?
Key concepts
- Intercepto e inclinação
- Mínimos quadrados ordinários
- Resíduos
- Pressupostos: linearidade, independência, variância constante, erros normais
- Intervalo de confiança para a inclinação
- Coeficiente de determinação (R-quadrado)
- Intervalos de confiança versus previsão
- Regressão à média
Mechanisms
O modelo postula que a média do desfecho se encontra em uma linha reta no preditor, com observações individuais dispersas em torno dessa linha. Os mínimos quadrados ordinários escolhem o intercepto e a inclinação que minimizam a soma dos quadrados das distâncias verticais (resíduos) entre os valores observados e ajustados. A estimativa da inclinação possui um erro padrão a partir do qual um intervalo de confiança e um teste de hipótese são derivados, válidos quando os resíduos são independentes, possuem variância aproximadamente constante e são aproximadamente normalmente distribuídos. O coeficiente de determinação, R-quadrado, informa a proporção da variância do desfecho explicada pelo preditor e é igual ao quadrado da correlação de Pearson no caso de um único preditor. Um intervalo de confiança descreve a incerteza na média do desfecho para um dado valor do preditor, enquanto um intervalo de previsão, que é mais amplo, descreve a incerteza em uma observação futura individual.
Clinical relevance
A regressão linear simples aparece em toda a literatura da saúde para descrever como uma medida contínua se relaciona com outra e para construir relações de referência e linhas de calibração. O reconhecimento de seus pressupostos faz parte da avaliação de tais análises. Esta entrada descreve o método e não é uma base para decisões individuais de diagnóstico ou tratamento.
Evidence & guidelines
Textos padrão de estatística médica e a série BMJ Statistics Notes descrevem como as linhas de regressão, inclinações e seus intervalos de confiança devem ser relatados e interpretados, e enfatizam a verificação dos resíduos antes de confiar em uma linha ajustada.
History
O modelo de linha reta remonta à observação de Francis Galton, no século XIX, da 'regressão à média' em traços hereditários, o fenômeno que deu nome à regressão, e ao método dos mínimos quadrados desenvolvido anteriormente em astronomia e geodésia. Pearson e seus sucessores formalizaram a inferência para a inclinação, e o modelo tornou-se o ponto de entrada para o aparato mais amplo de regressão da bioestatística moderna.
Key figures
- Francis Galton
- Karl Pearson
- Douglas Altman
- Martin Bland
Related topics
Seminal works
- altman-1991
- kutner-2005
Frequently asked questions
- O que significa a inclinação em uma regressão linear simples?
- A inclinação é a mudança média no desfecho para cada aumento de uma unidade no preditor. Seu intervalo de confiança e valor-p indicam a precisão com que é estimada e se a associação é distinguível de nenhuma relação.
- Qual é a diferença entre um intervalo de confiança e um intervalo de previsão para uma linha de regressão?
- Um intervalo de confiança expressa a incerteza sobre a média do desfecho para um dado valor do preditor, enquanto um intervalo de previsão, que é mais amplo, expressa a incerteza sobre uma nova observação individual para esse valor, pois também inclui a dispersão dos pontos em torno da linha.