
資料內(nèi)容:
一、線性回歸 
1、什么是線性回歸?線性回歸模型的基本原理和假設(shè)。 
線性回歸是一種廣泛用于統(tǒng)計學(xué)和機器學(xué)習(xí)中的回歸分析方法,用于建立自變量(特征)與因變量(目標(biāo))之間的 
線性關(guān)系模型。線性回歸的基本原理是尋找一條直線(或者在多維情況下是一個超平面),以最佳地擬合訓(xùn)練數(shù) 
據(jù),使得模型的預(yù)測與真實觀測值之間的誤差最小化。下面我們來詳細(xì)解釋線性回歸的基本原理和假設(shè)。 
簡單線性回歸模型: 
y = bo + b1 · 
多元線性回歸模型: 
y = bo + b1 · 1+ b2 · 2 + … +bp · Cp 
其中: 
是因變量(需要預(yù)測的值)。 
1 
2 
… … 是自變量(特征),可以是一個或多個。 
bo 是截距(模型在自變量都為0時的預(yù)測值)。 
b1 b2 … bp 是回歸系數(shù),表示自變量對因變量的影響程度。 
線性回歸的目標(biāo)是找到合適的回歸系數(shù) bo b1 …bp,以最小化模型的預(yù)測誤差。通常采用最小二乘法來估計這 
些系數(shù),即使得觀測值與模型預(yù)測值之間的殘差平方和最小。 
線性回歸模型的有效性基于以下一些關(guān)鍵假設(shè):1 、線性關(guān)系假設(shè):線性回歸假設(shè)因變量和自變量之間存在線性關(guān)系。這意味著模型試圖用一條直線(或超平面) 
來擬合數(shù)據(jù),以描述自變量與因變量之間的關(guān)系。 
2 、獨立性假設(shè):線性回歸假設(shè)每個觀測值之間是相互獨立的。這意味著一個觀測值的誤差不受其他觀測值的影 
響。 
3 、常數(shù)方差假設(shè):線性回歸假設(shè)在自變量的每個取值點上,觀測值的誤差方差都是常數(shù)。這被稱為同方差性或等 
方差性。 
4 、正態(tài)性假設(shè):線性回歸假設(shè)觀測值的誤差服從正態(tài)分布。這意味著在不同自變量取值點上的誤差應(yīng)該接近正態(tài) 
分布。 
如果這些假設(shè)不滿足,線性回歸模型的結(jié)果可能不可靠。
 
                