Coefficient of Determination
模型與真實( 數據 )之間存在差距,稱為誤差( Error )。
由於存在 Error,便需要量度模型表達多少真實( 數據 )。
這種量度叫 Coefficient of Determination 又稱 Goodness of Fit 。
如果只是將所有 Error 相加,由於某些 Error 是正,某些是負,原則上加把這些正正負負相加,會趨向等於零。
因此,單純把 Error 相加便不可以反映出模型與真實( 數據 )之間的差別。
於是,有人把這些 Error 自乘,便可以把「正負」的問題消除。
Error ,即是模型中沒有包括( 解釋 )的部份( Unexplained ),是為盈餘( Residual )。
將所有自乘的 Error 相加,稱為 RSS ( Residual Sum of Square )。
表達法一
表達法二
TSS = Total Sum of Square
RSS = Residual of Sum square
ESS = Explained Sum of square
r 2 是指 ESS 佔 TSS 的多少,因此,原則上,
模型的 r 2越接近 1 ,表示模型表達越多真實( 數據 )的情況。