久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

R語言線性回歸怎么使用

158次閱讀
沒有評論

共計 1852 個字符,預(yù)計需要花費(fèi) 5 分鐘才能閱讀完成。

這篇文章主要講解了“R 語言線性回歸怎么使用”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著丸趣 TV 小編的思路慢慢深入,一起來研究和學(xué)習(xí)“R 語言線性回歸怎么使用”吧!

一、R 安裝

R for Mac OS

RStudio

二、線性回歸基礎(chǔ)

eg1:

憑我們的學(xué)習(xí)經(jīng)驗可知,物理成績確實與數(shù)學(xué)成績有一定的關(guān)系。但是除此之外,還存在其他影響物理成績的因素, 例如,,是否喜歡物理,用再物理學(xué)習(xí)上的時間等

eg2:

商品銷售收入與廣告支出經(jīng)費(fèi)之間的關(guān)系,商品銷售收入與廣告支出經(jīng)費(fèi)有著密切的聯(lián)系。但是還有很多其他因素

eg3:

糧食產(chǎn)量與施肥量之間的關(guān)系。在一定范圍內(nèi),施肥量越大,糧食產(chǎn)量就越高,但是施肥量并不是影響糧食產(chǎn)量的唯一因素。

年齡 23273941454950 脂肪 9.517.821.225.927.526.328.2 年齡 53545657586061 脂肪 29.630.231.430.833.535.234.6

人體的脂肪含量與年齡之間的有怎樣的關(guān)系?

首先我們做散點圖。以 x 軸表示年齡,y 軸表示脂肪。(自己做散點圖,)

從散點圖,可以看出,它們散布在從左下角到右上角的區(qū)域。對于兩個變量的這種相關(guān)關(guān)系,我們稱之為正相關(guān)。還有一些變量,例如汽車的重量和汽車每消耗 lL 汽油所行駛的平均路程,稱為負(fù)相關(guān)。

從散點圖可以看出,這些點大致分布在通過散點圖中心的一條直線附近。如果散點圖中心分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線稱為回歸直線 (regression line). 如果能夠求出這條回歸直線的方程 (回歸方程),那么我們就比較清楚了解年齡與脂肪的關(guān)系。

最小二乘法

實際上,求回歸方程的關(guān)鍵是如何用數(shù)學(xué)的方法刻畫“從整體上看,各點到此直線的距離最小”

假設(shè)該直線為 y = bx + a

注意:

(x1,y1)(x2,y2)…(xi,yi).. 一個個點。到直線的距離,我們可以用點到直線的距離算出,但是這個比較復(fù)雜。

所以第一個簡化 == 點 (xi,yi) , 垂直向上,或垂直向下到直線的距離  yi – y = yi – (bxi + a)

但是 yi – y 有正負(fù)之分,所以我們第二次簡化,算平方

Q = (y1 – bx1 – a)^2 + (y2 – bx2 – a)^2 + …. + (yi – bxi – a)^2 + …

只要計算出使得 Q 的最小的 a 和 b,就能得到該回歸方程。 

可以使用偏導(dǎo)數(shù)計算得出 a,b

a = …

b = …

b 是回歸直線的斜率,a 是截距

相關(guān)關(guān)系的強(qiáng)弱

我們知道不是所有兩個變量的關(guān)系都是線性的,如何判斷是否能使用線性回歸呢?

統(tǒng)計中用相關(guān)系數(shù) r 來衡量兩個變量之間的線性關(guān)系強(qiáng)弱。

r = …

統(tǒng)計學(xué)認(rèn)為 如果 r – [-1,-0.75] 那么負(fù)相關(guān)很強(qiáng),r – [-0.75,-0.30] 負(fù)相關(guān)性一般,r – [-0.25,0.25] 相關(guān)性弱,

 r – [0.75,1] 那么正相關(guān)很強(qiáng),r – [0.30,0.75] 正相關(guān)性一般,

三、RStudio 測試

數(shù)據(jù):

研究嬰兒生理發(fā)育 issue,并收集了 10 名嬰兒在出生后一年內(nèi)的月齡和體重數(shù)據(jù)。

年齡 (月)01??0305021109030912 體重 (kg)4.45.37.25.28.57.36.010.410.2?

036.1

 我們用 c() 函數(shù)以向量的形式輸入月齡和體重
  x_age=c(1,3,5,2,11,9,3,9,12,3)
  y_weight=c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)
  mean(y_weight) =   計算平均數(shù)
[1] 7.06
  sd(y_weight) =   計算標(biāo)準(zhǔn)差
[1] 2.077498
  cor(x_age,y_weight) =   計算相關(guān)性
[1] 0.9075655
  plot(x_age,y_weight) =   畫散點圖
  cor_xy = lm(y_weight~x_age + 1) =   設(shè)置擬合曲線方程式
  plot(cor_xy) =   畫回歸直線
  coef(cor_xy) =   計算回歸直線的斜率和截距
(Intercept) x_age 
 4.3596206 0.4655827
 
  z = data.frmae(x_age=13) 
  predict(cor_xy,z) =   我們來預(yù)測 13 個月的嬰兒的體重 

感謝各位的閱讀,以上就是“R 語言線性回歸怎么使用”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對 R 語言線性回歸怎么使用這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是丸趣 TV,丸趣 TV 小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

正文完
 
丸趣
版權(quán)聲明:本站原創(chuàng)文章,由 丸趣 2023-08-16發(fā)表,共計1852字。
轉(zhuǎn)載說明:除特殊說明外本站除技術(shù)相關(guān)以外文章皆由網(wǎng)絡(luò)搜集發(fā)布,轉(zhuǎn)載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 济阳县| 保靖县| 曲阜市| 白水县| 莱西市| 观塘区| 渑池县| 贵德县| 达拉特旗| 二连浩特市| 金川县| 柯坪县| 姚安县| 昌乐县| 武宣县| 兴义市| 石棉县| 望都县| 洛川县| 油尖旺区| 洪洞县| 昆山市| 青海省| 逊克县| 平安县| 乌拉特前旗| 顺义区| 都兰县| 礼泉县| 绍兴市| 景洪市| 修文县| 礼泉县| 海丰县| 土默特右旗| 乾安县| 灵寿县| 虞城县| 中西区| 无为县| 盐源县|