機器學習個案研究II-以回歸方程預測房價

簡介

第二週的課程,正式進入到個案的部分。本次要探討的主題是如何預測房價?相信這是很多人都想要知道的一件事情,尤其在買賣房屋的時候。假設我們是買方,我們會想要知道這間房子大概值多少錢?它有三層樓,坪數是一百二十坪,有三間浴室,附有兩個停車位。

我們使用到一個很基本的分析方法,回歸方程式。一條回歸方程式分為兩個部份:自變數(independed variable)與應變數(dependend variable)。顧名思義,自變數就是可以我們自己來改變它的值的數字,像是每間房子的大小、浴室數量等,這些我們也把它稱為屬性。而應變數指的就是會隨著自變數而跟著改變的數值,像是房子的價格會隨著坪數的大小而改變。

而透過回歸的方式就是希望可以找到一條方程式,把自變數的值(房子的屬性)丟進去之後,就可以得到應變數(價錢)是多少。

有了這最基本的認知之後,就可以開始使用python去做分析與預測了(詳細關於回歸方程式的介紹我在此就先不多說,有興趣可以自行翻閱相關資料,或是我有空再補充)。

#程式實作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import graphlab
# 載入房地產的資料
sales = graphlab.SFrame('home_data.gl/')

# 直接查看一下匯入的資料,共有21613筆資料,每筆資料有21個欄位
sales

# 將canvas的顯示目標設定在ipython notebook內
graphlab.canvas.set_target('ipynb')
sales.show(view="Scatter Plot", x="sqft_living", y="price")
#

#
#
#
#