簡介
第二週的課程,正式進入到個案的部分。本次要探討的主題是如何預測房價?相信這是很多人都想要知道的一件事情,尤其在買賣房屋的時候。假設我們是買方,我們會想要知道這間房子大概值多少錢?它有三層樓,坪數是一百二十坪,有三間浴室,附有兩個停車位。
我們使用到一個很基本的分析方法,回歸方程式。一條回歸方程式分為兩個部份:自變數
(independed variable)與應變數
(dependend variable)。顧名思義,自變數
就是可以我們自己來改變它的值的數字,像是每間房子的大小、浴室數量等,這些我們也把它稱為屬性。而應變數
指的就是會隨著自變數而跟著改變的數值,像是房子的價格會隨著坪數的大小而改變。
而透過回歸的方式就是希望可以找到一條方程式,把自變數
的值(房子的屬性)丟進去之後,就可以得到應變數
(價錢)是多少。
有了這最基本的認知之後,就可以開始使用python去做分析與預測了(詳細關於回歸方程式的介紹我在此就先不多說,有興趣可以自行翻閱相關資料,或是我有空再補充)。
#程式實作1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16import graphlab
# 載入房地產的資料
sales = graphlab.SFrame('home_data.gl/')
# 直接查看一下匯入的資料,共有21613筆資料,每筆資料有21個欄位
sales
# 將canvas的顯示目標設定在ipython notebook內
graphlab.canvas.set_target('ipynb')
sales.show(view="Scatter Plot", x="sqft_living", y="price")
#
#
#
#
#