狠狠撸

狠狠撸Share a Scribd company logo
再試雲端Python編程
Patrick KT HO (何君泰)
4 October 2020
利?IBM Watson Studio平台
(?)環境設定
(?)Python 編程 - 分析 Open Data
再試雲端Python編程
利?IBM Watson Studio平台
今次會透過 IBM Cloud 新增?個相關服務?作 Python 編程。
相對 Google CoLab ??,設定步驟有點繁複!
利??個政府的開放數據集 (Open Data) 製作統計表。
(?)環境設定
Step (1):去 https://cloud.ibm.com/login 建??个帐?。
(?)環境設定 (續)
Step (2):Login 到??的帳?,跟住按左邊版?的「+」。
(?)環境設定 (續)
Step (3):按「Watson」進? Watson 服務的建置版?,在左?的版?按「Watson 服務」下的「瀏覽服務」。
(?)環境設定 (續)
Step (4):在右?版?按「Watson Studio」繼續。
(?)環境設定 (續)
Step (5):由於
Watson 是建基於
Cloud
Infrastructure 的?
個服務,因此需要建
? Virtual
Storage。在此例?
我們選擇在東京的
IBM Data Center 新
增?個免費的?案。
按「建?」繼續。
(?)環境設定 (續)
Step (6):按「Get Started」以佈建 IBM Cloud Pak for Data 核?服務。
(?)環境設定 (續)
Step (7):按「建?專案」或「新建專案」。
(?)環境設定 (續)
Step (8):我們選擇「建?空的專案」。
(?)環境設定 (續)
Step (9):輸?新專案的名稱及說明後,按「新增」。
(?)環境設定 (續)
Step (10):按「Create」新設?個 Cloud Object Storage(預設為 Lite 免費?案)。
(?)環境設定 (續)
Step (11):按「重新整理」,當?到「儲存體」下有「Cloud Object Storage ...」字眼後,按「建?」繼續。
(?)環境設定 (續)
Step (12):新專案「Testing1」的版?建?。我們需要新增?個 Jupyter 狈辞迟别产辞辞办,请按右上?的「新增?专案」。
(?)環境設定 (續)
Step (13):按「筆記本」。
(?)環境設定 (續)
Step (14):輸?新 Jupyter Notebook 的名字及 / 或說明後,按「建?」繼續。
(?)環境設定 (續)
Step (15):Jupyter Notebook 已新增。唔好開始? code 住,請在右上?按「登出」先!
(?)環境設定 (續)
Step (16):按「?即回到??」,之後輸?你的「IBM ID」 及「密碼」以再次登? IBM Cloud。
(?)環境設定 (續)
Step (17):在「儀表板」的「查詢摘要」中按
「服務」,之後在「資源清單」中的「服務」按
「Watson Studio-...」繼續。
(?)環境設定 (續)
Step (18):按「Get Started」後出現呢個版?,按下專案「Testing1」的捷徑圖示繼續。
(?)環境設定 (續)
Step (19):按「資產」以檢視專案「Testing1」 內的所有資產。
(?)環境設定 (續)
Step (20):在「筆記本」下,按 「TestBook1」 開啟 Jupyter Notebook。開啟後,Jupyter Notebook 會
以唯讀模式顯示。如開始編程,請按筆形圖示繼續!
(?)Python 編程 - 分析 Open Data
以下我們會採?由政府經濟顧問辦公室及政府統計處
共同編製的《2018年?港貧窮情況報告》的
CSV 數據集。
網?:https://www.censtatd.gov.hk/hkstat/sub/sp461_tc.jsp?productCode=B9XX0005
https://www.censtatd.gov.hk/fd.jsp?
?le=B9XX0005V2018AN18V.zip
是次例?會採?「Table 2_Chi.csv」
(?)Python 編程 - 分析 Open Data (續)
根據「Metadata_Chi.csv」顯示,「Table 2_Chi.csv」羅列在2009年?2018年期間按以下社會經濟特徵
(Socio-Economic Characteristics) 劃分的?港貧窮??數?(以千位 ('000) 計)。
? 年份

? 貧窮類別

? 住??數

? 是否綜援住?

? 是否?者住?

? 是否單親住?

? 是否有兒童住?

? 是否新移?住?

? 是否?年住?

? 經濟特徵

? 住屋特徵

? 區議會分區
? ?主年齡

? 年齡

? 性別

? 是否領取傷殘津貼

? 是否領取?齡津貼

? 是否領取?者?活津貼

? 是否新移???

? 經濟活動身分

? 職業

? 就業情況

? 就業??的教育程度
(?)Python 編程 - 分析 Open Data (續)
在開始之前,我們需要將「Table 2_Chi.csv」匯?? Watson 專案環境內。
在「資源」版?內,將
「Table 2_Chi.csv」放
?此框內或瀏覽選擇檔案
如?不到「資料」版?,請按右上?的 圖示
(?)Python 編程 - 分析 Open Data (續)
「Table 2_Chi.csv」已匯?。現在 double click 「TestBook1」
的 Jupyter Notebook 開始編程。
(?)Python 編程 - 分析 Open Data (續)
記得按筆形圖示理解除唯讀模式啊!
與 Google CoLab 相約,我們需要? Watson 本身的 API script 匯?擺放在專案內的檔案。
(?)Python 編程 - 分析 Open Data (續)
要將 API scipt 匯?? Notebook 中,請按右?的 圖示,然後在需匯?檔案名稱下的「插??程式碼」,
click 「pandas DataFrame」。
(?)Python 編程 - 分析 Open Data (續)
將「df_data_1」重新命名為「df1」,並執?圖中兩句 code。
(?)Python 編程 - 分析 Open Data (續)
執?此兩? code 以列出 column 的名稱。
(?)Python 編程 - 分析 Open Data (續)
由於「?數 ('000)」為本數據集的統計量,為避免影響稍後將其的 data type 轉為 ?oat64,因此將這些 rows
?ltered out。
(?)Python 編程 - 分析 Open Data (續)
利? rename() 將 column 中?名 rename to 英?。「?數 ('000)」需要? double quotation mark " "。
(?)Python 編程 - 分析 Open Data (續)
利? dtypes() 檢視各 columns 的 data type,然後利? astype(?oat) 將 pp 的 data type 轉為 ?oat64。
(?)Python 編程 - 分析 Open Data (續)
透過 pd.crosstab() 可編製統計表。Table 1 展示在各年份按不同貧窮類別劃分的貧窮??數?。
(?)Python 編程 - 分析 Open Data (續)
Table 2 展示在2014年
?2018年按住屋特徵及
貧窮類別劃分的貧窮?
?數?。
END

More Related Content

再試雲端Python編程:利用IBM Watson平台