Contact info: (852) 3480 4230, info@smartcity.org.hk
EVENTS AND PROJECTS

「大數據與機器學習現成工具及算法的使用」講堂 (8月25日)

Image

智慧城市聯盟(SCC)為協助各行業利用數據分析提升生產力,將於 8月25日(星期五)下午4至6時於中環皇后大道中99號中環中心地下 H6 CONET 活動室E舉辦 「 大數據與機器學習現成工具及算法的使用 」講堂,介紹以機器學習軟件和算法概述。
歡迎現場出席或網上參加,費用全免。報名請瀏覽 https://forms.gle/8cNyNnyf8U51h75T9 。
查詢請電3480 4230或電郵 This email address is being protected from spambots. You need JavaScript enabled to view it. 與SCC秘書處聯絡。
講堂由智慧城市聯盟副會長兼研究及藍圖委員會主席秦仲宇先生主持,講者是聶經緯先生 (數據科學理學碩士、VTC智慧城市專業文憑導師、特許公認會計師公會資深會員)。
------------------------------------------------------
智慧城市聯盟為協助各行業利用數據分析提升生產力及營銷效率,現正舉辦一系列的數據分析講堂,上一堂於6月16日舉行,以「以數據集進行機器學習和案例研究」為主題,由智慧城市聯盟副會長秦仲宇先生主持,聶經緯先生主講。活動獲政府創新科技署資助,及香港電商協會贊助。

聶先生開宗明義說,數據準確性對於決策至關重要, 無論是人為操作錯誤,或是資料傳輸中的問題,都可能導致資料不準確。他說,準備數據其實佔整項工作的八成,剩餘的其實不是很困難。

這講堂集中講述如何準備有質素的數據,包括採集,清洗,資料欠漏及noise 的處理、載入和轉換將之成為機器可讀,及探索及未來檢視的做法。

聶講師提醒資料的完整性是資料價值的基石,不完整的數據可能導致誤導性的結果,產生不利影響。

另外,數據不一致性也要處理;由於數據可能來自不同的來源,不同部門或機構所使用的資料標準和格式可能有所不同,這導致數據之間存在不一致性,需要整合,確保互通;將數據整合資料在一起時,重複或多餘的數據要予以去除。

講堂也提到ETL概念,即擷取 (extract)、轉換 (transform) 和載入 (load) ;也談到資料倉儲 (data Warehouse)。

他說,利用機器學習,可以自動化數據處理和分析。機器學習演算法是從資料中的自動分析過程中看到規律,並利用規律對未知資料進行預測的演算法。

他亦有講述機器學習的「監督學習」、「非監督學習」,和探索性分析(Exploratory Data Analysis, EDA)。有些機器學習模型可協助洞悉數據相互間的現象,有些不能。

聶講師最後介紹機器學習和人工智能的一些商業案例。

6月的講堂線上線下共有155位參加者。其中一位參加者陳先生說,
一直以為處理數據分析,要投資很多人力物力在硬軟件方面,原來數據的採摘及整理才是最重要的,講師說確保數據的質素,已完成80%的工作。如果數據不完整,或有一些極端的例子(Outliers), 分析的數據會有偏差,從而做出錯誤的決定。陳先生說,其實這個概念不難理解,我們日常也會從不同的渠道接收很多訊息,影響我們的判斷,但究竟這些資料是否有不足?或有人為的影響而出差偏差?或接觸到的只是一些極端的例子?我們要懂得分辨,以免錯判,做出錯誤決定。

活動由SCC主辦,獲政府創新科技署資助,及香港電商協會贊助。