CGU AICV Lab Computer Vision Lab of the Department of Artificial Intelligence at Chang Gung University

機器學習 2025

課程資訊

本門課程的內容是教授機器學習的概念給AI系的學生。本門課之教學目標為培養學生機器學習的基礎知識,使學生具備處理實際問題。課程進行為方式為上課講授與專題實作,期中會有一次期中考試以督促學生內化學習到的知識,期末以專題的方式,給予學生實際動手作,解決具體問題的機會,並將成果報告出來,供其他同學學習參考。由於坊間及網路上教導機器學習的書籍與影片很多,修課同學可以自由參考彈性學習,有疑惑由老師和助教幫忙解答。

修課需求

需要有撰寫程式的能力與經驗:Python為必需,C++為選用,因為主流使用於機器學習語言為Python,但工業界在追求最快執行速度時會選用C++。修課者需要有必要的數學基礎,包括線性代數、微積分、數理統計、機率。

時間與地點

每週五下午1:10至4:00 教室:管理大樓102教室

助教與答問時間

盧睿霆 M1361008@cgu.edu.tw (專任名額)
袁聖博 D1300701@cgu.edu.tw (其另外兩門課共用名額)

教師與答問時間

楊智淵 cyyang@cgu.edu.tw
週二上午 10:30~11:30 管理大樓14樓 1416室

課程大綱

週次 日期 主題 投影片 錄影 預定事項
1 9/5 簡介 pptx YouTube  
2 9/12 機率分佈 pptx YouTube  
3 9/19 線性的迴歸模型 pptx YouTube  
4 9/26 線性的分類模型 pptx YouTube  
5 10/3 神經網路 pptx YouTube  
6 10/10       國慶日放假
7 10/17 核方法 pptx YouTube  
8 10/24       台灣光復節補假
9 10/31 支持向量機 pptx YouTube  
10 11/7 期中考,無授課      
11 11/14 集成方法1 pptx YouTube 期末專題提案
12 11/21 集成方法2 pptx YouTube  
13 11/28 分群演算法 pptx YouTube  
14 12/5 連續潛變數 pptx YouTube  
15 12/12 連續潛變數 2 pptx YouTube  
16 12/19 期末報告,無授課     期末海報展


期中考題與參考答案

docx

高品質作業報告

範例1,2,3,4,5,6 是由學號決定的,都是高品質作業報告,並非名次。

作業 題目 高品質範例1/4 高品質範例2/5 高品質範例3/6
1 高斯抽樣估計 PDF PDF PDF
2 資料迴歸 PDF PDF PDF
3 線性的分類模型 Spotify用戶流失預測(HW3) PDF 有毒菇類預測 PDF 葡萄酒分類 PDF
4 類神經網路 葡萄酒分類 PDF MNIST PDF 水泥強度迴歸 PDF
5 支持向量機 心臟病預測A PDF 超導體臨界溫度預測(HW5) PDF Spotify用戶流失預測(HW5) PDF
    糖尿病預測 PDF 銀行電話行銷定存成功與否預測 PDF 心臟病預測B PDF
6 集成方法或分群演算法 超導體臨界溫度預測(HW6) PDF Spotify用戶流失預測(HW6) PDF 捐血者再次捐血預測 PDF


期末專題

組別 題目 海報 書面報告 投影片 程式碼 授課教師推薦
1 MLX 在 Apple Silicon 上的運算效能探討:以 CIFAR-10 與卷積神經網路為例 pdf pdf pdf   題目的懸疑性與驚奇
2 Predict air quality status using key pollutant indicators pdf pdf      
3 以DASS-42為基礎預測心理困擾嚴重程度 pdf pdf   .py  
4 破解Kaggle房價預測:模型與策略之比較分析 pdf pdf      
5 以序列為基礎的 Promoter/Enhancer 辨識:傳統機器學習與 DNABERT-2 之比較分析 pdf pdf     研究的深度
6 利用 CNN 辨識「回收分類:紙類 / 塑膠 / 金屬」照片 pdf pdf      
7 利用KNN基於歌曲音訊特徵推薦的音樂推薦演算法          
8 宏觀經濟因子的 P2P 借貸 ROI 預測 pdf pdf   Colab 研究的完整度、報告的可讀性
9 使用卷積神經網路於蘋果葉病害之影像分類研究 pdf pdf      
10 使用強化學習訓練 AI 征服 osu!:從零到高手的完整指南 pdf pdf   zip  
11 急診壅塞情境下之智慧病患分流與資源配置決策支援系統 pdf pdf      
12 若臺灣防疫不成功:以 TWCDC 資料集建構 COVID-19 反事實模擬 pdf pdf      
13 啊是要不要還錢啦? pdf pdf pdf    
14 運用AI影像辨識模型分辨 iphone 型號 pdf pdf      
15 應用 AlphaZero 架構的五子棋智能對弈模型 pdf pdf   AlphaZero MuZero 展示力


期末專題書面報告評分解釋

txt

教科書

Pattern Recognition and Machine Learning by Christopher M. Bishop (2006)
這本書可以說是機器學習的經典,備受推崇,但是難度很高,不好入門,比較深的部份,已經到了研究所的等級了。我們只會碰它比較淺的部分。 作者官網有提供2006年版的pdf檔供人免費下載連結。也提供部份的習題解答連結。這本書的特性是滿滿的數學,非常的學術,也非常的經典。但2006版的錯別字和錯寫的方程式非常多,請參考作者提供的勘誤表校正連結
校圖有紙本,但沒有ebook。Spring有賣ebook,一本75歐元。
另外,這本書有簡體中文版,2013年由UC Berkeley的教授譯成,在中國大陸發行,並且將2006年初版的錯誤都校正掉了,對於讀得懂中文的我們,是一個很便利的吸收來源。

網路資源

  • 台大資工系 林軒田教授 2013年 Coursera 機器學習基石 65集,每集10到20分鐘 YouTube錄影 機器學習技法 65集,每集10到20分鐘 YouTube錄影 看完這130集的影片,就等於是聽了一學期量的機器學習課程,而且林教授是用中文講的,雖然投影片是英文,但已經很方便吸收了。雖然錄製的年份有點久了,但基礎、入門等級機器學習演算法和基本概念,在這十二年間沒有什麼變化,就像微積分一樣,從17世紀牛頓、萊布尼茨發展之初,到經過150年的完善之後,整體架構已經相當成熟穩定了,基礎、入門等級的內容也不會有什麼新發明。

參考書籍

  • Python機器學習 Sebastian Raschka著 劉立民、吳建華譯 (繁中出版年:2016)
    這本書和我們課本的內容重疊,涵蓋了許多個機器學習的大主題,但數學講得比較少,而比較偏向如何以Python程式碼和scikit-learn用出各種機器學習的演算法。另外,由於課本很數學,沒什麼數學理論的東西就講很少,以致於分群演算法時只談了k-means。相較之下,因為這本書比較偏向實作與應用,所以另外講了聚合式階層分群法、DBSCAN、和光譜群集法,是課本的好補充。這本書的最後一章講Theano,已經過時,但可以參考讀一讀,看2015年時Theano為什麼被大家需要。
  • 30分鐘就讀懂 機器學習從數學開始 張曉明著 2020年,深智出版。我們Bishop課本第一、二章的的二項式分布、機率分布、高斯分布、貝氏定理、最大概似法,出現在這本書的13、14、15章,Bishop講得非常理論,這本書則是講得非常淺,而且用許多實例來介紹。 </br>
  • 精通機器學習 使用Scikit-Learn, Keras與TensorFlow 建立智慧型系統的概念、工具與技術 第三版 Aurélien Géron著 (繁中版出版年2023),校圖有。</br> 這本書非常新,很值得一讀。訂價新台幣1200元,跟書的厚度成正比。內容非常的廣泛,一章涵蓋一個機器學習的大主題、著名資料集、演算法、工具、並給予很多Python指令來說明如何處理資料和應用演算法。這本書非常的實務,但不給數學式的推導,直接給結果方程式。如果要理解公式是怎麼來的,最好搭配Bishop的書讀。
  • Fundamentals of machine learning for predictive data analytics 2/e by John D. Kelleher et al. (2020)
    校圖有電子版,可線上看(一次限一人),可下載(一次限100頁)。這本書從應用面出發,相當白話,數學不多。</br>
  • 初探機器學習演算法 (原文書名:Machine Learning Algorithms) Guiseppe Bonaccorso著,頼屹民譯 (繁中出版年:2017) 校園有
    這本書涵蓋的面很廣,前10章內容跟我們的課本重疊,但壓抑了很多數學,只講比較直觀、比較淺白的想法,好處也在種淺白的內容設計,讓進入障礙比較低,可以當成是讀我們課本前的導讀內容。

其他參考書籍(雜亂、不適合拿來作教科書,但或許另有用處)

  • 機器學習 使用Python 徐偉智 編著 2023年 全華出版,校圖有。
    這本書中提到的機器學習的演算法,課本幾乎全都涵蓋了。只有ROC曲線、殘差分析是課本沒有提到的。因為課本著重於數學模型,ROC曲線、殘差分析沒有什麼數學模型,課本就不提了。但ROC曲線是實務上很常見的視覺化分類器效能的方法,大家可以參考。另外,這本書偏向實作,所以講很多如何安裝、使用Python,以及展示Python程式碼,讓讀者明白要呼叫什麼模組來完成對應的演算法。對於想用Python來寫作業、作專題,還是有參考價值。
  • 機器學習與資料科學的數學基礎 使用Python 松田雄馬 等著 (繁中版出版年:2022),校圖有。
    這本書很雜,從安裝Python到介紹題目、講解演算法,都挑了幾個案例介紹。的確是機器學習的範圍,但缺乏系統性的知識。特性是給了很多Python程式碼,可以增加讀者處理案例的經驗。
  • 機器學習概論 機器學習發展+演算法原理實務 鄭捷著 (繁中版出版年:2020),校圖有。
    這本書很雜,它講講演算法像決策樹、SVM,也講幾個機器學習的著名任務像是圖形辨識裏的人臉辨識、自然語言處理裏的詞性標記,又講實作時的工具像是framework裏的Theano、Python的函式庫Scikit-Learn。因為工具的演進變動很快,到現在2024年,Theano已經被取代,鮮少人在用了。
  • 機器學習 探索人工智慧關鍵 Ethem Alpaydin 著 (繁中版出版年:2018),校圖有。
    這本書的發行人是台灣金融研訓院。這本書一個數學式也沒有,反而是用講故事的方式在介紹機器學習,談它的影響、歷史、應用,算是一本科普讀物。
  • AI開發的 機器學習系統計設模式 澁井雄介著 (繁中版出版年:2022),校圖有。
    這本書的主題是佈建一個系統,讓用戶可以建置模型、發佈模型、完成推論。這本書屬於資管或是網管領域,與本堂課相距很遠。
  • 機器學習 工作現場的評估導入與實作 有賀康顕 等著 (繁中版出版年:2018),校圖有。
    這本書分兩個部份,第一部份講一些淺淺的演算法、如何收集資料、一點統計。第二部份講三個案例,一個電影推薦系統,一個Kickstarter分析,一個行銷資源分配,很混亂,對本堂課沒什麼幫助。
  • Python機器學習與深度學習特訓班 第二版 文淵閣工作室編著 2021年 碁峯出版
    這本書是平台、原理和案例的混合,工具和平台包括Tensorflow, Keras, Google Colab, Microsoft Azure, 原理包含MLP, CNN, RNN,案例包含臉部辦識、文字雲、YouTube影片加字幕、twstock套件的使用、車牌辨識。很混雜的一本書、沒有什麼數學,沒有什麼系統。

成績評定標準

  • 40% 作業
  • 30% 期中考
  • 30% 期末專題,原則上2至5人一組,若題目很大可以增加人數
  • 不點名、沒有缺席懲罰

作業遲交規則

遲交每天會少掉10%的分數,但整學期有三天的寬限期,也就是說,如果你遲交三次,每次都是一天,不扣分。或是遲交一次,天數是三天,也不扣分。超過這三天的寬限期,就會開始扣分了。