CGU AICV Lab Computer Vision Lab of the Department of Artificial Intelligence at Chang Gung University

機器學習 2024

課程資訊

本門課程的內容是教授機器學習的概念給AI系的學生。本門課之教學目標為培養學生機器學習的基礎知識,使學生具備處理實際問題。課程進行為方式為上課講授與專題實作,期中會有一次期中考試以督促學生內化學習到的知識,期末以專題的方式,給予學生實際動手作,解決具體問題的機會,並將成果報告出來,供其他同學學習參考。由於坊間及網路上教導機器學習的書籍與影片很多,修課同學可以自由參考彈性學習,有疑惑由老師和助教幫忙解答。

修課需求

需要有撰寫程式的能力與經驗:Python為必需,C++為選用,因為主流使用於機器學習語言為Python,但工業界在追求最快執行速度時會選用C++。修課者需要有必要的數學基礎,包括線性代數、微積分、數理統計、機率。

時間與地點

每週二下午1:10至4:00 地點:B0201R 管理大樓201教室

助教與答問時間

劉冠亨 m1261003@cgu.edu.tw
主要由Teams回答
週四 12:00~13:00 管理大樓10樓 B1008 自然語言處理實驗室

蔡承原 m1361004@cgu.edu.tw
週二 5:00~6:00 pm 管理大樓3樓 原先的電腦教室6

教師與答問時間

楊智淵 cyyang@cgu.edu.tw
週二上午 10:30~11:30 管理大樓14樓 1416室

課程大綱

週次 日期 主題 投影片 錄影 預定事項
1 9/3 簡介 pptx YouTube  
2 9/10 機率分佈 pptx YouTube  
3 9/17 假日,無授課     作業1 中秋節放假
4 9/24 線性的迴歸模型 pptx YouTube  
5 10/1 線性的分類模型 pptx   馬誠佑老師代課
6 10/8 神經網路 pptx ipynb YouTube  
7 10/15 核方法、支持向量機1 pptx YouTube 作業2
8 10/22 支持向量機2 pptx YouTube  
9 10/29 期中考,無授課     期中考
10 11/5 集成方法1 pptx YouTube 作業3
11 11/12 集成方法2, 分群演算法 pptx YouTube  
12 11/19 連續潛變數 pptx YouTube  
13 11/26 圖模型 pptx YouTube 作業4
14 12/3 近似推論 pptx YouTube  
15 12/10 序列資料 pptx YouTube  
16 12/17 期末報告,無授課     期末報告


期中考題與參考答案

docx

期末專題

組別 題目 投影片 書面報告 程式碼
1 極限配速預測與訓練計劃生成 Canva pdf  
2 厄瓜多爾 Favorita 商店銷售預測 pdf pdf  
3 MLB大聯盟冠軍預測 pptx pdf  
4 鐵達尼號⽣存預測 pdf pdf  
5 影評情緒智析平台 pdf pdf folder
6 DeepRacer pptx pdf pdf  
7 MNIST Canva docx folder
8 Kaggle房價預測競賽 Canva docx  


期末專題書面報告評分解釋 docx

教科書

Pattern Recognition and Machine Learning by Christopher M. Bishop (2006)
作者官網提供正版的pdf檔供人免費下載連結。也提供部份的習題解答連結。這本書的特性是滿滿的數學,非常的學術,也非常的經典。但2006版的錯別字和錯寫的方程式非常多,請參考作者提供的勘誤表校正連結
校圖有紙本,但沒有ebook。Spring有賣ebook,一本75歐元。
另外,這本書有簡體中文版,2013年由UC Berkeley的教授譯成,在中國大陸發行,並且將2006年初版的錯誤都校正掉了,對於讀得懂中文的我們,是一個很便利的吸收來源。

參考書籍

  • Python機器學習 Sebastian Raschka著 劉立民、吳建華譯 (繁中出版年:2016)
    這本書和我們課本的內容重疊,涵蓋了許多個機器學習的大主題,但數學講得比較少,而比較偏向如何以Python程式碼和scikit-learn用出各種機器學習的演算法。另外,由於課本很數學,沒什麼數學理論的東西就講很少,以致於分群演算法時只談了k-means。相較之下,因為這本書比較偏向實作與應用,所以另外講了聚合式階層分群法、DBSCAN、和光譜群集法,是課本的好補充。這本書的最後一章講Theano,已經過時,但可以參考讀一讀,看2015年時Theano為什麼被大家需要。
  • 30分鐘就讀懂 機器學習從數學開始 張曉明著 2020年,深智出版。我們Bishop課本第一、二章的的二項式分布、機率分布、高斯分布、貝氏定理、最大概似法,出現在這本書的13、14、15章,Bishop講得非常理論,這本書則是講得非常淺,而且用許多實例來介紹。 </br>
  • 精通機器學習 使用Scikit-Learn, Keras與TensorFlow 建立智慧型系統的概念、工具與技術 第三版 Aurélien Géron著 (繁中版出版年2023),校圖有。</br> 這本書非常新,很值得一讀。訂價新台幣1200元,跟書的厚度成正比。內容非常的廣泛,一章涵蓋一個機器學習的大主題、著名資料集、演算法、工具、並給予很多Python指令來說明如何處理資料和應用演算法。這本書非常的實務,但不給數學式的推導,直接給結果方程式。如果要理解公式是怎麼來的,最好搭配Bishop的書讀。
  • Fundamentals of machine learning for predictive data analytics 2/e by John D. Kelleher et al. (2020)
    校圖有電子版,可線上看(一次限一人),可下載(一次限100頁)。這本書從應用面出發,相當白話,數學不多。</br>

其他參考書籍

  • 機器學習 使用Python 徐偉智 編著 2023年 全華出版,校圖有。
    這本書中提到的機器學習的演算法,課本幾乎全都涵蓋了。只有ROC曲線、殘差分析是課本沒有提到的。因為課本著重於數學模型,ROC曲線、殘差分析沒有什麼數學模型,課本就不提了。但ROC曲線是實務上很常見的視覺化分類器效能的方法,大家可以參考。另外,這本書偏向實作,所以講很多如何安裝、使用Python,以及展示Python程式碼,讓讀者明白要呼叫什麼模組來完成對應的演算法。對於想用Python來寫作業、作專題,還是有參考價值。
  • 機器學習與資料科學的數學基礎 使用Python 松田雄馬 等著 (繁中版出版年:2022),校圖有。
    這本書很雜,從安裝Python到介紹題目、講解演算法,都挑了幾個案例介紹。的確是機器學習的範圍,但缺乏系統性的知識。特性是給了很多Python程式碼,可以增加讀者處理案例的經驗。
  • 機器學習概論 機器學習發展+演算法原理實務 鄭捷著 (繁中版出版年:2020),校圖有。
    這本書很雜,它講講演算法像決策樹、SVM,也講幾個機器學習的著名任務像是圖形辨識裏的人臉辨識、自然語言處理裏的詞性標記,又講實作時的工具像是framework裏的Theano、Python的函式庫Scikit-Learn。因為工具的演進變動很快,到現在2024年,Theano已經被取代,鮮少人在用了。
  • 機器學習 探索人工智慧關鍵 Ethem Alpaydin 著 (繁中版出版年:2018),校圖有。
    這本書的發行人是台灣金融研訓院。這本書一個數學式也沒有,反而是用講故事的方式在介紹機器學習,談它的影響、歷史、應用,算是一本科普讀物。
  • AI開發的 機器學習系統計設模式 澁井雄介著 (繁中版出版年:2022),校圖有。
    這本書的主題是佈建一個系統,讓用戶可以建置模型、發佈模型、完成推論。這本書屬於資管或是網管領域,與本堂課相距很遠。
  • 機器學習 工作現場的評估導入與實作 有賀康顕 等著 (繁中版出版年:2018),校圖有。
    這本書分兩個部份,第一部份講一些淺淺的演算法、如何收集資料、一點統計。第二部份講三個案例,一個電影推薦系統,一個Kickstarter分析,一個行銷資源分配,很混亂,對本堂課沒什麼幫助。
  • Python機器學習與深度學習特訓班 第二版 文淵閣工作室編著 2021年 碁峯出版
    這本書是平台、原理和案例的混合,工具和平台包括Tensorflow, Keras, Google Colab, Microsoft Azure, 原理包含MLP, CNN, RNN,案例包含臉部辦識、文字雲、YouTube影片加字幕、twstock套件的使用、車牌辨識。很混雜的一本書、沒有什麼數學,沒有什麼系統。

成績評定標準

  • 40% 作業
  • 30% 期中考
  • 30% 期末專題,原則上2至5人一組,若題目很大可以增加人數
  • 不點名、沒有缺席懲罰

作業遲交規則

遲交每天會少掉10%的分數,但整學期有三天的寬限期,也就是說,如果你遲交三次,每次都是一天,不扣分。或是遲交一次,天數是三天,也不扣分。超過這三天的寬限期,就會開始扣分了。