序
從模型到產品,走完 AI 應用的最後一哩路
嗨,謝謝你翻開這本書。如果你正煩惱如何將電腦裡的模型,變成一個能真正服務人群的產品,那麼,你來對地方了!
幾年前,身為資料科學新手的我,總是熱切於訓練出一個表現良好的模型。不過,儘管在精挑細琢後,得到一個高準確率的模型,卻只能讓其停留在 Jupyter Notebook 中,不知道如何帶出實驗室,讓它真正走入產品、服務人群。
「要怎麼把模型變成一個用戶能隨時使用的產品?」
「當資料不斷湧入,我要怎麼確保它的表現不會變差?」
「面對數十個實驗版本,我該如何有效管理,並在出錯時快速回溯?」
這些問題的複雜性並不亞於演算法,只是身為資料科學家的我們,不熟稔於 MLOps 的技術:我們擅長於打造一顆聰明的大腦(模型),卻對如何為它建構一個強健的身體(維運架構)感到陌生。這本書,就是為了解決這個鴻溝而生。
在我的上一本書《科技巨頭的演算法大揭秘》中,專注於討論和拆解各種演算法的核心,而這本書,則轉向實際的技術開發,一起探討如何在開發完模型後,能夠走完最後一哩路,將模型真正淬鍊成產品。
這本書,就是那張不可或缺的「系統藍圖」
或許你會問,在這個 AI 能幫我們寫程式的「Vibe Coding」時代,學習這些技術還有必要嗎?我的答案是肯定的,而且比以往任何時候都更加重要。
AI 如同一位能力超群的副駕駛,能請他加速、轉彎,但最終決定要去哪、該走哪條路的,永遠是手握方向盤的我們。AI 可以生成一段完美的 Dockerfile,但我們必須先理解為何需要容器化;AI 可以寫出一個 FastAPI 的端點,但無法替我們設計整個服務的藍圖。
本書將從機器學習的完整生命週期談起,並以「音樂推薦系統」作為實戰專案,親手整合 Docker、PostgreSQL、MLflow、FastAPI、BentoML 等一系列主流工具,你會發現,這些工具並非獨立的孤島,而是一個環環相扣、彼此協作的生態系。
這本書是為所有渴望將模型推向產品化,卻不知從何下手的你而寫。無論你是希望作品能落地的資料科學家,還是想跨足 AI 領域的軟體工程師,我都希望本書能成為你手中的那份清晰的地圖,更有信心地打造出穩定、可靠且能持續創造價值的 AI 服務。
旅程即將開始,讓我們一起動手吧!
資料科學家 Min
徐歆閔