? 不要再問『為什麼 ChatGPT 可以?』,你寫的程式也可以!
?
開發生成式 AI 應用程式時總是在想『為什麼 ChatGPT 有這個功能?』,現在你也可以。本書帶你學會 OpenAI API 關鍵元素,達到跟 ChatGPT 類似的功能。
?
|用 Realtime API 提供進階語音模式|
?
開發直接語音交談,隨時插話的應用,再加上其他章節介紹的 function calling 與 MCP 等,實現真正出一張嘴、連打字都不用就可以操控的應用程式。書中會帶你實踐桌面版與網頁版的語音交談程式,各種情境都能派上用場。
?
|透過 MCP 介接全世界|
MCP 雖然不是 OpenAI API 的一部分,但卻可以接上各式各樣的輸入與控制功能,本書會教你設計可分享功能給他人使用的 MCP 伺服器,也會實作具備 MCP 用戶端的主控程式,介接你自己或別人提供的 MCP 伺服器幫模型長出感官與手腳。
?
|用 Responses API+內建工具快速實作 RAG 應用|
Responses API 可以使用多種內建工具,搜尋網路、文字生圖、撰寫並執行 Python 程式碼都難不倒它,還可以檢索檔案,提供檢索片段內容幫模型增長知識,快速設計 RAG 應用。
?
|可運作多 agent 的 Agnets SDK|
實現讓程式自主決策並執行任務、達成代理人(agent)的理想,Agents SDK 還可以協調多個 agent 彼此合作,把任務交棒給最合適的 agent 處理。
?
|運用推理模型解決複雜數理問題|
透過 API 使用推理模型,還可以像是 ChatGPT 那樣呈現推理過程,不再需要撰寫複雜的提示內容或是指示,就可以解決數理或是邏輯問題。
?
|深度瞭解 function calling 機制|
不論是 Agents SDK 還是 MCP,底層的運作關鍵就是 function calling,你不一定會直接使用它,但瞭解它卻是延伸模型能力的必備基礎。
?
|直指核心設計的範例|
學習 API 當然可以直接看官方文件與範例,不過官方範例有時候因為想要有漂亮的 UI 呈現等原因,採用了你不一定熟悉的框架,使得範例本身摻雜太多非必要的元素,混淆了真正的關鍵主題,在設計範例時我們就特意保留最精簡的架構,高度聚焦提升成效。
?
|能踩的雷我們都先幫你踩過一遍|
使用 API 光看文件是一回事,實際測試又是一回事,尤其像是 MCP 要介接其他人提供的服務,更容易遇到不相容的問題;還有文件上寫了但可能使用上有問題,或是文件上可能沒寫,但其實可以這樣用的,我們都先盡量測過一遍,節省你的時間。
?
本書特色
?
ChatGPT 做得到、你也能做到
Do what ChatGPT can do
?
□ 使用 Realtime API 提供即時交談、隨時插話的進階語音模式
□ 串接各種 MCP 伺服器,幫 AI 生出五官手腳與真實世界接軌
□ 自己設計 MCP 伺服器補完 AI 欠缺的功能,還可以分享給別人使用
□ 用 Responses API 快速設計 RAG 系統
□ 使用 Agents SDK 設計自主決策完成任務的 agent
□ 套用推理模型、呈現推理過程解決複雜數理問題
□ 針對核心元素設計範例,避免官方範例旁枝末節增加無謂複雜度