庫存狀況
「香港二樓書店」讓您 愛上二樓●愛上書
我的購物車 加入會員 會員中心 常見問題 首頁
「香港二樓書店」邁向第一華人書店
登入 客戶評價 whatsapp 常見問題 加入會員 會員專區 現貨書籍 現貨書籍 購物流程 運費計算 我的購物車 聯絡我們 返回首頁
香港二樓書店 > 今日好書推介
   
地圖+地圖創意遊戲 (附行旅世界地圖包)
  • 定價650.00元
  • 8 折優惠:HK$520
  • 放入購物車
二樓書籍分類
 
AI Vision × LLM 電腦視覺應用聖經:OpenCV × YOLO × Ollama 解鎖多模態全攻略

AI

沒有庫存
訂購需時10-14天
9789863128311
陳會安
旗標
2025年6月02日
293.00  元
HK$ 263.7  






ISBN:9789863128311
  • 規格:平裝 / 544頁 / 17 x 23 x 2.8 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣


  • 電腦資訊 > 概論/科技趨勢 > 人工智慧/機器學習











    ?? 一本搞定 LLM 看圖說故事與即時影像分析 ??



    ?? 十款熱門模型實際解決生活中 AI Vision 問題 ??



    ?? 用「自己的」資料集在本地端訓練 YOLO 模型 ??



    ?? 無痛設計 Web 互動介面,輕鬆部署 AI 模型 ??



      『AI Vision × LLM』劃開多模態應用的新時代

      從輸入文字生成圖片,到上傳照片讓 LLM 看圖說故事,AI 電腦視覺技術結合 LLM 的多模態應用正席捲全球。但這些令人驚豔的應用背後,其實倚賴多項核心技術——包含物體偵測、人臉辨識、情緒與年齡分析、或是影像文字識別,以及對於文字的理解與生成,這才賦予 AI 真正「看懂」影像內容的能力。



      實際解決現實生活中的 AI Vision 問題

      帶領讀者以多款熱門模型如 YOLO、OpenCV DNN、MediaPipe、CVZone 3D、DeepFace、Dlib、LiteRT、EasyOCR,打造刷臉門禁系統、即時口罩偵測、微笑自拍、手勢操控投影片、AI 健身教練、車牌辨識、結帳櫃台人流與高速公路車流分析等多項實用專案,讓讀者親身體驗 AI Vision 在真實場景中的應用價值。



      不僅會用,還能自行訓練專屬 AI 模型

      讓你不只會活用現成的模型,還能自己動手標註資料並訓練屬於你的 YOLO 模型。並且透過 Streamlit 設計 Web 互動介面,將訓練成果部署為具備即時偵測與辨識功能的 Web 應用程式,實現從標註資料、模型訓練到應用上線的完整流程。



      親手打造多模態 AI 應用,收穫滿滿成就感

      整合前述 AI Vision 技術與大型語言模型(LLM),或運用 Ollama 的多模態工具 Llama-Vision,再搭配 Streamlit,即可實作出讓 LLM 分析影像內容或情境的 Web 智慧應用,例如路況分析或圖片描述,讓 AI 真正具備視覺理解與語意回應的能力。



      零基礎也能無痛入門

      本書主打「從做中學」的實作導向,即使沒有深厚的理論基礎,也能快速掌握 Python 的 AI 模型與實用套件。至於不熟悉的語法、函式用法、AI 模型原理,或是特定功能的程式碼編寫與修改,則交由 ChatGPT 給予我們即時協助,讓學習更有效率。



      無論你是 AI 初學者還是開發者,本書都能帶你輕鬆入門、快速上手,從零開始打造專屬的 AI 專案,成為 AI Vision × LLM 的超酷玩家!??



    本書特色



      ? 精選多款熱門 AI 模型,打造貼近生活情境的 AI Vision 實務應用

      ? 提供客製化 WinPython 可攜式套件,快速建立與書中一致的開發環境

      ? 支援 CPU / GPU,完整教學從資料標註到訓練與測試你自己的 YOLO 物體辨識模型

      ? 使用 LabelImg 工具,以人性化的方式進行影像資料集的標註作業

      ? 透過 Streamlit 快速打造 Web 互動介面,無需前端技能即可部署 AI 模型

      ? 整合 Llama-Vision,讓 LLM 在 Web 介面中看圖說故事、回答問題或分析影像內容

      ? 搭配 OpenCV 電腦視覺套件,實作物體、人臉、文字、車牌等偵測與辨識

      ? 探索 Mediapipe × CVZone 3D,實現 3D 視角的手勢辨識與姿態評估



    ?


     





    ▍第 1 章 使用 Python 虛擬環境建立開發環境

    1-1 建立與管理 Python 虛擬環境

    1-2 使用 Python 虛擬環境建立本書的開發環境

    1-3 安裝本書客製化的 WinPython 可攜式套件

    1-4 使用 Thonny 的 Python IDE

    1-5 使用 VS Code 的 Python IDE



    ▍第 2 章 OpenCV 基本使用與 Numpy

    2-1 OpenCV 安裝與基本使用

    2-2 OpenCV 影像處理

    2-3 OpenCV 視訊處理與 Webcam

    2-4 OpenCV 影像資料:NumPy 陣列

    2-5 OpenCV 影像處理:負片和馬賽克效果



    ▍第 3 章 OpenCV DNN電腦視覺與文字識別

    3-1 OpenCV 哈爾特徵層級式分類器

    3-2 OpenCV DNN 模組與預訓練模型

    3-3 OpenCV DNN 影像分類與人臉偵測

    3-4 OpenCV DNN 物體偵測與文字區域偵測

    3-5 Tesseract-OCR 文字識別



    ▍第 4 章 Mediapipe × CVZone:人臉與臉部網格偵測

    4-1 Google MediaPipe 機器學習框架

    4-2 CVZone 電腦視覺套件與 MediaPipe

    4-3 CVZone 人臉偵測

    4-4 CVZone 臉部網格

    4-5 CVZone 辨識臉部表情:張嘴/閉嘴與睜眼/閉眼



    ▍第 5 章 Mediapipe × CVZone:3D 手勢偵測與 3D 姿態評估

    5-1 Mediapipe × CVZone 3D 多手勢追蹤

    5-2 MediaPipe × CVZone 3D 辨識手勢:剪刀、石頭與布

    5-3 MediaPipe × CVZone 3D 辨識手勢:OK 手勢

    5-4 MediaPipe × CVZone 3D 人體姿態評估

    5-5 MediaPipe × CVZone 3D 辨識人體姿勢:仰臥起坐

    5-6 MediaPipe × CVZone 3D 辨識人體姿勢:伏地挺身



    ▍第 6 章 LiteRT × Dlib × Deepface 電腦視覺應用

    6-1 認識與安裝 LiteRT(TensorFlow Lite)

    6-2 LiteRT 影像分類與物體偵測

    6-3 Dlib 人臉偵測、臉部網格與特徵提取

    6-4 face-recognition 人臉識別

    6-5 Deepface 情緒辨識與年齡偵測

    6-6 OpenCV DNN 預訓練模型:情緒辨識



    ▍第 7 章 YOLO 電腦視覺應用:物體偵測與追蹤

    7-1 認識 YOLO

    7-2 YOLO 物體偵測

    7-3 YOLO 物體追蹤

    7-4 YOLO 電腦視覺應用:即時計算視訊的人數和車輛數

    7-5 YOLO 電腦視覺應用:繪出視訊的車輛追蹤線



    ▍第 8 章 YOLO 電腦視覺應用:影像分類 / 分割與姿態評估

    8-1 YOLO 影像分類

    8-2 YOLO 影像分割

    8-3 YOLO 姿態評估

    8-4 YOLO 電腦視覺應用:影像分割的背景替換

    8-5 YOLO 電腦視覺應用:辨識人體姿勢



    ▍第 9 章 訓練你自己的 YOLO 物體偵測模型

    9-1 安裝 GPU 版的 YOLO

    9-2 取得訓練 YOLO 模型所需的圖檔資料

    9-3 使用 LabelImg 標註影像建立資料集

    9-4 整理與瀏覽 Roboflow 取得的資料集

    9-5 建立 YAML 檔訓練與驗證你的 YOLO 模型



    ▍第 10 章 Streamlit 的 AI 互動介面設計

    10-1 認識與安裝 Streamlit

    10-2 建立你的 Streamlit 應用程式

    10-3 輸出網頁內容

    10-4 繪製圖表與地圖

    10-5 建立表單介面的互動元件

    10-6 佈局、狀態與聊天元件

    10-7 使用快取機制與網頁配置設定

    10-8 Streamlit 互動介面設計:建立 YOLO 的 AI 互動介面



    ▍第 11 章 AI 電腦視覺實戰:刷臉門禁管理、微笑拍照與變臉化妝

    11-1 AI 電腦視覺實戰:刷臉門禁管理

    11-2 AI 電腦視覺實戰:YOLO 臉部情緒偵測

    11-3 AI 電腦視覺實戰:微笑拍照

    11-4 AI 電腦視覺實戰:變臉與化妝



    ▍第 12 章 AI 電腦視覺實戰:手勢操控與 AI 健身教練

    12-1 pywin32 套件:Office 軟體自動化

    12-2 AI 電腦視覺實戰:手勢操控 PowerPoint 簡報播放

    12-3 AI 電腦視覺實戰:AI 健身教練



    ▍第 13 章 AI 電腦視覺實戰:EasyOCR 車牌辨識與車道偵測系統

    13-1 AI 電腦視覺實戰:Tesseract-OCR 車牌辨識

    13-2 EasyOCR 的安裝與使用

    13-3 AI 電腦視覺實戰:EasyOCR 車牌辨識

    13-4 AI 電腦視覺實戰:YOLO 車牌偵測

    13-5 AI 電腦視覺實戰:OpenCV 車道偵測系統



    ▍第 14 章 AI 電腦視覺實戰:YOLO 人流與車流控制

    14-1 找出熱區域座標

    14-2 判斷目標物體是否進入熱區域

    14-3 結帳櫃台的人數控制

    14-4 道路的車流控制

    14-5 AI 電腦視覺實戰:多個結帳櫃台的人數控制

    14-6 AI 電腦視覺實戰:南下 / 北上高速公路的車流控制



    ▍第 15 章 AI 電腦視覺實戰:打造自己的 AI 模型與整合應用

    15-1 使用 Teachable Machine 訓練機器學習模型

    15-2 AI 電腦視覺實戰:LiteRT 識別剪刀、石頭或布

    15-3 AI 電腦視覺實戰:建立 YOLO 即時口罩偵測



    ▍第 16 章 AI 電腦視覺實戰:本機 LLM Vision 整合應用

    16-1 認識生成式 AI 與 LLM

    16-2 LLM API 服務:Groq API

    16-3 使用 Ollama 打造本機 LLM

    16-4 AI 電腦視覺實戰:Llama-Vision 視覺分析助手

    16-5 AI 電腦視覺實戰:Llama-Vision 車牌辨識

    16-6 AI 電腦視覺實戰:Llama-Vision 路況分析



    ▍附錄 A 電子書 Anaconda 開發環境與 Python 程式設計

    A-1 建立 Anaconda 的 Python 開發環境

    A-2 變數、資料型態與運算子

    A-3 流程控制

    A-4 函式、模組與套件

    A-5 容器型態

    A-6 類別與物件





    ?




    其 他 著 作
    1. AI Vision × LLM 電腦視覺應用聖經:OpenCV × YOLO × Ollama 解鎖多模態全攻略
    2. 看圖學Python人工智慧程式設計(第二版)?
    3. 你的第一本Git與GitHub入門書:輕鬆實作本機與遠端儲存庫的版本控制
    4. 看圖學C語言與運算思維(第三版)?
    5. Raspberry Pi 樹莓派:AI × OpenCV × LLM × AIoT 創客聖經
    6. 超簡單Python+MicroPython物聯網應用:堆積木寫程式輕鬆學習軟硬體整合(第三版)
    7. Python ? Power BI ? Excel 和 AI 神隊友打造辦公室作業 + 數據分析自動化
    8. 你的第一本Linux入門書:使用WSL建立Linux軟體開發與部署環境,一次學會Docker、版本控制、建立AI預訓練模型
    9. 看圖學Python:從程式設計入門到精通資料科學?
    10. 新一代 Keras 3.x 重磅回歸:跨 TensorFlow 與 PyTorch 建構 Transformer、CNN、RNN、LSTM 深度學習模型