Ubuntu 22.04 安裝 Ollama 完整教學|本地 LLM 模型部署與使用指南(Llama3 / Mistral / Qwen2.5)

本篇教學將帶你在 Ubuntu 22.04 系統中完整安裝 Ollama,並建立本地大型語言模型(LLM)執行環境。Ollama 是目前最簡單的本地 AI 執行工具之一,可以讓你快速運行 Llama3、Mistral 與 Qwen2.5 等模型,不需要 GPU 設定或複雜深度學習環境。本教學適合想學習本地 AI 部署、RAG 系統建置與企業 AI 應用的工程師與初學者。

如果你想延伸了解 AI 工具的實際應用與推薦清單, 可以參考 100款AI工具完整清單, 裡面整理了不同AI工具的用途與選擇方式。 或查看更多 人工智慧AI應用分類

Ollama 安裝與環境建置

本章將帶你完成 Ubuntu 22.04 安裝 Ollama 的完整流程,建立本地 LLM 執行環境。

步驟一:更新系統

sudo apt update && sudo apt upgrade -y

步驟二:安裝基本工具

sudo apt install -y curl git

步驟三:安裝 Ollama

curl -fsSL https://ollama.com/install.sh | sh

步驟四:確認安裝

ollama -v

步驟五:啟動模型(Mistral)

ollama run mistral

步驟六:啟動模型(Llama3)

ollama run llama3

步驟七:查看模型

ollama list

步驟八:下載模型

ollama pull qwen2.5

步驟九:刪除模型

ollama rm mistral

備註:首次執行模型會自動下載(約 4GB–8GB),請確保磁碟與網路穩定。

如何確認 Ollama 安裝成功?

完成 Ollama 安裝後,可以透過以下方式確認系統是否正常運作。 這一步非常重要,可以避免後續模型無法啟動的問題。

步驟一:確認版本

ollama -v

如果成功安裝,系統會回傳 Ollama 的版本號,例如:ollama version 0.x.x

步驟二:啟動測試模型

ollama run mistral

如果看到模型開始下載或進入對話模式,代表 Ollama 已經正常運作。

步驟三:檢查本地服務是否啟動

Ollama 會自動啟動本地 API 服務,你可以用瀏覽器測試:

http://localhost:11434

如果畫面出現 Ollama is running 或空白回應,代表服務已正常啟動。

步驟四:API 測試(進階驗證)

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "hello"
}'

如果有回傳 AI 回應內容,代表完整 LLM 環境已成功建立。

延伸閱讀:2026最新AI工具推薦 最強AI工具推薦

Ollama 模型介紹與使用方法

Ollama 支援多種大型語言模型,不同模型在速度、語言能力與應用場景上都有差異,以下是最常見三種模型介紹。

Mistral|輕量高速模型

Mistral 是輕量型模型,特點是速度快、資源需求低,非常適合 CPU 或低配環境。

ollama run mistral

適用:AI測試、簡單問答、開發環境

Qwen2.5|中文最佳模型

Qwen2.5 在中文理解能力表現優秀,適合中文文件問答與企業知識庫。

ollama run qwen2.5

適用:中文AI助手、RAG文件系統、企業應用

Llama3|通用穩定模型

Llama3 是通用型模型,在推理能力與穩定性方面表現均衡。

ollama run llama3

適用:AI聊天、Agent應用、開發測試

Ollama 模型選擇指南

如果你不知道該選哪個模型,可以依照以下方式快速決策:

  • ⚡ 低配電腦 → Mistral(速度優先)
  • 🌏 中文應用 → Qwen2.5(語意最佳)
  • 💬 通用用途 → Llama3(最穩定)

Ollama API 使用方式

Ollama 可透過 API 提供本地 AI 服務,適合整合 Web 系統或 RAG 架構。

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "什麼是人工智慧?"
}'

API 預設運行於 localhost:11434,可直接與 Python、Node.js 或 Web 前端整合。

更多 AI 實戰應用可以參考 人工智慧AI應用分類

FAQ 常見問題

Ollama 是什麼?

Ollama 是本地 LLM 執行環境,可以在不使用雲端 API 的情況下運行 AI 模型,例如 Llama3、Mistral 與 Qwen2.5。

Ollama 一定需要 GPU 嗎?

不需要 GPU 也能運行,但 GPU 可以大幅提升速度。建議至少 8GB RAM。

Qwen2.5 適合做什麼?

Qwen2.5 中文能力強,適合文件問答、企業知識庫與中文 AI 應用。

Mistral 有什麼優點?

Mistral 是輕量模型,速度快、資源需求低,非常適合入門與測試環境。

Llama3 適合用在哪裡?

Llama3 是通用型模型,適合 AI 聊天、Agent 應用與開發用途。

Ollama 可以商用嗎?

可以,Ollama 可用於企業內部系統與 AI 應用開發。