Ollama + WebUI：在 VPS/本地快速部署私有化大模型

Local AI Deployment

隨著 DeepSeek 和 Llama 4 等頂級大模型的開源，2026 年我們終於實現了“AI 自由”。你不再需要依賴昂貴的 API，也不必擔心對話內容被雲端廠商收集。

只要有一臺帶顯卡的電腦，或者一臺配置尚可的 VPS，你就能搭建一個完全屬於自己的私有 AI 助手。本文將帶你使用目前最流行的 Ollama 框架完成這一目標。

一、為什麼選擇 Ollama？

在眾多本地部署工具中，Ollama 脫穎而出的原因只有一個：簡單。

一鍵運行：像運行 Docker 一樣運行大模型。
自動優化：根據你的硬件（顯卡/內存）自動選擇量化版本。
豐富的庫：官方模型庫涵蓋了目前市面上幾乎所有主流開源模型。
輕量化：後臺佔用極低，支持 API 調用。

二、步驟一：安裝 Ollama

1. macOS / Windows 安裝

直接前往 Ollama 官網下載對應的安裝包，像普通軟件一樣安裝即可。

2. Linux / VPS 安裝

在終端執行一行命令：

bash

curl -fsSL https://ollama.com/install.sh | sh

三、步驟二：運行你的第一個模型

安裝完成後，你就可以召喚 AI 了。

運行 DeepSeek R1 (推理模型)

bash

ollama run deepseek-r1:7b

提示：如果是顯存較小的 VPS 或筆記本，建議先嚐試 7b 或 14b 版本。

運行 Llama 4

bash

ollama run llama4

運行後，你會直接進入一個命令行聊天界面。但對於大多數人來說，這並不好用。我們需要一個像 ChatGPT 一樣的網頁界面。

四、步驟三：部署 Open WebUI (極力推薦)

Open WebUI 是目前 Ollama 最完美的搭檔，支持語音交互、文件上傳（RAG）、多模型對比等功能。

使用 Docker 一鍵部署

bash

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

部署完成後，在瀏覽器訪問 http://你的IP:3000 即可看到精美的 AI 聊天界面。

五、進階：如何在 VPS 上發揮最大性能？

如果你是在 VPS 上部署，通常沒有高端顯卡。

1. 內存 vs 顯存

如果沒有 GPU，Ollama 會自動切換到 CPU 模式。此時內存頻率和核心數決定了生成速度。
建議至少配備 16GB 內存 來運行 14B 以上的模型。

2. 模型量化

如果你發現模型運行太慢，可以嘗試下載更小規模的版本：

deepseek-r1:1.5b (極速，適合低配)
deepseek-r1:8b (平衡)
deepseek-r1:32b (需要 32GB 內存)

3. 外網安全訪問

如果你想在公網訪問你的 WebUI，建議配合 Cloudflare Tunnel 或 Nginx 反向代理，並務必開啟 WebUI 的登錄賬號密碼。

六、常用 Ollama 命令手冊

命令	說明
`ollama list`	查看本地已下載的所有模型
`ollama pull [name]`	僅下載模型，不運行
`ollama rm [name]`	刪除某個模型
`ollama ps`	查看當前正在運行的模型
`ollama serve`	手動啟動 Ollama 服務端

🛡️ 結語

Ollama + Open WebUI 的組合，讓你在幾分鐘內就能擁有一個“本地版 ChatGPT”。無論你是為了隱私安全，還是為了在斷網環境下也能使用 AI，這套方案都是 2026 年的最佳選擇。

快去試試運行一個 deepseek-r1，感受一下私有 AI 的魅力吧！

延伸阅读

免责声明

本文仅供技术交流和学习参考。涉及第三方服务的链接可能包含 sponsored 标记，请自行核实服务条款、价格和可用性，并遵守当地法律法规。

Ollama + WebUI：在 VPS/本地快速部署私有化大模型 ​

一、 為什麼選擇 Ollama？ ​

二、 步驟一：安裝 Ollama ​

1. macOS / Windows 安裝 ​

2. Linux / VPS 安裝 ​

三、 步驟二：運行你的第一個模型 ​

運行 DeepSeek R1 (推理模型) ​

運行 Llama 4 ​

四、 步驟三：部署 Open WebUI (極力推薦) ​

使用 Docker 一鍵部署 ​

五、 進階：如何在 VPS 上發揮最大性能？ ​

1. 內存 vs 顯存 ​

2. 模型量化 ​

3. 外網安全訪問 ​

六、 常用 Ollama 命令手冊 ​

🛡️ 結語 ​

延伸阅读 ​

Ollama + WebUI：在 VPS/本地快速部署私有化大模型

一、為什麼選擇 Ollama？

二、步驟一：安裝 Ollama

1. macOS / Windows 安裝

2. Linux / VPS 安裝

三、步驟二：運行你的第一個模型

運行 DeepSeek R1 (推理模型)

運行 Llama 4

四、步驟三：部署 Open WebUI (極力推薦)

使用 Docker 一鍵部署

五、進階：如何在 VPS 上發揮最大性能？

1. 內存 vs 顯存

2. 模型量化

3. 外網安全訪問

六、常用 Ollama 命令手冊

🛡️ 結語

延伸阅读