Ollama + WebUI:在 VPS/本地快速部署私有化大模型
隨著 DeepSeek 和 Llama 4 等頂級大模型的開源,2026 年我們終於實現了“AI 自由”。你不再需要依賴昂貴的 API,也不必擔心對話內容被雲端廠商收集。
只要有一臺帶顯卡的電腦,或者一臺配置尚可的 VPS,你就能搭建一個完全屬於自己的私有 AI 助手。本文將帶你使用目前最流行的 Ollama 框架完成這一目標。
一、 為什麼選擇 Ollama?
在眾多本地部署工具中,Ollama 脫穎而出的原因只有一個:簡單。
- 一鍵運行:像運行 Docker 一樣運行大模型。
- 自動優化:根據你的硬件(顯卡/內存)自動選擇量化版本。
- 豐富的庫:官方模型庫涵蓋了目前市面上幾乎所有主流開源模型。
- 輕量化:後臺佔用極低,支持 API 調用。
二、 步驟一:安裝 Ollama
1. macOS / Windows 安裝
直接前往 Ollama 官網 下載對應的安裝包,像普通軟件一樣安裝即可。
2. Linux / VPS 安裝
在終端執行一行命令:
curl -fsSL https://ollama.com/install.sh | sh三、 步驟二:運行你的第一個模型
安裝完成後,你就可以召喚 AI 了。
運行 DeepSeek R1 (推理模型)
ollama run deepseek-r1:7b提示:如果是顯存較小的 VPS 或筆記本,建議先嚐試 7b 或 14b 版本。
運行 Llama 4
ollama run llama4運行後,你會直接進入一個命令行聊天界面。但對於大多數人來說,這並不好用。我們需要一個像 ChatGPT 一樣的網頁界面。
四、 步驟三:部署 Open WebUI (極力推薦)
Open WebUI 是目前 Ollama 最完美的搭檔,支持語音交互、文件上傳(RAG)、多模型對比等功能。
使用 Docker 一鍵部署
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/data \
--name open-webui \
ghcr.io/open-webui/open-webui:main部署完成後,在瀏覽器訪問 http://你的IP:3000 即可看到精美的 AI 聊天界面。
五、 進階:如何在 VPS 上發揮最大性能?
如果你是在 VPS 上部署,通常沒有高端顯卡。
1. 內存 vs 顯存
- 如果沒有 GPU,Ollama 會自動切換到 CPU 模式。此時內存頻率和核心數決定了生成速度。
- 建議至少配備 16GB 內存 來運行 14B 以上的模型。
2. 模型量化
如果你發現模型運行太慢,可以嘗試下載更小規模的版本:
deepseek-r1:1.5b(極速,適合低配)deepseek-r1:8b(平衡)deepseek-r1:32b(需要 32GB 內存)
3. 外網安全訪問
如果你想在公網訪問你的 WebUI,建議配合 Cloudflare Tunnel 或 Nginx 反向代理,並務必開啟 WebUI 的登錄賬號密碼。
六、 常用 Ollama 命令手冊
| 命令 | 說明 |
|---|---|
ollama list | 查看本地已下載的所有模型 |
ollama pull [name] | 僅下載模型,不運行 |
ollama rm [name] | 刪除某個模型 |
ollama ps | 查看當前正在運行的模型 |
ollama serve | 手動啟動 Ollama 服務端 |
🛡️ 結語
Ollama + Open WebUI 的組合,讓你在幾分鐘內就能擁有一個“本地版 ChatGPT”。無論你是為了隱私安全,還是為了在斷網環境下也能使用 AI,這套方案都是 2026 年的最佳選擇。
快去試試運行一個 deepseek-r1,感受一下私有 AI 的魅力吧!
延伸阅读
免责声明
本文仅供技术交流和学习参考。涉及第三方服务的链接可能包含 sponsored 标记,请自行核实服务条款、价格和可用性,并遵守当地法律法规。