跳轉到內容

Ollama + WebUI:在 VPS/本地快速部署私有化大模型

Local AI Deployment

隨著 DeepSeek 和 Llama 4 等頂級大模型的開源,2026 年我們終於實現了“AI 自由”。你不再需要依賴昂貴的 API,也不必擔心對話內容被雲端廠商收集。

只要有一臺帶顯卡的電腦,或者一臺配置尚可的 VPS,你就能搭建一個完全屬於自己的私有 AI 助手。本文將帶你使用目前最流行的 Ollama 框架完成這一目標。


一、 為什麼選擇 Ollama?

在眾多本地部署工具中,Ollama 脫穎而出的原因只有一個:簡單

  • 一鍵運行:像運行 Docker 一樣運行大模型。
  • 自動優化:根據你的硬件(顯卡/內存)自動選擇量化版本。
  • 豐富的庫:官方模型庫涵蓋了目前市面上幾乎所有主流開源模型。
  • 輕量化:後臺佔用極低,支持 API 調用。

二、 步驟一:安裝 Ollama

1. macOS / Windows 安裝

直接前往 Ollama 官網 下載對應的安裝包,像普通軟件一樣安裝即可。

2. Linux / VPS 安裝

在終端執行一行命令:

bash
curl -fsSL https://ollama.com/install.sh | sh

三、 步驟二:運行你的第一個模型

安裝完成後,你就可以召喚 AI 了。

運行 DeepSeek R1 (推理模型)

bash
ollama run deepseek-r1:7b

提示:如果是顯存較小的 VPS 或筆記本,建議先嚐試 7b 或 14b 版本。

運行 Llama 4

bash
ollama run llama4

運行後,你會直接進入一個命令行聊天界面。但對於大多數人來說,這並不好用。我們需要一個像 ChatGPT 一樣的網頁界面。


四、 步驟三:部署 Open WebUI (極力推薦)

Open WebUI 是目前 Ollama 最完美的搭檔,支持語音交互、文件上傳(RAG)、多模型對比等功能。

使用 Docker 一鍵部署

bash
docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

部署完成後,在瀏覽器訪問 http://你的IP:3000 即可看到精美的 AI 聊天界面。


五、 進階:如何在 VPS 上發揮最大性能?

如果你是在 VPS 上部署,通常沒有高端顯卡。

1. 內存 vs 顯存

  • 如果沒有 GPU,Ollama 會自動切換到 CPU 模式。此時內存頻率核心數決定了生成速度。
  • 建議至少配備 16GB 內存 來運行 14B 以上的模型。

2. 模型量化

如果你發現模型運行太慢,可以嘗試下載更小規模的版本:

  • deepseek-r1:1.5b (極速,適合低配)
  • deepseek-r1:8b (平衡)
  • deepseek-r1:32b (需要 32GB 內存)

3. 外網安全訪問

如果你想在公網訪問你的 WebUI,建議配合 Cloudflare TunnelNginx 反向代理,並務必開啟 WebUI 的登錄賬號密碼。


六、 常用 Ollama 命令手冊

命令說明
ollama list查看本地已下載的所有模型
ollama pull [name]僅下載模型,不運行
ollama rm [name]刪除某個模型
ollama ps查看當前正在運行的模型
ollama serve手動啟動 Ollama 服務端

🛡️ 結語

Ollama + Open WebUI 的組合,讓你在幾分鐘內就能擁有一個“本地版 ChatGPT”。無論你是為了隱私安全,還是為了在斷網環境下也能使用 AI,這套方案都是 2026 年的最佳選擇。

快去試試運行一個 deepseek-r1,感受一下私有 AI 的魅力吧!


延伸阅读

免责声明

本文仅供技术交流和学习参考。涉及第三方服务的链接可能包含 sponsored 标记,请自行核实服务条款、价格和可用性,并遵守当地法律法规。

最後更新於: