起因
最近在研究怎麼用 AI 輔助開發,但 OpenAI 的 API 費用實在太貴了。於是我開始挖掘各種免費方案,沒想到收穫超乎預期。
這篇日誌記錄了我的探索過程和實際測試結果。
Day 1:發現 Groq 的極速世界
第一個讓我驚艷的是 Groq。
他們用自研的 LPU(Language Processing Unit)做推理,速度快到離譜。我實測 Llama 3.3 70B,輸出速度超過 300 tokens/秒——這是什麼概念?本地跑 Ollama 大概只有 20 tokens/秒。
免費額度
| 項目 | 額度 |
|---|---|
| 每日請求 | 14,400 次 |
| 每分鐘 tokens | 6,000 |
| 需要信用卡 | 不需要 |
註冊超簡單,到 console.groq.com 用 Google 帳號登入就好。
使用方式
from openai import OpenAI
client = OpenAI(
api_key="gsk_xxxxxxxx",
base_url="https://api.groq.com/openai/v1"
)
response = client.chat.completions.create(
model="llama-3.3-70b-versatile",
messages=[{"role": "user", "content": "你好!"}]
)
心得:速度真的是殺手級優勢,適合需要快速回應的場景。
Day 2:Mistral 的慷慨額度
接著測試了 Mistral AI,法國的 AI 新創。
他們的免費額度大到嚇人:每月 10 億 tokens。
10 億是什麼概念?大約等於 7.5 億個中文字,足夠寫幾千本小說。對個人開發者來說,根本用不完。
免費額度
| 項目 | 額度 |
|---|---|
| 每月 tokens | 1,000,000,000 |
| 每秒請求 | 1 次 |
| 需要手機驗證 | 是 |
注意事項
有個小坑要提:免費版的數據會用於模型訓練。如果在意隱私,這點要考慮一下。
註冊地址:console.mistral.ai
Day 3:遇見 Kimi K2.5
這是我這次探索最大的驚喜。
Kimi K2.5 是月之暗面(Moonshot AI)在 2026 年 1 月發布的開源多模態模型。更棒的是,NVIDIA 提供免費託管!
這模型有多強?
- 1 兆參數的 MoE 架構
- 支援圖片理解
- 中文能力頂級
- 開源(MIT License)
怎麼拿到免費 API?
- 到 build.nvidia.com/moonshotai/kimi-k2.5
- 點「View Code」
- 登入 NVIDIA 帳號(免費註冊)
- API Key 直接顯示在程式碼裡
from openai import OpenAI
client = OpenAI(
api_key="nvapi-xxxxxxxx",
base_url="https://integrate.api.nvidia.com/v1"
)
response = client.chat.completions.create(
model="moonshotai/kimi-k2.5",
messages=[{"role": "user", "content": "分析這段程式碼"}]
)
心得:免費用到頂級開源模型,NVIDIA 這波操作很可以。
Day 4:Google Gemini 的變化
本來想推薦 Google AI Studio,但最近情況有變。
2025 年 12 月,Google 大幅削減了免費額度。原本每天可以請求幾百次,現在被砍到只剩 20-50 次左右。Gemini 2.5 Pro 甚至從免費方案中移除了。
目前的免費額度(2026 年 2 月)
| 模型 | 每日請求 |
|---|---|
| Gemini 2.5 Flash | ~50 次 |
| Gemini 2.5 Flash-Lite | ~1,000 次 |
| Gemini 2.5 Pro | 付費限定 |
如果只是輕度使用,Gemini 還是很不錯,尤其繁體中文能力確實強。但如果需要大量請求,建議考慮其他方案。
Day 5:OpenRouter 萬能中轉站
最後測試了 OpenRouter——一個 API 中轉服務。
好處是一個 API Key 就能存取 30+ 個免費模型,不用一個一個註冊。
免費額度
| 項目 | 額度 |
|---|---|
| 每日請求 | ~200 次 |
| 儲值 $10 後 | 1,000 次/天 |
免費可用的模型
- Llama 3.3 70B
- Gemma 2 9B
- Qwen 2.5 72B
- Mistral 7B
還有個「Auto」模式,會自動選擇最適合的模型:
model = "openrouter/auto"
我的組合推薦
經過這幾天測試,我整理出幾種組合:
速度優先
主力:Groq (Llama 3.3 70B)
備用:NVIDIA NIM (Kimi K2.5)
月成本:$0
額度優先
主力:Mistral (Mistral Small)
備用:OpenRouter
月成本:$0
中文任務
主力:Kimi K2.5
備用:Google Gemini Flash
月成本:$0
總結
2026 年免費 LLM API 的選擇比我想像中多很多。善用這些資源,完全可以零成本開發 AI 應用。
我的建議是多註冊幾個平台,分散風險。畢竟免費額度隨時可能調整(Google 就是例子)。
快速連結
免費額度和政策可能隨時變動,請以官方資訊為準。