Token 概念
在模型服務中,一個核心概念是“token”。當您調用模型進行推理服務時,輸入內容會首先經過分詞處理,轉換成模型能夠識別的token形式。隨后,這些token經過模型的處理,再以token的形式輸出,并最終轉化為您所需的文本。
模型服務費用 = token 使用數量 * token 單價
不同的模型可能采用不同的分詞策略,同一段文本在不同模型上的 tokens 計量會存在差異。
產品價格
按 token 使用量付費
出賬時間:每小時出賬。
付款類型:按量后付費。
免費額度:使用模型時,將優先消耗免費額度,免費額度耗盡后,調用將會失敗;如需繼續使用,需要手動開通對應的模型付費服務。
標準時段
標準時段:08:00-24:00,各模型價格如下表,實際購買價格以下單頁面為準。
模型名稱 | 服務類型 | 計費單位 (元/百萬tokens) | 免費說明 | |
|---|---|---|---|---|
Deepseek系列 | DeepSeek-V3.1 | 輸入 | 4 | 每個模型可免費使用2500萬tokens,從第一次使用開始限期兩周。免費額度用完或到期后,可以付費開通服務。 |
輸出 | 16 | |||
| DeepSeek-R1-0528 | 輸入 | 4 | ||
輸出 | 16 | |||
DeepSeek-R1 | 輸入 | 4 | ||
輸出 | 16 | |||
DeepSeek-V3 | 輸入 | 2 | ||
輸出 | 8 | |||
DeepSeek-V3-0324 | 輸入 | 2 | ||
輸出 | 8 | |||
DeepSeek-R1-Distill-Llama-70B | 輸入 | 4.1 | ||
輸出 | 4.1 | |||
DeepSeek-R1-Distill-Qwen-32B | 輸入 | 1.3 | ||
輸出 | 1.3 | |||
千問系列 | Qwen3-235B-A22B | 輸入 | 2.5 | 每個模型可免費使用100萬tokens,從第一次使用開始限期兩周。免費額度用完或到期后,可以付費開通服務。 |
輸出 | 10 | |||
| Qwen3-30B-A3B | 輸入 | 1 | ||
輸出 | 4 | |||
| Qwen3-32B | 輸入 | 1 | ||
輸出 | 4 | |||
| Qwen3-14B | 輸入 | 0.8 | ||
輸出 | 1.6 | |||
Qwen3-8B | 輸入 | 0.3 | ||
輸出 | 0.6 | |||
| Qwen3-4B | 輸入 | 0.3 | ||
輸出 | 0.6 | |||
Qwen2.5-72B-Instruct | 輸入 | 4.13 | ||
輸出 | 4.13 | |||
Qwen2.5-VL-72B-Instruct | 輸入 | 4.13 | ||
輸出 | 4.13 | |||
Qwen-VL-Chat | 輸入 | 0.8 | ||
輸出 | 1.6 | |||
| 向量模型 | BGE-m3 | 輸入 | 0.5 | |
| BGE-Reranker-Large | 輸入 | 0.5 | ||
其他系列 | 每個模型可免費使用100萬tokens,用盡后不支持tokens計費模式,可以通過按卡時計費模式下單。 | |||
優惠時段
優惠時段:00:00-08:00,各模型價格如下表,實際購買價格以下單頁面為準。
| 模型名稱 | 服務類型 | 計費單位 (元/百萬tokens) | 優惠時段說明 |
|---|---|---|---|
| DeepSeek-V3.1 | 輸入 | 2 | 優惠時段時間范圍:00:00-08:00 |
輸出 | 8 | ||
| DeepSeek-R1-0528 | 輸入 | 1 | |
輸出 | 4 | ||
| DeepSeek-V3-0324 | 輸入 | 1 | |
輸出 | 4 | ||
| DeepSeek-R1 | 輸入 | 1 | |
輸出 | 4 | ||
| DeepSeek-V3 | 輸入 | 1 | |
輸出 | 4 |
使用限制
當前對模型設置了 RPM(Requests Per Minute,每分鐘請求數)及 TPM(Tokens Per Minute,每分鐘 token 數量)的調用限制,具體限制可在模型廣場模型詳情頁中查看。