怎么运营才不会亏本?

本文讨论一个很多群友问的一个问题:我有一定的用户资源,想要部署一个来对外提供服务,请问我要把价格算力价格设置多少才合适呢? 或者换句话说,我要怎么设置价格才不会亏本呢?

我这里给大家提供一个简单的估算思路,供大家参考。不一定很准确,但是可以保证误差在可控范围内。

# 1. 算力成本

首先你需要计算一下你的算力成本,我们这里以中转站为例(https://api.geekai.me (opens new window)),下文我们简称中转A。

中转A的购买汇率为 3:1,也就是3块钱人民币可以购买到1美元的算力(如果你直接用OpenAI官方的API的话,那这个汇率就是 7.4:1)。

中转A的倍率是1,也就说算力的价格是1:1持平,通常中转的倍率都是要高于官方倍率的, 这点一般可以通过中转提供价格文档 (opens new window)可以看出。

我们以 gpt-4o 这个模型为例,下面是官方的价格表:

图片加载中...

下面是中转A的价格表:

图片加载中...

可以看出,中转A的算力价格确实跟官方的是一样的,因为 $5.00 / 1M tokens 和 $0.005 / 1K tokens 是等价的。

所以,加入你从中转A购买算力的话,那么你每 1K tokens 的成本就是:

# 输入成本
0.005 * 3 = 0.015 RMB 
# 返回成本
0.015 * 3 = 0.045 RMB

# 2. 对话算力

这里我们照样以 gpt-4o 模型为例,这个模型的最大上下文是128K(见上图),由于我们的对话是携带上下文的,那么随着对话轮数的增加,上下文的长度会越来越长,且输入的长度会远远长于输出,我们假设输入占70%,输出占 30%,那么根据上面我们计算出的算力价格,gpt-4o 模型的单次对话的最大成本为:

## 输入成本
0.015 * 128 * 0.7 = 1.34 RMB 
## 输出成本
0.045 * 128 * 0.3 = 1.72 RMB
## 总成本
1.34 + 1.72 = 3.06 RMB

这是最极端的情况,意味着每次用户都把模型的上下文用完。实际情况肯定会远远小于这个值,因为你跟AI对话通常是一问一答慢慢说的,除非你上来就丢一篇万字长文让 AI 分析。所以实际的情况我们应该可以粗略地取中位数,也就是每次 gpt-4o 对话的成本大概是 1.5 元RMB。

在 GeekAI 中,我们假设你 100 个单位算力卖 10 RBM,那么 gpt-4o 模型设置单次对话消耗的算力应该为:

100/(10/1.5) = 15 算力

这个成本似乎不低,但是没办法,我们必须按照这个来算,才能保证你不会亏本。如果你觉得这个价格用户会比较难接受,那么没关系,你还有其他方法进一步降低成本。你可以在 GeekAI 的管理后台,模型管理页面设置 gpt-4o 模型的最大上下文长度。

图片加载中...

假设你设置模型最大上下文长度为 8K,那么成本瞬间就降低了16倍,用户一次对话的最大成本为:0.1 RMB。

## 输入成本
0.015 * 8 * 0.7 = 1.34 RMB 
## 输出成本
0.045 * 8 * 0.3 = 1.72 RMB

那么此时你 gpt-4o 模型的算力只需设置为 1 即可保本,或者你把算力设置为2,然后把算力价格调低,比如 10 块钱买 200 算力。

以此类推可以粗略得出其他模型的每次对话消耗的算力成本,不过建议你以 gpt-3.5 为1个算力单位的价格,反推起模型价格,因为这个模型最便宜, 否则如果 gpt-4o 模型算力是1的话,那么gpt-3.5就是小数了,而这是不允许的。根据 OpenAI 官方的价格表可以推算出,gpt-4o 的价格是 gpt-3.5 的 10 倍,如果我们把 gpt-3.5 算力设置为 1,那么 gpt-4o 的算力就是10,其他模型以此类推。

# 3. 绘图算力

绘图的算力推算跟对话类似,我们以 MJ 为例,单次 MJ 调用的价格是 $0.145。

图片加载中...

假设你在 GeekAI 设置的单位算力的售价是 0.1 RMB,则单次 MJ 绘画应该消耗的算力为:

0.145 * 3 / 0.1 = 4.34 算力

那你基本上设置 5 算力就可以保本了。那如果你想有 20% 的利润的话,那么你就设置为 6,以此类推。

上次更新: 2025/1/15 16:31:06