运营策略 | GeekAI 用户手册

怎么运营才不会亏本？

本文讨论一个很多群友问的一个问题：我有一定的用户资源，想要部署一个来对外提供服务，请问我要把价格算力价格设置多少才合适呢？或者换句话说，我要怎么设置价格才不会亏本呢？

我这里给大家提供一个简单的估算思路，供大家参考。不一定很准确，但是可以保证误差在可控范围内。

1. 算力成本

首先你需要计算一下你的算力成本，我们这里以中转站为例（极客学长API-01），下文我们简称中转A。

中转A的购买汇率为 2:1，也就是2块钱人民币可以购买到1美元的算力（如果你直接用OpenAI官方的API的话，那这个汇率就是 7.x:1）。

中转A的倍率是1，也就说算力的价格是1:1持平，通常中转的倍率都是要高于官方倍率的，这点一般可以通过中转提供价格文档可以看出。

我们以 gpt-4o 这个模型为例，下面是官方的价格表：

gpt-4o 价格表

下面是中转A的价格表：

中转A 价格表

可以看出，中转A的算力价格确实跟官方的是一样的，因为 $5.00 / 1M tokens 和 $0.005 / 1K tokens 是等价的。

所以，加入你从中转A购买算力的话，那么你每 1K tokens 的成本就是：

# 输入成本
0.005 * 3 = 0.015 RMB
# 返回成本
0.015 * 3 = 0.045 RMB

2. 对话算力

这里我们照样以 gpt-4o 模型为例，这个模型的最大上下文是128K（见上图），由于我们的对话是携带上下文的，那么随着对话轮数的增加，上下文的长度会越来越长，且输入的长度会远远长于输出，我们假设输入占70%，输出占 30%，那么根据上面我们计算出的算力价格，gpt-4o 模型的单次对话的最大成本为：

## 输入成本
0.015 * 128 * 0.7 = 1.34 RMB
## 输出成本
0.045 * 128 * 0.3 = 1.72 RMB
## 总成本
1.34 + 1.72 = 3.06 RMB

这是最极端的情况，意味着每次用户都把模型的上下文用完。实际情况肯定会远远小于这个值，因为你跟AI对话通常是一问一答慢慢说的，除非你上来就丢一篇万字长文让 AI 分析。所以实际的情况我们应该可以粗略地取中位数，也就是每次 gpt-4o 对话的成本大概是 1.5 元RMB。

在 GeekAI 中，我们假设你 100 个单位算力卖 10 RBM，那么 gpt-4o 模型设置单次对话消耗的算力应该为：

100/(10/1.5) = 15 算力

这个成本似乎不低，但是没办法，我们必须按照这个来算，才能保证你不会亏本。如果你觉得这个价格用户会比较难接受，那么没关系，你还有其他方法进一步降低成本。你可以在 GeekAI 的管理后台，模型管理页面设置 gpt-4o 模型的最大上下文长度。

设置模型最大上下文长度

假设你设置模型最大上下文长度为 8K，那么成本瞬间就降低了16倍，用户一次对话的最大成本为：0.1 RMB。

## 输入成本
0.015 * 8 * 0.7 = 1.34 RMB
## 输出成本
0.045 * 8 * 0.3 = 1.72 RMB

那么此时你 gpt-4o 模型的算力只需设置为 1 即可保本，或者你把算力设置为2，然后把算力价格调低，比如 10 块钱买 200 算力。

以此类推可以粗略得出其他模型的每次对话消耗的算力成本，不过建议你以 gpt-3.5 为1个算力单位的价格，反推起模型价格，因为这个模型最便宜，否则如果 gpt-4o 模型算力是1的话，那么gpt-3.5就是小数了，而这是不允许的。根据 OpenAI 官方的价格表可以推算出，gpt-4o 的价格是 gpt-3.5 的 10 倍，如果我们把 gpt-3.5 算力设置为 1，那么 gpt-4o 的算力就是10，其他模型以此类推。

3. 绘图算力

绘图的算力推算跟对话类似，我们以 MJ 为例，单次 MJ 调用的价格是 $0.145。

MJ 价格表

假设你在 GeekAI 设置的单位算力的售价是 0.1 RMB，则单次 MJ 绘画应该消耗的算力为：

0.145 * 3 / 0.1 = 4.34 算力

那你基本上设置 5 算力就可以保本了。那如果你想有 20% 的利润的话，那么你就设置为 6，以此类推。