GeekAI 用户手册GeekAI 用户手册
  • 指南

    • 介绍
    • 快速部署
    • 进阶部署
  • 配置

    • AI 绘图配置
    • 音乐和视频
    • 文件存储配置
  • 升级

    • 平滑升级
  • 开发

    • 开发和构建
    • 如何跳过 License 验证
  • 指南

    • 介绍
    • 部署
  • 配置

    • Coze 智能体
    • Dify 智能体
    • 阿里云百炼智能体
  • 升级

    • Geek-Agent v1.0.2
    • Geek-Agent v1.0.3
  • GeekAI-PLUS(不带管理后台)
  • GeekAI-PLUS(带管理后台)
  • GeekAI-Agent(不带管理后台)
  • AI 学习笔记

    • 01-Stable-Diffusion基本知识概论
    • 02-DeepSeek R1 的核心技术解密
    • 03-DeepSeek R1 使用指南(持续更新)
    • 03-关于 AI Agent 的一些个人思考
    • 04-搞懂 MCP 和 A2A 协议
  • 极客学长博客
  • 技术交流群
  • GitHub
  • Gitee
  • GitCode
  • 简体中文
  • en-US
GitHub
  • 指南

    • 介绍
    • 快速部署
    • 进阶部署
  • 配置

    • AI 绘图配置
    • 音乐和视频
    • 文件存储配置
  • 升级

    • 平滑升级
  • 开发

    • 开发和构建
    • 如何跳过 License 验证
  • 指南

    • 介绍
    • 部署
  • 配置

    • Coze 智能体
    • Dify 智能体
    • 阿里云百炼智能体
  • 升级

    • Geek-Agent v1.0.2
    • Geek-Agent v1.0.3
  • GeekAI-PLUS(不带管理后台)
  • GeekAI-PLUS(带管理后台)
  • GeekAI-Agent(不带管理后台)
  • AI 学习笔记

    • 01-Stable-Diffusion基本知识概论
    • 02-DeepSeek R1 的核心技术解密
    • 03-DeepSeek R1 使用指南(持续更新)
    • 03-关于 AI Agent 的一些个人思考
    • 04-搞懂 MCP 和 A2A 协议
  • 极客学长博客
  • 技术交流群
  • GitHub
  • Gitee
  • GitCode
  • 简体中文
  • en-US
GitHub
  • GeekAI-Plus

    • 介绍
    • 快速部署
    • 进阶部署
    • Window 系统部署
    • 使用宝塔部署
    • 常见错误
  • 配置

    • API令牌配置
    • AI 绘图配置
    • 音乐和视频
    • 文件存储配置
    • 支付配置
    • Gitee AI API 接口接入指南
    • 其他服务配置
    • 运营策略
  • 升级

    • 平滑升级
    • GeekAI-PLUS-v4.1.6
    • GeekAI-PLUS-v4.1.8
    • GeekAI-PLUS-v4.1.9
    • GeekAI-PLUS-v4.2.1
    • GeekAI-PLUS-v4.2.2
    • GeekAI-PLUS-v4.2.3
    • GeekAI-PLUS-v4.2.4
  • 开发

    • 开发和构建
    • 如何跳过 License 验证

怎么运营才不会亏本?

本文讨论一个很多群友问的一个问题:我有一定的用户资源,想要部署一个来对外提供服务,请问我要把价格算力价格设置多少才合适呢? 或者换句话说,我要怎么设置价格才不会亏本呢?

我这里给大家提供一个简单的估算思路,供大家参考。不一定很准确,但是可以保证误差在可控范围内。

1. 算力成本

首先你需要计算一下你的算力成本,我们这里以中转站为例(https://api.geekai.me),下文我们简称中转A。

中转A的购买汇率为 3:1,也就是3块钱人民币可以购买到1美元的算力(如果你直接用OpenAI官方的API的话,那这个汇率就是 7.4:1)。

中转A的倍率是1,也就说算力的价格是1:1持平,通常中转的倍率都是要高于官方倍率的, 这点一般可以通过中转提供价格文档可以看出。

我们以 gpt-4o 这个模型为例,下面是官方的价格表:

gpt-4o 价格表

下面是中转A的价格表:

中转A 价格表

可以看出,中转A的算力价格确实跟官方的是一样的,因为 $5.00 / 1M tokens 和 $0.005 / 1K tokens 是等价的。

所以,加入你从中转A购买算力的话,那么你每 1K tokens 的成本就是:

# 输入成本
0.005 * 3 = 0.015 RMB
# 返回成本
0.015 * 3 = 0.045 RMB

2. 对话算力

这里我们照样以 gpt-4o 模型为例,这个模型的最大上下文是128K(见上图),由于我们的对话是携带上下文的,那么随着对话轮数的增加,上下文的长度会越来越长,且输入的长度会远远长于输出,我们假设输入占70%,输出占 30%,那么根据上面我们计算出的算力价格,gpt-4o 模型的单次对话的最大成本为:

## 输入成本
0.015 * 128 * 0.7 = 1.34 RMB
## 输出成本
0.045 * 128 * 0.3 = 1.72 RMB
## 总成本
1.34 + 1.72 = 3.06 RMB

这是最极端的情况,意味着每次用户都把模型的上下文用完。实际情况肯定会远远小于这个值,因为你跟AI对话通常是一问一答慢慢说的,除非你上来就丢一篇万字长文让 AI 分析。所以实际的情况我们应该可以粗略地取中位数,也就是每次 gpt-4o 对话的成本大概是 1.5 元RMB。

在 GeekAI 中,我们假设你 100 个单位算力卖 10 RBM,那么 gpt-4o 模型设置单次对话消耗的算力应该为:

100/(10/1.5) = 15 算力

这个成本似乎不低,但是没办法,我们必须按照这个来算,才能保证你不会亏本。如果你觉得这个价格用户会比较难接受,那么没关系,你还有其他方法进一步降低成本。你可以在 GeekAI 的管理后台,模型管理页面设置 gpt-4o 模型的最大上下文长度。

设置模型最大上下文长度

假设你设置模型最大上下文长度为 8K,那么成本瞬间就降低了16倍,用户一次对话的最大成本为:0.1 RMB。

## 输入成本
0.015 * 8 * 0.7 = 1.34 RMB
## 输出成本
0.045 * 8 * 0.3 = 1.72 RMB

那么此时你 gpt-4o 模型的算力只需设置为 1 即可保本,或者你把算力设置为2,然后把算力价格调低,比如 10 块钱买 200 算力。

以此类推可以粗略得出其他模型的每次对话消耗的算力成本,不过建议你以 gpt-3.5 为1个算力单位的价格,反推起模型价格,因为这个模型最便宜, 否则如果 gpt-4o 模型算力是1的话,那么gpt-3.5就是小数了,而这是不允许的。根据 OpenAI 官方的价格表可以推算出,gpt-4o 的价格是 gpt-3.5 的 10 倍,如果我们把 gpt-3.5 算力设置为 1,那么 gpt-4o 的算力就是10,其他模型以此类推。

3. 绘图算力

绘图的算力推算跟对话类似,我们以 MJ 为例,单次 MJ 调用的价格是 $0.145。

MJ 价格表

假设你在 GeekAI 设置的单位算力的售价是 0.1 RMB,则单次 MJ 绘画应该消耗的算力为:

0.145 * 3 / 0.1 = 4.34 算力

那你基本上设置 5 算力就可以保本了。那如果你想有 20% 的利润的话,那么你就设置为 6,以此类推。

在 GitHub 上编辑此页
上次更新: 2025/6/26 21:13
贡献者: RockYang, GeekMaster
Prev
其他服务配置
极客学长 © 2022-2025 版权所有 粤ICP备19122051号-1