GeekAI-PPT:有逻辑,又有审美的 AI 演示文稿生成平台
从主题或文档,一键生成结构清晰、风格统一的现代科技感 PPT
快速导航
- 先跑起来: 安装与部署
- 先用起来: 使用指南
- 要做定制: 二次开发与架构说明
- 常见问题: 扩展常见问题与最佳实践
产品定位
GeekAI-PPT 是一款 AI 驱动的智能演示文稿生成平台,面向职场汇报、课程培训、产品介绍、运营方案等多种场景。
它聚焦解决「从想法/文档到 PPT」里最耗时的部分:你只要讲清 想表达什么,其余由系统完成:
- 上层:根据主题和文档生成 有记忆点的大纲结构
- 中层:为每一页提炼出 清晰的观点与要点
- 底层:调用图像模型生成 风格统一的画面
你可以把 GeekAI-PPT 理解为一位 懂逻辑、也懂设计的 PPT 助理:主线清晰,视觉统一。
解决的核心问题
1. 手工做 PPT 太耗时间
传统制作 PPT 的流程往往是:
- 想主题 → 找模板 → 填内容 → 调配色、调排版 → 改来改去。
问题在于:
- 结构难搭:从文档到 PPT 需要重新梳理逻辑,很费脑力
- 设计门槛高:不懂设计的人做不出「像样」的视觉效果
- 重复劳动多:不同场景的 PPT 往往需要不断复制、微调
GeekAI-PPT 解决方式:
- 输入主题 + 简要需求,或上传已有文档
- 系统自动完成 大纲规划 + 内容提炼 + 视觉生成
- 用户只需对少数关键页面进行微调和补充
2. 模板式 PPT 难贴合实际业务
市面上大量 PPT 模板虽然好看,但存在共性问题:
- 逻辑结构是固定的,难以适配真实业务场景
- 为了「塞满模板」,内容经常被迫拼凑
- 内容与版式脱节,读起来零散、记不住主线
GeekAI-PPT 解决方式:
- 先根据你的主题/文档,生成 专属结构与内容主线
- 再在此基础上匹配统一风格的版式与配图
- 模板不再是起点,而是被动适配的「结果」
3. 从文档/需求到可讲解 PPT 的转化成本高
许多工作内容本身已经有文档:需求文档、方案文档、课程讲义等,但:
- 直接复制进 PPT → 字太多,观众看不下去
- 手动精简 → 容易丢重点、破坏原有逻辑
GeekAI-PPT 解决方式:
- 支持上传
PDF / DOCX / TXT / MD等格式 - 在 AI 规划阶段对内容进行 二次提炼:提炼标题、要点、结构
- 保留你的专业表达,同时更适合口头讲解
核心价值主张
面向普通创作者和职场用户
自然语言/文档即可生成 PPT 雏形
- 不需要懂设计,也能快速拿到一套 能讲、能用 的 PPT
- 通过「规划 → 生成 → 微调」的流程,将时间花在「想说什么」而不是「怎么排版」
- 支持多种主题场景:汇报、培训、分享、方案等
面向讲师、培训方与内容团队
更快备课,更容易迭代
- 一份课程大纲或讲义文档即可生成初版课件
- 每张幻灯片都有 版本历史,方便尝试不同视觉风格与内容浓度
- 更容易维护多期课程、多版本教材
面向技术团队与企业
可私有化部署,便于集成与二次开发
- 基于 FastAPI + Vue 3 架构,代码结构清晰、易于扩展
- 支持配置 GeekAI 或任意兼容 Gemini API 协议的上游服务
- 存储在本地 SQLite + 文件系统,适合内网/私有部署场景
核心功能亮点
AI 驱动的两阶段生成流程
GeekAI-PPT 的生成过程分为两个阶段:
- 规划阶段(逻辑模型)
- 根据主题和可选的上传文档
- 生成完整的大纲结构与每页的视觉描述(prompt)
- 渲染阶段(图像模型)
- 针对每一页调用图像模型生成图片
- 保持前后风格统一,突出本页核心观点
这一设计确保了 PPT 先有结构再有画面,逻辑和视觉各司其职。
文档智能解析
- 支持上传
PDF / DOCX / TXT / MD等格式文件 - 自动提取正文内容(支持较长上下文),供规划阶段使用
- 适合「已有方案文档 → 生成课件/路演稿」等场景
多版本幻灯片管理
- 每张幻灯片都支持 多版本历史
- 每次重新生成或修改,都会记录为一个新版本
- 前端可随时在不同版本之间切换,找到更合适的组合
视觉风格统一的科技感 PPT
- 默认采用「现代科技/互联网风格」的视觉设定
- 前后页保持色彩、构图、元素风格的连贯性
- 同一套 PPT 看起来像是统一设计师完成,而不是拼凑出来
灵活的编辑与操作能力
- 新建/插入/删除/重排幻灯片
- 基于当前图片进行「修改后重新生成」
- 支持软删除与回收站机制(演示文稿与幻灯片),避免误删
技术架构一览
GeekAI-PPT 的整体架构如下:
- 前端(web/)
- 基于 Vue 3 + Vite + Pinia + Element Plus + Tailwind CSS
- 提供演示文稿创建、编辑器画布、幻灯片缩略图、版本选择等交互
- 后端(backend/)
- 基于 FastAPI + SQLAlchemy
- 负责演示文稿/幻灯片/版本的 CRUD、规划与生成接口、文件上传解析、API Key 管理等
- 模型调用
- 通过 GeekAI 或其他兼容 Gemini API 协议的服务调用逻辑模型和图像模型
MODEL_LOGIC:负责规划大纲和内容结构MODEL_IMAGE:负责根据 prompt 生成幻灯片图片
- 存储(storage/)
- SQLite 数据库存储演示文稿、幻灯片及版本元数据
- 本地文件系统
storage/images/{session_id}/存储生成的图片
更详细的架构与数据流说明可参考 系统架构说明。
快速开始
如果你想本地快速体验 GeekAI-PPT,按下面路径即可:
- 准备环境
- 安装
Python 3.9+与Node.js 18+ - 在 GeekAI 或其他兼容 Gemini API 协议的服务中获取可用 API Key
- 安装
- 克隆项目并启动后端
- 参考仓库根目录的
README.md,完成依赖安装与backend/.env配置
- 参考仓库根目录的
- 启动前端并访问应用
- 在浏览器中打开前端地址(默认
http://localhost:3000)
- 在浏览器中打开前端地址(默认
- 体验一次完整生成流程
- 创建一个新的演示文稿,输入主题
- (可选)上传一份现成的方案/讲义文档
- 点击「规划」查看自动生成的大纲
- 逐页或批量生成幻灯片,并尝试切换不同版本
页面预览(示意)
以下为典型页面形态的文字说明,实际文档站可配合截图展示:
- 首页/作品列表:展示已有演示文稿,可新建/删除/恢复
- 创建页:输入主题、选择语言与场景,可上传参考文档
- 规划页/大纲视图:展示 AI 生成的大纲结构,可手动微调
- 编辑器页:左侧缩略图,右侧大图预览,下方版本切换
- 生成历史/版本面板:展示当前幻灯片各个生成版本的缩略图
常见问题(FAQ)
GeekAI-PPT 必须使用 GeekAI 作为上游服务吗?
不必须。项目默认推荐使用 GeekAI 提供的 Gemini 模型中转服务,但只要上游服务 协议兼容 Gemini API,即可通过修改 BASE_URL、MODEL_LOGIC、MODEL_IMAGE 等配置接入其他服务。
生成速度和质量与什么有关?
主要与以下因素相关:
- 所选模型的性能与并发能力
- 你的网络环境与上游服务的延迟
- 每次生成的页数(一次性批量生成会耗时更久)
建议在体验阶段从较少页数开始,逐步增加规模。
图片和数据存储在哪里?是否支持私有化部署?
- 元数据(演示文稿、幻灯片、版本)默认存储在本地 SQLite 数据库
- 生成的图片默认存储在
backend/storage/images/{session_id}/目录 - 整个系统可以在你自己的服务器或内网环境中部署,不依赖第三方托管
能否调整生成出来的 PPT 风格?
可以。你可以通过:
- 修改后端配置或代码中的默认风格 prompt
- 在产品未来版本中(如已支持)通过前端 UI 选择不同的风格模版
更细粒度的 prompt 与风格调整方式,可参考仓库内的 [docs/system_prompt.md] 与后端相关代码。
是否适合在教学场景中使用?
适合。GeekAI-PPT 提供完整的前后端代码与清晰的数据流,非常适合作为:
- 「AI + 应用开发」课程中的示例项目
- 「从需求到 PPT」自动化流程的教学案例
你可以结合 [docs/development-guide.md] 文档,在课堂上演示一次从配置到生成的完整流程。
