GeekAI-PPT：有逻辑，又有审美的 AI 演示文稿生成平台

从主题或文档，一键生成结构清晰、风格统一的现代科技感 PPT

快速导航

先跑起来：安装与部署
先用起来：使用指南
要做定制：二次开发与架构说明
常见问题：扩展常见问题与最佳实践

产品定位

GeekAI-PPT 是一款 AI 驱动的智能演示文稿生成平台，面向职场汇报、课程培训、产品介绍、运营方案等多种场景。

它聚焦解决「从想法/文档到 PPT」里最耗时的部分：你只要讲清 想表达什么，其余由系统完成：

上层：根据主题和文档生成 有记忆点的大纲结构
中层：为每一页提炼出 清晰的观点与要点
底层：调用图像模型生成 风格统一的画面

你可以把 GeekAI-PPT 理解为一位 懂逻辑、也懂设计的 PPT 助理：主线清晰，视觉统一。

解决的核心问题

1. 手工做 PPT 太耗时间

传统制作 PPT 的流程往往是：

想主题 → 找模板 → 填内容 → 调配色、调排版 → 改来改去。

问题在于：

结构难搭：从文档到 PPT 需要重新梳理逻辑，很费脑力
设计门槛高：不懂设计的人做不出「像样」的视觉效果
重复劳动多：不同场景的 PPT 往往需要不断复制、微调

GeekAI-PPT 解决方式：

输入主题 + 简要需求，或上传已有文档
系统自动完成 大纲规划 + 内容提炼 + 视觉生成
用户只需对少数关键页面进行微调和补充

2. 模板式 PPT 难贴合实际业务

市面上大量 PPT 模板虽然好看，但存在共性问题：

逻辑结构是固定的，难以适配真实业务场景
为了「塞满模板」，内容经常被迫拼凑
内容与版式脱节，读起来零散、记不住主线

GeekAI-PPT 解决方式：

先根据你的主题/文档，生成 专属结构与内容主线
再在此基础上匹配统一风格的版式与配图
模板不再是起点，而是被动适配的「结果」

3. 从文档/需求到可讲解 PPT 的转化成本高

许多工作内容本身已经有文档：需求文档、方案文档、课程讲义等，但：

直接复制进 PPT → 字太多，观众看不下去
手动精简 → 容易丢重点、破坏原有逻辑

GeekAI-PPT 解决方式：

支持上传 PDF / DOCX / TXT / MD 等格式
在 AI 规划阶段对内容进行 二次提炼：提炼标题、要点、结构
保留你的专业表达，同时更适合口头讲解

核心价值主张

面向普通创作者和职场用户

自然语言/文档即可生成 PPT 雏形

不需要懂设计，也能快速拿到一套 能讲、能用 的 PPT
通过「规划 → 生成 → 微调」的流程，将时间花在「想说什么」而不是「怎么排版」
支持多种主题场景：汇报、培训、分享、方案等

面向讲师、培训方与内容团队

更快备课，更容易迭代

一份课程大纲或讲义文档即可生成初版课件
每张幻灯片都有 版本历史，方便尝试不同视觉风格与内容浓度
更容易维护多期课程、多版本教材

面向技术团队与企业

可私有化部署，便于集成与二次开发

基于 FastAPI + Vue 3 架构，代码结构清晰、易于扩展
支持配置 GeekAI 或任意兼容 Gemini API 协议的上游服务
存储在本地 SQLite + 文件系统，适合内网/私有部署场景

核心功能亮点

AI 驱动的两阶段生成流程

GeekAI-PPT 的生成过程分为两个阶段：

规划阶段（逻辑模型）
- 根据主题和可选的上传文档
- 生成完整的大纲结构与每页的视觉描述（prompt）
渲染阶段（图像模型）
- 针对每一页调用图像模型生成图片
- 保持前后风格统一，突出本页核心观点

这一设计确保了 PPT 先有结构再有画面，逻辑和视觉各司其职。

文档智能解析

支持上传 PDF / DOCX / TXT / MD 等格式文件
自动提取正文内容（支持较长上下文），供规划阶段使用
适合「已有方案文档 → 生成课件/路演稿」等场景

多版本幻灯片管理

每张幻灯片都支持 多版本历史
每次重新生成或修改，都会记录为一个新版本
前端可随时在不同版本之间切换，找到更合适的组合

视觉风格统一的科技感 PPT

默认采用「现代科技/互联网风格」的视觉设定
前后页保持色彩、构图、元素风格的连贯性
同一套 PPT 看起来像是统一设计师完成，而不是拼凑出来

灵活的编辑与操作能力

新建/插入/删除/重排幻灯片
基于当前图片进行「修改后重新生成」
支持软删除与回收站机制（演示文稿与幻灯片），避免误删

技术架构一览

GeekAI-PPT 的整体架构如下：

前端（web/）
- 基于 Vue 3 + Vite + Pinia + Element Plus + Tailwind CSS
- 提供演示文稿创建、编辑器画布、幻灯片缩略图、版本选择等交互
后端（backend/）
- 基于 FastAPI + SQLAlchemy
- 负责演示文稿/幻灯片/版本的 CRUD、规划与生成接口、文件上传解析、API Key 管理等
模型调用
- 通过 GeekAI 或其他兼容 Gemini API 协议的服务调用逻辑模型和图像模型
- MODEL_LOGIC：负责规划大纲和内容结构
- MODEL_IMAGE：负责根据 prompt 生成幻灯片图片
存储（storage/）
- SQLite 数据库存储演示文稿、幻灯片及版本元数据
- 本地文件系统 storage/images/{session_id}/ 存储生成的图片

更详细的架构与数据流说明可参考系统架构说明

。

快速开始

如果你想本地快速体验 GeekAI-PPT，按下面路径即可：

准备环境
- 安装 Python 3.9+ 与 Node.js 18+
- 在 GeekAI 或其他兼容 Gemini API 协议的服务中获取可用 API Key
克隆项目并启动后端
- 参考仓库根目录的 README.md，完成依赖安装与 backend/.env 配置
启动前端并访问应用
- 在浏览器中打开前端地址（默认 http://localhost:3000）
体验一次完整生成流程
- 创建一个新的演示文稿，输入主题
- （可选）上传一份现成的方案/讲义文档
- 点击「规划」查看自动生成的大纲
- 逐页或批量生成幻灯片，并尝试切换不同版本

详细的安装与部署说明，请查看：安装与部署
详细的使用操作说明，请查看：使用指南

页面预览（示意）

以下为典型页面形态的文字说明，实际文档站可配合截图展示：

首页/作品列表：展示已有演示文稿，可新建/删除/恢复
创建页：输入主题、选择语言与场景，可上传参考文档
规划页/大纲视图：展示 AI 生成的大纲结构，可手动微调
编辑器页：左侧缩略图，右侧大图预览，下方版本切换
生成历史/版本面板：展示当前幻灯片各个生成版本的缩略图

常见问题（FAQ）

GeekAI-PPT 必须使用 GeekAI 作为上游服务吗？

不必须。项目默认推荐使用 GeekAI 提供的 Gemini 模型中转服务，但只要上游服务 协议兼容 Gemini API，即可通过修改 BASE_URL、MODEL_LOGIC、MODEL_IMAGE 等配置接入其他服务。

生成速度和质量与什么有关？

主要与以下因素相关：

所选模型的性能与并发能力
你的网络环境与上游服务的延迟
每次生成的页数（一次性批量生成会耗时更久）

建议在体验阶段从较少页数开始，逐步增加规模。

图片和数据存储在哪里？是否支持私有化部署？

元数据（演示文稿、幻灯片、版本）默认存储在本地 SQLite 数据库
生成的图片默认存储在 backend/storage/images/{session_id}/ 目录
整个系统可以在你自己的服务器或内网环境中部署，不依赖第三方托管

能否调整生成出来的 PPT 风格？

可以。你可以通过：

修改后端配置或代码中的默认风格 prompt
在产品未来版本中（如已支持）通过前端 UI 选择不同的风格模版

更细粒度的 prompt 与风格调整方式，可参考仓库内的 [docs/system_prompt.md] 与后端相关代码。

是否适合在教学场景中使用？

适合。GeekAI-PPT 提供完整的前后端代码与清晰的数据流，非常适合作为：

「AI + 应用开发」课程中的示例项目
「从需求到 PPT」自动化流程的教学案例

你可以结合 [docs/development-guide.md] 文档，在课堂上演示一次从配置到生成的完整流程。

相关阅读