这是一个或许对你有用的社群 一对一交流/面试小册/简历优化/求职解惑欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料《项目实战视频》从书中学往事上“练”《互联网高频面试题》面朝简历学习春暖花开《架构 x 系统设计》摧枯拉朽掌控面试高频场景题《精进 Java 学习指南》系统学习互联网主流技术栈《必读 Java 源码专栏》知其然知其所以然这是一个或许对你有用的开源项目国产Star破10w的开源项目前端包括管理后台、微信小程序后端支持单体、微服务架构RBAC权限、数据权限、SaaS多租户、商城、支付、工作流、大屏报表、ERP、CRM、AI大模型、IoT物联网等功能多模块https://gitee.com/zhijiantianya/ruoyi-vue-pro微服务https://gitee.com/zhijiantianya/yudao-cloud视频教程https://doc.iocoder.cn【国内首批】支持 JDK17/21SpringBoot3、JDK8/11Spring Boot2双版本做 PPT 这件事真的很花时间banana-slides 是什么主要功能和 notebooklm 比一比技术架构怎么部署还在开发中的功能小结上周我在 GitHub 上看到一个项目叫 banana-slides短短几个月收获了大量 Star。我去翻了一下发现它解决的其实是一个很常见的问题做 PPT 太麻烦。这篇文章就来聊聊这个项目说说它的思路、功能和上手方式。做 PPT 这件事真的很花时间不管是做汇报、写方案还是交学校作业PPT 都是逃不开的东西。内容想好了但排版要花大量时间。字体、对齐、颜色、图文布局每一步都要手动调整。现在有不少 AI 生成 PPT 的工具确实能省事一些但用下来总有几个问题让人不太满意模板是固定的风格没法怎么调。生成完了也不太好改多轮修改很麻烦。出来的 PPT 大多看着差不多没什么个性。图片质量也参差不齐有时候和内容根本对不上。简单说这类工具做出来的东西快是快但很难又快又好看。bana-slides 的作者也有同样的感受于是他决定自己做一个。基于 Spring Boot MyBatis Plus Vue Element 实现的后台管理系统 用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/ruoyi-vue-pro视频教程https://doc.iocoder.cn/video/banana-slides 是什么bana-slides完整名字 banana-slides是一个基于 GoogleGemini nano banana pro模型的 PPT 生成应用。它完全开源代码放在 GitHub 上支持自部署。作者在 README 里解释了为什么要做这个工具。他试过用 Gemini nano banana pro也就是项目名字里的 来直接生成 PPT 页面发现效果出乎意料地好图文布局自然、风格统一、文字精确。于是他就以此为核心搭了这套 PPT 生成系统。和其他 AI PPT 工具最不一样的地方在于这个项目把图片生成能力直接用在了每一张幻灯片上而不是先生成内容再套模板。每一页都是一张图风格天然统一。基于 Spring Cloud Alibaba Gateway Nacos RocketMQ Vue Element 实现的后台管理系统 用户小程序支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能项目地址https://github.com/YunaiV/yudao-cloud视频教程https://doc.iocoder.cn/video/主要功能三种起步方式你可以用三种方式来开始做 PPT1.一句话说个主题AI 自动出大纲和每页内容2.大纲先写大纲再逐步填充页面内容3.页面描述直接写每页要放什么控制粒度更细三种方式都支持自然语言修改。比如你想改某页可以直接说把第三页换成案例分析AI 会根据你的指令重新生成。素材上传与智能解析你可以上传文件系统会自动读取内容。支持 PDF、Word.docx、Markdown、纯文本这几种格式。上传后系统会提取文件里的关键信息、图片链接和图表说明作为生成 PPT 的参考材料。另外你也可以上传一张参考图片告诉系统你想要什么风格。比如上传一个你喜欢的 PPT 截图AI 就会按照这个风格来出页面。口头修改指定区域这是这个项目比较有意思的地方。生成好页面之后如果你对某个区域不满意可以框选那个部分然后直接用文字描述要怎么改。比如这里换成饼图或者文字改大一点。整个修改流程不需要点复杂的菜单直接说话就行。作者把这种交互方式叫做Vibe 式编辑。导出为 PPTX 和 PDF生成好之后可以直接导出为标准的 PPTX 文件或 PDF 文件。默认是 16:9 的比例不需要再手动调整尺寸。值得一提的是项目还在做一个可自由编辑的 PPTX 导出功能目前是 Beta 阶段。这个功能会把生成的每张幻灯片图片里的文字和布局还原成可以在 PowerPoint 里直接编辑的格式字体大小、颜色、加粗等样式也会尽量保留。和 notebooklm 比一比Google 的 notebooklm 也有幻灯片生成功能下面是两个工具的简单对比功能notebooklmbanana-slides页数上限15 页无限制二次编辑提示词修改框选编辑 口头编辑素材添加生成后不能再加生成后可以继续加导出格式PDF、不可编辑的 PPTXPDF、可编辑或图片版 PPTX水印免费版有水印无水印元素可以自由增减两者定位不完全一样notebooklm 更侧重于知识整理banana-slides 则专门为 PPT 生成设计。如果你只是需要从一个长文档快速生成几页幻灯片notebooklm 够用。但如果你要做有风格感的 PPT想要更多控制权banana-slides 更合适。技术架构项目分前端和后端两部分。前端用 React 18 TypeScript 写的构建工具是 Vite样式用 Tailwind CSS状态管理用 Zustand。整体来说是比较标准的现代前端技术栈。后端是 Python FlaskAI 调用走的是 Google Gemini APIPPT 文件处理用 python-pptx图片处理用 Pillow。数据存在 SQLite 里页面生成是并发执行的用了 ThreadPoolExecutor 来加速。代码仓库结构比较清晰前端在frontend/目录后端在backend/目录各自独立。怎么部署有三种部署方式按照难度从低到高排列方式一一键部署最简单项目支持通过雨云平台一键部署不需要自己装 Docker 或配置服务器。新用户有 15 天免费试用。进去之后直接创建应用跟着引导操作就行。方式二Docker Compose如果你有服务器用 Docker 部署是最推荐的方式。官方提供了预构建镜像直接拉下来就能用docker compose -f docker-compose.prod.yml up -d主要步骤是克隆仓库、创建.env文件填写 API Key然后执行上面的命令。前端跑在 3000 端口后端在 5000 端口。配置 API Key 推荐用 AIHubMix 这个平台项目本身是以 Gemini 接口格式为标准的用这个平台可以减少一些迁移成本。需要注意Gemini nano banana pro 模型的 API 调用费用比较高在正式大量使用之前最好先估算一下成本。方式三源码部署如果你想改代码或者做二次开发可以从源码部署。环境要求是 Python 3.10 以上、Node.js 16 以上还有 uv 这个 Python 包管理器。后端启动命令cd backend uv run alembic upgrade head uv run python app.py前端另起一个终端进入frontend/目录安装依赖后启动即可。还在开发中的功能看了一下项目的开发计划还有几个功能在做更完整的可编辑 PPTX 导出支持多层次抠图网络搜索能力生成 PPT 时可以联网查资料Agent 模式在线播放功能页面切换动画目前版本已经有不少可用的功能并且更新频率不低。仓库的 Star 增长曲线也比较稳。小结bana-slides 这个项目的核心思路是直接用图片生成模型来做每一张幻灯片不套模板风格自然统一。这个方向和传统 AI PPT 工具差别还挺大的。当然也有一些限制要提一下Gemini nano banana pro 模型的 API 费用不低免费额度用完就需要付费了。另外可编辑 PPTX 导出功能现在还在迭代效果不完全稳定。如果你愿意自己折腾一下这个工具是值得试试的。代码是开源的部署方式也挺多文档也有中英文版本。GitHub 地址https://github.com/Anionex/banana-slides在线 Demohttps://bananaslides.online/欢迎加入我的知识星球全面提升技术能力。 加入方式“长按”或“扫描”下方二维码噢星球的内容包括项目实战、面试招聘、源码解析、学习路线。文章有帮助的话在看转发吧。 谢谢支持哟 (*^__^*