2026西湖龙井茶官网DTC发售:茶农直供,政府溯源防伪到农户家
大多数人工智能幻灯片工具让生成式预训练变换模型决定一切——布局、字体层级、章节结构。每次生成都是一次新的设计抽奖。我们采取了相反的方法:8 个硬编码的垂直领域预设,生成式预训练变换模型可以填充内容,但不能重新设计。
本文探讨为什么在我们的幻灯片生成流程中,约束胜过了创造力。
让大型语言模型设计布局的问题
早期原型:纯生成式预训练变换模型布局生成。模型决定:
- 每张幻灯片的章节数量
- 标题与副标题的层级关系
- 项目符号与段落结构
- 颜色强调
- 素材放置
结果:每套幻灯片看起来都各不相同。“各不相同”听起来不错,直到用户开始告诉我们:
- “为什么第二张幻灯片是五点列表,而第三张是三点项目符号层级?”
- “第七张幻灯片的字体巨大,但第八张却很小。”
- “看起来像是人工智能生成的。”
第三个抱怨是致命的。当差异显而易见时,用户通常会认为“这个人工智能不知道自己在做什么”。
解决方案:预先选择布局,仅让大型语言模型填充内容
我们硬编码了 8 个针对特定垂直领域的预设:
- 职业:痛点 → 框架 → 行动章节的层级结构
- 金融:以图表为主,辅以项目符号说明
- 阅读:书籍封面 + 章节引言 + 三点收获模板
- 美容:以图片为主导,配有叠加字幕
- 健康:数据优先,附带引用脚注
- 文化:时间轴风格,配以强调性图像
- 旅行:地图 + 照片网格 + 行程分解
- 知识:三栏对比 + “关键洞察”重点标注
每个预设都是一个确定性的布局系统。生成式预训练变换模型根据输入主题选择合适的预设,然后填充插槽内容。结构性差异随之消失。
为什么首选垂直领域,而非通用领域
我们考虑过显而易见的替代方案:5 个通用模板(“简洁”、“极简”、“活泼”)。它在用户测试中失败了,因为:
- “简洁”并不能告诉你内容应该放在哪里
- 同样的“极简”模板应用于金融幻灯片和旅行幻灯片时,看起来都很平庸
针对特定垂直领域的模板编码了领域假设:
- 金融幻灯片的第一页应该是图表
- 阅读幻灯片的第一页应该是书籍封面
- 旅行幻灯片的最后一页应该是地图
这些假设随着垂直领域的选择自动生效——无需教导大型语言模型每种体裁期望什么。
我们失去的东西
我们失去了:
- 针对我们未预见到的垂直领域(商业路演、科学论文等)的灵活性
- 在幻灯片集中间尝试新颖布局的能力
对于这两点,我们的回答是“当有明确需求时我们会添加预设”,而不是“让大型语言模型自行解决”。后者正是 v0 版本失败的原因。
我会不同的做法
每个预设只有一种“风格”——整个幻灯片集应用相同的布局系统。事后看来,风格应该在预设内根据幻灯片的位置(封面 vs 正文 vs 行动号召)而变化,而不仅仅是根据垂直领域。我们应该发布具有幻灯片集内部变化的“预设家族”,而不是将每个预设视为单一模板。
试一试
如果你想看看 8 个垂直领域预设架构在实际中是什么样子,AnySlide 已经发布了此架构的 v1 版本。免费开始使用(注册时赠送 60 积分,每日重置增加 10 积分,无需信用卡)。
我很想听听那些采取相反策略(完全依赖大型语言模型创造力)的人的意见——这是否得到了回报
免责声明:本文内容来自互联网,该文观点不代表本站观点。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请到页面底部单击反馈,一经查实,本站将立刻删除。