项目定位收束 · 从“多场景工具”到“格式准确引擎”
AI 文档格式校准 App:上传原文和格式要求,自动改成可直接提交的成品。
本项目面向学生、科研人员、职场用户和内容创作者,核心解决“内容已有,但格式要求复杂、手动调整耗时、提交前不确定是否合规”的刚需。产品不以泛写作为卖点,而以格式要求解析、规则执行、自动校验修复为护城河。
一、项目定义
一句话定位要足够清楚,用户一眼知道它不是普通 AI 写作,而是帮自己把文档改到能交。
核心产品定义
这是一款 AI 文档格式校准 App。用户上传原始文档与目标格式要求后,系统自动解析规范、识别文本结构,并通过规则引擎完成字体、字号、行距、标题层级、图表编号、引用格式、页眉页脚等调整。生成后系统会逐项校验并自动修复,最终输出可直接提交、发布或发送的 Word/PDF 文档。
非核心边界
产品不是泛写作助手,不主打“覆盖很多场景”。默认模式不改正文内容,不主动扩写观点,不替用户编造事实。真正卖点是:识别复杂格式要求、程序化执行格式、用检查报告证明结果可靠。
二、目标用户与痛点
付费动机来自可衡量的省时、少错和可提交,而不是模板数量。
论文与投稿格式
毕业论文、课程作业、期刊投稿、参考文献格式、脚注尾注、图表编号、匿名投稿要求都很耗时,且结果是否合规难以确认。
报告与会议纪要
需要把散乱内容整理成公司模板、领导偏好的汇报格式或客户可读文档。核心价值是少返工、能直接发。
平台发布格式
公众号、小红书、朋友圈、微博等平台格式差异大。用户需要一篇内容快速适配多个发布样式,但这一阶段不作为准确性主战场。
| 用户问题 | 现有方案缺陷 | 本产品解决方式 |
|---|---|---|
| 老师或期刊给的格式要求很复杂 | 用户需要逐条读要求、手动设置 Word | AI 解析成结构化规则,程序自动执行 |
| 怕 AI 乱改正文内容 | 写作工具默认会改写表达 | 默认“只改格式,不动内容”,内容保真可校验 |
| 不知道生成结果是否合规 | 只能肉眼检查,容易漏项 | 输出格式匹配度和逐项检查报告 |
| 每个老师、期刊、公司模板都不同 | 固定模板覆盖有限 | 允许上传自定义格式要求并保存为个人模板 |
三、核心产品流程
前台极简,后台复杂。用户只做三步:上传原文、上传要求、下载成品。
输入
原文、目标格式、可选模式。系统自动判断缺失信息,只问会影响最终格式的关键问题。
处理
拆解规则、识别结构、套用样式、自动编号、转换引用、生成目录、校验并回炉修复。
输出
Word、PDF、Markdown、公众号格式、小红书格式、邮件正文、PPT 大纲、表格文件。
四、核心功能设计
第一版不追求场景多,而要做出几个“准到离谱”的能力。
| 功能 | 用户价值 | 产品表现 | 优先级 |
|---|---|---|---|
| 上传格式要求,自动生成规则 | 不需要用户理解字号、行距、页边距等细节 | 把投稿须知、模板、截图、链接拆成结构要求、字体要求、段落要求、引用要求、图表要求 | P0 |
| 只改格式,不改内容 | 解决用户最担心的“AI 乱写” | 提供只改格式、格式+轻度润色、按目标场景重组三种模式,默认选只改格式 | P0 |
| 格式匹配度评分 | 让用户知道结果是否可靠 | 显示匹配度、扣分项、通过项、需要确认项 | P0 |
| 自动修复 | 减少用户手动返工 | 对摘要字数、关键词数量、标题层级、参考文献、图表编号等问题一键修复 | P0 |
| 目标模板保存 | 形成复用和粘性 | 保存“某老师课程论文模板”“某期刊投稿模板”“公司项目方案模板” | P0 |
五、格式准确率系统
准确不是一句口号,而要变成看得见的信任系统。
检查报告样例
| 检查项 | 目标要求 | 当前结果 | 状态 |
|---|---|---|---|
| 标题字号 | 三号黑体居中 | 三号黑体居中 | 通过 |
| 正文字号 | 小四宋体 | 小四宋体 | 通过 |
| 行距 | 1.5 倍 | 1.5 倍 | 通过 |
| 摘要字数 | 200-300 字 | 248 字 | 通过 |
| 参考文献 | GB/T 7714 | 已转换 | 通过 |
| 基金项目 | 需项目编号 | 缺少编号 | 待确认 |
扣分与修复逻辑
可自动修复:字体、字号、行距、缩进、目录、页码、图表连续编号、标题层级、摘要字数、关键词数量、参考文献样式。
需用户确认:作者单位、基金编号、通讯作者、项目编号、合同主体、真实日期、涉及事实准确性的新增信息。
评分方式:格式匹配率 = 已通过规则数 / 目标规则总数。系统展示未通过项、影响程度和建议修复动作。
六、技术架构
大模型负责理解,规则引擎负责执行,校验系统负责验收。
文档解析
解析 Word/PDF/图片中的文字、段落、表格、图片、脚注、页码、批注和目录。
规则抽取
把“正文小四宋体,一级标题黑体四号”转成机器可执行规则。
导出验证
输出后重新读取文件,确保打开正常、格式可提交、检查报告可追溯。
七、MVP 范围与路线图
第一阶段主打论文和正式文档格式,因为最能体现准确性和付费价值。
第 1 阶段:P0 闭环
上传 Word、粘贴文本、上传格式要求、规则解析、只改格式、生成 Word、检查报告、一键修复、保存模板。
第 2 阶段:准确增强
PDF 要求解析、截图 OCR、参考文献转换、图表编号、目录生成、页码页眉页脚、修改前后对比。
第 3 阶段:场景扩展
职场报告、会议纪要、公众号、小红书、简历、公文、合同、多平台内容适配。
第 4 阶段:生态插件
Word 插件、飞书插件、浏览器插件、公众号编辑器插件、团队模板库和批量处理。
| 阶段 | 主目标 | 关键验收指标 |
|---|---|---|
| MVP | 证明上传原文+上传要求可以生成合规文档 | 普通论文/作业格式匹配率达到 90% 以上 |
| Beta | 提升复杂文档准确性 | 参考文献、图表、页码、目录等高频难点可自动修复 |
| 商业化 | 形成模板复用与付费转化 | 80% 普通文档导出后无需手动修改 |
八、数据集与评估指标
护城河来自格式规则数据集、错误案例和自动校验体系。
格式规则数据集
格式要求原文结构化规则原始文档样本标准成品文档错误案例
数据集不只收模板,还要收“要求原文 → 结构化规则 → 原始文档 → 标准成品 → 校验规则 → 错误案例”的完整链路。
五个准确性指标
格式匹配率:目标规则中正确执行的比例。
人工修改次数:用户导出后还要改几处。
一次通过率:生成一次后通过校验的比例。
内容保真率:只改格式时正文是否被误改。
导出可用率:Word/PDF 是否能直接打开和提交。
九、首页与产品界面方案
首页不做复杂功能展示,只强化“我不用懂格式,我只要把要求丢进去”。
模式选择
只改格式,不改内容;格式 + 轻度润色;按目标场景重组。默认选最安全的“只改格式”。
三栏工作台
左侧原文预览,中间格式要求解析,右侧成品预览和检查报告。
关键交互
系统主动提示缺失信息,但只问会影响最终格式的关键问题,其他问题默认处理。
十、商业化与传播话术
传播不要强调“支持很多场景”,而要强调“准确改到能交”。
用户付费理由
| 理由 | 说明 |
|---|---|
| 省时间 | 原来调格式 1-3 小时,现在 1 分钟完成。 |
| 不乱改内容 | 默认只改格式,用户对正文安全感更强。 |
| 读懂复杂要求 | 老师、期刊、公司给什么要求都能拆解。 |
| 有检查报告 | 不是看起来差不多,而是逐项校验通过。 |
| 可直接导出 | 不是给一段文本,而是交付可用 Word/PDF。 |
广告语方向
别人帮你生成文本,我们帮你改到能交。
上传格式要求,AI 自动改到符合。
不再手动调字号、行距、标题和参考文献。
不是看起来差不多,而是逐项校验通过。
文档格式一次过。
十一、结论
这个产品真正锋利的地方,不是模板多,而是用户给任何原文和格式要求,系统能准确改到符合。
MVP 建议以论文/课程作业/投稿格式为主战场,兼容职场报告和社媒发布作为次级入口。先把“准确”“不用手调”“可直接提交”做成用户能感知、能验证、愿意付费的闭环,再向更多文档场景扩张。