功能定位：为什么需要“相似问题智能合并”

2026 年 2 月的豆包 v5.7.2 在知识库模块上线了「相似问题智能合并」（下文简称“智能合并”）。它的使命很简单：当不同用户用千奇百怪的话术追问同一意图时，系统只保留一条“主问题”，其余全部归并，答案也只维护一份。经验性观察显示，日更 200 条 FAQ 的频道开启后，前端展示量下降 15%–25%，搜索耗时缩短约两成，答案一致性却肉眼可见地提升。

与「去重机器人」或「人工打标签」相比，智能合并由豆包内置语义模型驱动，无需额外 Bot，也不依赖关键词完全匹配，因此对口语化、错别字、语序颠倒更鲁棒。但它并非「重复内容清理」：清理面向“完全相同文本”，合并面向“语义等价文本”，两者互补，不可互相替代。

功能定位：为什么需要“相似问题智能合并”

版本演进：功能入口的两次迁移

智能合并最早于 2025Q4 灰度，藏在「实验室·Beta」；2026 年 2 月转正后，入口被直接提到「知识库设置」一级菜单，并新增「例外规则」子面板。若你曾在灰度阶段开过旧开关，升级后系统会自动映射到新入口，但旧「相似度阈值」会被重置为默认 0.78，记得手动核对一次，避免误合。

开启前的准入检查清单

知识库权限≥「管理员」；仅「可编辑」角色无法保存合并策略。
知识库条目≥100 条且近 30 日新增≥10 条，否则系统判断“样本不足”，按钮呈灰色。
已开通「长文本语义索引」（默认开启，若曾手动关闭需先恢复）。

不满足以上条件时，界面会给出对应提示，无需尝试绕过；经验性观察，强行通过接口调用会返回 403。

最短操作路径（分平台）

移动端（Android / iOS）

进入目标知识库 → 右上角「···」→「知识库设置」→「智能管理」。
打开「相似问题智能合并」总开关，界面展开「灵敏度」与「例外规则」。
灵敏度保持默认「中」即可；若频道口语化提问多，可调至「高」。
点击「保存」后，系统提示「将在后台分批完成，预计数十分钟内生效」。

桌面端（Win / Mac）

左侧栏选中知识库 → 顶部「设置」→「智能管理」→ 同第 2 步。
桌面端额外提供「模拟合并」按钮：可输入两条问题，实时查看相似度分值，用于调试阈值。

例外规则：哪些场景应排除合并

虽然系统默认过滤「含订单号、手机号、纯数字 ID」的问题，但以下情况建议手动加入例外：

政策类问答：如「2026 年 3 月北京限行规定」「2026 年 4 月北京限行规定」，语义相近但答案随月份变化。
含地域限定：「上海门店营业时间」vs「成都门店营业时间」，句式相同但答案不同。

例外添加方式：在「例外规则」面板点击「新建正则」，输入\d+月.*规定|.*门店营业时间，保存即可。正则匹配到的问题将强制保留独立答案。

验证与观测：确认合并是否生效

系统后台执行完毕后，会在「知识库设置-智能管理-运行日志」生成一条 Batch ID。点击可下载 CSV，包含「主问题 ID、被合并问题 ID、相似度分值」。抽样打开几个被合并问题，应自动跳转到主问题，且顶部出现灰色提示「已重定向至相似问题」。若仍显示独立页面，说明合并未成功，常见原因是例外规则冲突或分值低于阈值。

回退方案：如何一键撤销

在「运行日志」列表右侧有「撤销」按钮，仅保留 30 日。撤销后，被合并问题恢复独立，答案回到合并前快照；若主问题在此期间被人工更新，则不会自动同步给已恢复的问题，需要手动比对。注意：撤销操作不可逆，30 日后日志自动清理，无法再回滚。

回退方案：如何一键撤销

副作用与缓解

1. 搜索索引延迟：合并后，主问题权重提升，但被合并问题的关键词会暂时丢失。经验性观察，前端搜索建议约 2 小时后恢复完整覆盖。缓解：可在「高级-重建索引」手动触发，重建耗时与条目数正相关，测试库 5k 条约 3 分钟完成。

2. 统计口径变化：运营日报中「问题总数」会下降，若团队以绝对数量考核，需提前同步口径，避免误判为「内容产出减少」。

与第三方 Bot 协同的最小权限原则

部分团队使用「第三方归档机器人」定时把知识库同步到外部飞书多维表。合并后，机器人仍按旧 ID 拉取会拿到 301 重定向。推荐给机器人分配「只读-重定向跟随」权限，并在请求头加Follow: true，确保拿到主问题内容，而非 404。

不适用场景清单

场景特征	原因
知识库条目<100	样本不足，模型误杀率高
高频实时变更大促问答	答案日级别变化，合并后回滚成本高
多语言混排>30%	当前语义模型以中文为主，中英混排相似度计算偏差大

最佳实践速查表

先开「模拟合并」调阈值，再开正式开关。
合并后 24h 内查看运行日志，抽样 10 条确认重定向。
每周导出 CSV，检查分值<0.75 的合并，人工复核。
任何政策、价格、地域相关问答，提前写正则例外。
月度统计前，先与团队同步「问题总数」口径变化。

FAQ（FAQPage Schema）

开启后多久生效？

后台分批处理，通常数十分钟内完成，条目过万可能延长至 2 小时。

能否只对单目录开启？

目前仅支持库级开关，目录级灰度在「经验性观察」阶段，官方尚未公开。

合并错误如何救济？

30 日内可在「运行日志」一键撤销，逾期需手动拆分并复制答案。

收尾：下一步行动建议

如果你管理的知识库已满足准入条件，不妨先使用桌面端「模拟合并」功能，把最近 20 条高频问答跑一遍分值，确认无误后再打开正式开关。开启后记得 24h 内核查日志，并在团队群同步「统计口径」变化。智能合并不是一劳永逸，而是把重复劳动交给模型，把例外和边界留给人——定期复核、动态调整，才能让知识库越用越薄，却越答越准。

豆包知识库如何开启相似问题智能合并功能？

功能定位：为什么需要“相似问题智能合并”

版本演进：功能入口的两次迁移

开启前的准入检查清单

最短操作路径（分平台）

移动端（Android / iOS）

桌面端（Win / Mac）

例外规则：哪些场景应排除合并

验证与观测：确认合并是否生效

回退方案：如何一键撤销

副作用与缓解

与第三方 Bot 协同的最小权限原则

不适用场景清单

最佳实践速查表

FAQ（FAQPage Schema）

开启后多久生效？

能否只对单目录开启？

合并错误如何救济？

收尾：下一步行动建议

相关标签