任务中心
任务中心用于查看后台任务的排队、运行、失败、完成和恢复状态。长时间 AI 任务不一定会在当前页面完成,任务中心可以帮助你确认真实进度。

什么时候打开
- 生成、拆书、知识库索引或自动导演任务运行时间较长。
- 页面提示任务失败、等待恢复或没有响应。
- 想查看任务是否仍在后台执行。
- 需要取消、重试或回到关联入口。
遇到“好像没反应”时,先看任务中心。很多长任务会继续运行,不一定是失败。
任务状态怎么看
常见状态可以这样理解:
- 排队:任务已创建,等待执行资源。
- 运行中:后台正在调用模型、处理资料或写入结果。
- 完成:任务结果已保存,可以回到相关模块查看。
- 失败:执行过程中出现错误,需要阅读失败原因。
- 等待恢复:任务链需要你确认下一步或从恢复入口继续。
- 取消:任务被用户或系统停止。
如果状态没有及时刷新,可以先刷新页面,再查看关联模块。
失败诊断
失败后先看三类信息:
- 任务类型:开书、章节、拆书、知识库还是图片生成。
- 错误来源:模型、网络、数据、结构化输出还是运行时异常。
- 可用结果:是否生成了正文、分析结果或部分资产。
处理建议:
- 模型或网络临时错误:重试。
- 结构化输出失败:换更稳定模型或调整模型路由。
- 缺少基础数据:回到小说页补信息。
- 已有可用正文但审核不完美:记录质量债务,继续后续章节。
- 明确要求重新规划:回到导演跟进处理。
重试策略
重试前先确认任务没有仍在运行。对同一个阶段重复触发多次,可能造成状态难以判断。
推荐策略:
- 临时供应商错误:可直接重试。
- 连续格式错误:换模型后重试。
- 章节质量问题:先看是否能局部修复。
- 知识库索引失败:确认 Qdrant 和文件状态后重试。
- 自动导演停住:先看导演跟进,不要只在任务中心反复重试。
和创作主链的关系
任务中心不决定一本书下一步写什么,它负责呈现事实状态。下一步创作动作通常在小说页、创作中枢或导演跟进完成。
你可以按这个顺序排查:
- 任务中心确认任务状态。
- 导演跟进理解链路位置。
- 小说页或创作中枢继续执行。
使用建议
养成两个习惯:
- 发起长任务后,遇到等待先看任务中心。
- 失败后先读错误信息,再决定重试、恢复或重新规划。
任务中心能减少重复点击和盲目重跑,是排查长链路问题的第一入口。
DirectorRunCommand 队列模型
自动导演的后台动作会写入 DirectorRunCommand 队列,再由 DirectorWorker 执行。
| 状态 | 含义 | 用户看到什么 |
|---|---|---|
queued | 命令已入队,等待 worker 租约 | 任务排队或等待执行。 |
leased | worker 已领取命令,还没正式运行 | 短暂状态,通常很快进入运行。 |
running | worker 正在执行命令并续租 | 任务运行中。 |
succeeded | 命令完成 | 任务结果可查看。 |
failed | 命令失败 | 任务中心显示错误。 |
stale | worker 租约过期,需恢复 | 等待自动恢复或手动恢复。 |
cancelled | 命令取消 | 用户或系统取消。 |
常见命令类型包括 generate_candidates、confirm_candidate、continue、resume_from_checkpoint、retry、takeover、approve_gate 和 repair_chapter_titles。
DirectorWorker 如何执行
DirectorWorker 会:
- 从队列领取最早可运行命令。
- 给命令写入租约和 worker owner。
- 获取 ResourceGate。
- 标记 running。
- 执行对应命令。
- 成功、失败、取消或释放资源。
- 定期续租,避免长任务被误判为 stale。
这意味着你可以离开当前页面,后台仍会继续运行;但也意味着重复点击同一个入口可能排出多个命令。
ResourceGate 并发上限
ResourceGate 按“小说 + 资源类型”限流。默认资源类型包括:
| resource class | 默认槽位 | 典型任务 |
|---|---|---|
| planner | 2 | 候选、规划、卷战略、拆章 |
| writer | 2 | 正文生成 |
| repair | 2 | 章节修复、质量修复 |
| state_resolution | 2 | 状态提交、角色资源同步 |
另外,节奏板、章节清单、章节细化、章节同步属于高内存自动导演阶段。同一本书同范围通常只允许一个高内存任务,避免批量拆章互相覆盖。
[!WARN] 不要重复启动同范围任务
如果提示已有自动导演任务正在处理同一范围,先打开任务中心查看进度。重复启动可能让你难以判断哪个任务写入了最终结果。
stale 任务恢复
stale 表示 worker 租约过期。常见原因:
- 应用或服务重启。
- 后台进程退出。
- 长任务运行时间超过租约且续租失败。
- 本机休眠或网络中断。
系统会区分自动恢复和手动恢复:
| 情况 | 行为 |
|---|---|
全书自动执行、continue、resume_from_checkpoint 且尝试次数未超限 | 自动回到 queued,继续执行。 |
| 尝试次数超限或命令不适合自动恢复 | 标记 stale,任务进入等待恢复。 |
| 用户点击恢复 | 从最近 checkpoint 或命令 payload 继续。 |
重试、恢复、重启区别
| 操作 | 适合情况 | 会不会改变产物 |
|---|---|---|
| 重试 | 同一命令临时失败 | 通常只重跑失败命令。 |
| 恢复 | stale、等待确认、checkpoint | 从已保存进度继续。 |
| 重新生成 | 当前阶段结果不满意 | 可能覆盖目标阶段产物。 |
| 重规划 | 上游目标改变或质量要求明确 | 会影响后续阶段。 |
任务中心里的“重试”解决的是后台命令失败;导演跟进里的“继续/恢复”解决的是主链停在哪个 checkpoint。
与导演跟进协作
推荐排查顺序:
- 任务中心确认命令是否还在运行。
- 如果是 waiting approval,进入导演跟进处理 checkpoint。
- 如果是 failed,先读错误信息,再决定重试还是回上游阶段。
- 如果是 stale,优先使用恢复入口。
- 如果章节已有正文但状态同步失败,优先重试同步,不要直接重写正文。
任务中心给出事实;导演跟进给出下一步。