Skip to content

OpenAI 辅助识别

OpenAI 辅助识别用于处理常规名称解析难以判断的资源名。它不会替代 NanShare 的基础解析逻辑,而是在复杂别名、混合标题、路径噪声较多或缺少 TMDB ID 时,辅助提取名称、年份、季号和集号。

入口位置

在 NanShare 后台进入:

text
文件整理 -> OpenAI 辅助识别

相关开关也会出现在整理配置、订阅追更、缺集补全、大包筛选入库等流程里。不同页面的开关含义略有区别,但都依赖这里保存的 OpenAI 辅助识别配置。

配置项

配置说明
启用 OpenAI 辅助识别总开关,关闭后不会调用辅助识别
使用代理使用 NanShare 全局代理配置访问 API
API URLOpenAI 或兼容 API 地址
API Key接口密钥,文档示例不要填写真实值
模型模型名称,按你使用的服务商填写
辅助识别提示词控制返回格式和识别范围
恢复默认提示词将提示词恢复为 NanShare 内置默认模板
测试连接用当前配置请求一次接口,确认是否可用

示例配置:

yaml
enabled: true
proxy: false
api_url: "https://api.example.com"
api_key: "你的_API_KEY"
model: "gpt-compatible-model"

会识别哪些字段

辅助识别结果主要用于补充以下字段:

字段用途
name / title媒体名称
year年份
season季号
episode集号

这些字段会继续交给 NanShare 的 TMDB、豆瓣、订阅匹配、整理模板等流程使用。辅助识别不是直接生成最终文件名,最终命名仍由整理模板和渲染后处理词决定。

适合启用的场景

场景建议
文件名包含大量发布信息开启辅助识别,帮助提取真实片名
动漫标题中混有中日英多语言可开启辅助识别,再配合自定义识别词修正季集
TG 频道资源标题不规范订阅或缺集补全时可作为兜底
大包筛选入库无法匹配 TMDB可启用强制 OpenAI 识别
文件名已经很规范不建议强制开启,常规解析速度更快

与整理配置的关系

整理监控中有“强制 OpenAI 识别”开关。开启后,该整理任务会优先让辅助识别参与名称判断。

常见组合:

text
普通电影下载目录:关闭强制 OpenAI 识别
动漫合集目录:开启自定义识别词,必要时开启强制 OpenAI 识别
TG 资源目录:开启辅助识别,并保留整理历史方便回查

与订阅追更的关系

订阅追更会先使用 NanShare 内置名称解析和筛选规则。当资源名复杂、无法获得可靠 TMDB 信息时,如果 OpenAI 辅助识别可用,NanShare 可以用它做兜底识别。

推荐做法:

text
电影订阅:优先使用片名、年份、分辨率、特效筛选
剧集订阅:同时关注季集进度和缺集追踪
疑难资源:开启辅助识别后观察订阅日志

与缺集补全的关系

Emby 缺集检测与补全会根据缺失季集去搜索资源。资源标题不规范时,辅助识别可以帮助判断候选资源是否属于目标剧集。

适合:

  • 频道标题包含别名。
  • 剧集文件名缺少年份。
  • 标题里季集格式不统一。
  • 搜索结果中混有合集、花絮、字幕包。

与大包筛选入库的关系

115 大包筛选入库会对大包内的文件做识别、筛选、转存或生成 STRM。若大包文件命名混乱,可以启用辅助识别提高匹配稳定性。

建议:

  • 先用少量文件测试识别效果。
  • 保留 TMDB ID 优先匹配。
  • 对明显固定的错误命名优先写自定义识别词。
  • 对一次性复杂资源再交给辅助识别。

提示词建议

提示词应要求模型只返回结构化 JSON,并聚焦媒体名称、年份、季、集。不要让提示词输出说明文字、推荐语或长段解释。

简化示例:

text
请从输入的影视文件名中识别媒体名称、年份、季号、集号。
只返回 JSON,不要返回额外文本。
无法确定的字段返回 null。

期望返回:

json
{
  "name": "庆余年",
  "year": 2019,
  "season": 2,
  "episode": 1
}

不建议:

text
帮我分析这个资源好不好看,并解释为什么。

示例

示例一:剧集标题混乱

原始名称:

text
[SomeGroup] Joy.of.Life.S02.第01集.2160p.WEB-DL.mkv

期望辅助识别:

json
{
  "name": "Joy of Life",
  "year": null,
  "season": 2,
  "episode": 1
}

后续可由 TMDB / 豆瓣匹配补全中文标题和年份。

示例二:中文季集

原始名称:

text
某剧 第二季 第十二集 HDR 1080p.mkv

期望辅助识别:

json
{
  "name": "某剧",
  "year": null,
  "season": 2,
  "episode": 12
}

示例三:电影别名

原始名称:

text
影片英文名.2024.IMAX.2160p.REMUX.mkv

期望辅助识别:

json
{
  "name": "影片英文名",
  "year": 2024,
  "season": null,
  "episode": null
}

缓存

NanShare 的整理配置中提供 OpenAI 辅助识别缓存和缓存时间。相同标题在缓存有效期内可复用识别结果,减少重复请求。

建议:

场景缓存建议
订阅追更频繁运行开启缓存
大包重复测试开启缓存并设置较长时间
调试提示词临时缩短缓存时间或关闭缓存

排错

问题检查
测试连接失败API URL、API Key、模型名、代理设置
返回内容无法解析提示词是否要求只返回 JSON
识别错季集文件名是否本身缺少季集,可配合自定义识别词
没有被调用总开关是否开启,相关流程是否启用强制或兜底辅助识别
调用频繁开启缓存,优先用识别词处理固定规则

使用建议

  • 能用自定义识别词稳定修正的,优先写识别词。
  • 能用 TMDB ID 明确指定的,优先使用 TMDB ID。
  • 辅助识别适合作为兜底,不建议对所有规范文件强制启用。
  • 调整提示词后先用测试连接和少量任务验证,再批量整理。

NanShare 文档站仅说明 NanShare 项目的部署、配置与使用。