OpenAI 辅助识别

OpenAI 辅助识别用于处理常规名称解析难以判断的资源名。它不会替代 NanShare 的基础解析逻辑，而是在复杂别名、混合标题、路径噪声较多或缺少 TMDB ID 时，辅助提取名称、年份、季号和集号。

入口位置

在 NanShare 后台进入：

text

文件整理 -> OpenAI 辅助识别

相关开关也会出现在整理配置、订阅追更、缺集补全、大包筛选入库等流程里。不同页面的开关含义略有区别，但都依赖这里保存的 OpenAI 辅助识别配置。

配置项

配置	说明
启用 OpenAI 辅助识别	总开关，关闭后不会调用辅助识别
使用代理	使用 NanShare 全局代理配置访问 API
API URL	OpenAI 或兼容 API 地址
API Key	接口密钥，文档示例不要填写真实值
模型	模型名称，按你使用的服务商填写
辅助识别提示词	控制返回格式和识别范围
恢复默认提示词	将提示词恢复为 NanShare 内置默认模板
测试连接	用当前配置请求一次接口，确认是否可用

示例配置：

yaml

enabled: true
proxy: false
api_url: "https://api.example.com"
api_key: "你的_API_KEY"
model: "gpt-compatible-model"

会识别哪些字段

辅助识别结果主要用于补充以下字段：

字段	用途
`name` / `title`	媒体名称
`year`	年份
`season`	季号
`episode`	集号

这些字段会继续交给 NanShare 的 TMDB、豆瓣、订阅匹配、整理模板等流程使用。辅助识别不是直接生成最终文件名，最终命名仍由整理模板和渲染后处理词决定。

适合启用的场景

场景	建议
文件名包含大量发布信息	开启辅助识别，帮助提取真实片名
动漫标题中混有中日英多语言	可开启辅助识别，再配合自定义识别词修正季集
TG 频道资源标题不规范	订阅或缺集补全时可作为兜底
大包筛选入库无法匹配 TMDB	可启用强制 OpenAI 识别
文件名已经很规范	不建议强制开启，常规解析速度更快

与整理配置的关系

整理监控中有“强制 OpenAI 识别”开关。开启后，该整理任务会优先让辅助识别参与名称判断。

常见组合：

text

普通电影下载目录：关闭强制 OpenAI 识别
动漫合集目录：开启自定义识别词，必要时开启强制 OpenAI 识别
TG 资源目录：开启辅助识别，并保留整理历史方便回查

与订阅追更的关系

订阅追更会先使用 NanShare 内置名称解析和筛选规则。当资源名复杂、无法获得可靠 TMDB 信息时，如果 OpenAI 辅助识别可用，NanShare 可以用它做兜底识别。

推荐做法：

text

电影订阅：优先使用片名、年份、分辨率、特效筛选
剧集订阅：同时关注季集进度和缺集追踪
疑难资源：开启辅助识别后观察订阅日志

与缺集补全的关系

Emby 缺集检测与补全会根据缺失季集去搜索资源。资源标题不规范时，辅助识别可以帮助判断候选资源是否属于目标剧集。

适合：

频道标题包含别名。
剧集文件名缺少年份。
标题里季集格式不统一。
搜索结果中混有合集、花絮、字幕包。

与大包筛选入库的关系

115 大包筛选入库会对大包内的文件做识别、筛选、转存或生成 STRM。若大包文件命名混乱，可以启用辅助识别提高匹配稳定性。

建议：

先用少量文件测试识别效果。
保留 TMDB ID 优先匹配。
对明显固定的错误命名优先写自定义识别词。
对一次性复杂资源再交给辅助识别。

提示词建议

提示词应要求模型只返回结构化 JSON，并聚焦媒体名称、年份、季、集。不要让提示词输出说明文字、推荐语或长段解释。

简化示例：

text

请从输入的影视文件名中识别媒体名称、年份、季号、集号。
只返回 JSON，不要返回额外文本。
无法确定的字段返回 null。

期望返回：

json

{
  "name": "庆余年",
  "year": 2019,
  "season": 2,
  "episode": 1
}

不建议：

text

帮我分析这个资源好不好看，并解释为什么。

示例

示例一：剧集标题混乱

原始名称：

text

[SomeGroup] Joy.of.Life.S02.第01集.2160p.WEB-DL.mkv

期望辅助识别：

json

{
  "name": "Joy of Life",
  "year": null,
  "season": 2,
  "episode": 1
}

后续可由 TMDB / 豆瓣匹配补全中文标题和年份。

示例二：中文季集

原始名称：

text

某剧 第二季 第十二集 HDR 1080p.mkv

期望辅助识别：

json

{
  "name": "某剧",
  "year": null,
  "season": 2,
  "episode": 12
}

示例三：电影别名

原始名称：

text

影片英文名.2024.IMAX.2160p.REMUX.mkv

期望辅助识别：

json

{
  "name": "影片英文名",
  "year": 2024,
  "season": null,
  "episode": null
}

缓存

NanShare 的整理配置中提供 OpenAI 辅助识别缓存和缓存时间。相同标题在缓存有效期内可复用识别结果，减少重复请求。

建议：

场景	缓存建议
订阅追更频繁运行	开启缓存
大包重复测试	开启缓存并设置较长时间
调试提示词	临时缩短缓存时间或关闭缓存

排错

问题	检查
测试连接失败	API URL、API Key、模型名、代理设置
返回内容无法解析	提示词是否要求只返回 JSON
识别错季集	文件名是否本身缺少季集，可配合自定义识别词
没有被调用	总开关是否开启，相关流程是否启用强制或兜底辅助识别
调用频繁	开启缓存，优先用识别词处理固定规则

使用建议

能用自定义识别词稳定修正的，优先写识别词。
能用 TMDB ID 明确指定的，优先使用 TMDB ID。
辅助识别适合作为兜底，不建议对所有规范文件强制启用。
调整提示词后先用测试连接和少量任务验证，再批量整理。

OpenAI 辅助识别 ​

入口位置 ​

配置项 ​

会识别哪些字段 ​

适合启用的场景 ​

与整理配置的关系 ​

与订阅追更的关系 ​

与缺集补全的关系 ​

与大包筛选入库的关系 ​

提示词建议 ​

示例 ​

示例一：剧集标题混乱 ​

示例二：中文季集 ​

示例三：电影别名 ​

缓存 ​

排错 ​

使用建议 ​

OpenAI 辅助识别

入口位置

配置项

会识别哪些字段

适合启用的场景

与整理配置的关系

与订阅追更的关系

与缺集补全的关系

与大包筛选入库的关系

提示词建议

示例

示例一：剧集标题混乱

示例二：中文季集

示例三：电影别名

缓存

排错

使用建议