深色模式
OpenAI 辅助识别
OpenAI 辅助识别用于处理常规名称解析难以判断的资源名。它不会替代 NanShare 的基础解析逻辑,而是在复杂别名、混合标题、路径噪声较多或缺少 TMDB ID 时,辅助提取名称、年份、季号和集号。
入口位置
在 NanShare 后台进入:
text
文件整理 -> OpenAI 辅助识别相关开关也会出现在整理配置、订阅追更、缺集补全、大包筛选入库等流程里。不同页面的开关含义略有区别,但都依赖这里保存的 OpenAI 辅助识别配置。
配置项
| 配置 | 说明 |
|---|---|
| 启用 OpenAI 辅助识别 | 总开关,关闭后不会调用辅助识别 |
| 使用代理 | 使用 NanShare 全局代理配置访问 API |
| API URL | OpenAI 或兼容 API 地址 |
| API Key | 接口密钥,文档示例不要填写真实值 |
| 模型 | 模型名称,按你使用的服务商填写 |
| 辅助识别提示词 | 控制返回格式和识别范围 |
| 恢复默认提示词 | 将提示词恢复为 NanShare 内置默认模板 |
| 测试连接 | 用当前配置请求一次接口,确认是否可用 |
示例配置:
yaml
enabled: true
proxy: false
api_url: "https://api.example.com"
api_key: "你的_API_KEY"
model: "gpt-compatible-model"会识别哪些字段
辅助识别结果主要用于补充以下字段:
| 字段 | 用途 |
|---|---|
name / title | 媒体名称 |
year | 年份 |
season | 季号 |
episode | 集号 |
这些字段会继续交给 NanShare 的 TMDB、豆瓣、订阅匹配、整理模板等流程使用。辅助识别不是直接生成最终文件名,最终命名仍由整理模板和渲染后处理词决定。
适合启用的场景
| 场景 | 建议 |
|---|---|
| 文件名包含大量发布信息 | 开启辅助识别,帮助提取真实片名 |
| 动漫标题中混有中日英多语言 | 可开启辅助识别,再配合自定义识别词修正季集 |
| TG 频道资源标题不规范 | 订阅或缺集补全时可作为兜底 |
| 大包筛选入库无法匹配 TMDB | 可启用强制 OpenAI 识别 |
| 文件名已经很规范 | 不建议强制开启,常规解析速度更快 |
与整理配置的关系
整理监控中有“强制 OpenAI 识别”开关。开启后,该整理任务会优先让辅助识别参与名称判断。
常见组合:
text
普通电影下载目录:关闭强制 OpenAI 识别
动漫合集目录:开启自定义识别词,必要时开启强制 OpenAI 识别
TG 资源目录:开启辅助识别,并保留整理历史方便回查与订阅追更的关系
订阅追更会先使用 NanShare 内置名称解析和筛选规则。当资源名复杂、无法获得可靠 TMDB 信息时,如果 OpenAI 辅助识别可用,NanShare 可以用它做兜底识别。
推荐做法:
text
电影订阅:优先使用片名、年份、分辨率、特效筛选
剧集订阅:同时关注季集进度和缺集追踪
疑难资源:开启辅助识别后观察订阅日志与缺集补全的关系
Emby 缺集检测与补全会根据缺失季集去搜索资源。资源标题不规范时,辅助识别可以帮助判断候选资源是否属于目标剧集。
适合:
- 频道标题包含别名。
- 剧集文件名缺少年份。
- 标题里季集格式不统一。
- 搜索结果中混有合集、花絮、字幕包。
与大包筛选入库的关系
115 大包筛选入库会对大包内的文件做识别、筛选、转存或生成 STRM。若大包文件命名混乱,可以启用辅助识别提高匹配稳定性。
建议:
- 先用少量文件测试识别效果。
- 保留 TMDB ID 优先匹配。
- 对明显固定的错误命名优先写自定义识别词。
- 对一次性复杂资源再交给辅助识别。
提示词建议
提示词应要求模型只返回结构化 JSON,并聚焦媒体名称、年份、季、集。不要让提示词输出说明文字、推荐语或长段解释。
简化示例:
text
请从输入的影视文件名中识别媒体名称、年份、季号、集号。
只返回 JSON,不要返回额外文本。
无法确定的字段返回 null。期望返回:
json
{
"name": "庆余年",
"year": 2019,
"season": 2,
"episode": 1
}不建议:
text
帮我分析这个资源好不好看,并解释为什么。示例
示例一:剧集标题混乱
原始名称:
text
[SomeGroup] Joy.of.Life.S02.第01集.2160p.WEB-DL.mkv期望辅助识别:
json
{
"name": "Joy of Life",
"year": null,
"season": 2,
"episode": 1
}后续可由 TMDB / 豆瓣匹配补全中文标题和年份。
示例二:中文季集
原始名称:
text
某剧 第二季 第十二集 HDR 1080p.mkv期望辅助识别:
json
{
"name": "某剧",
"year": null,
"season": 2,
"episode": 12
}示例三:电影别名
原始名称:
text
影片英文名.2024.IMAX.2160p.REMUX.mkv期望辅助识别:
json
{
"name": "影片英文名",
"year": 2024,
"season": null,
"episode": null
}缓存
NanShare 的整理配置中提供 OpenAI 辅助识别缓存和缓存时间。相同标题在缓存有效期内可复用识别结果,减少重复请求。
建议:
| 场景 | 缓存建议 |
|---|---|
| 订阅追更频繁运行 | 开启缓存 |
| 大包重复测试 | 开启缓存并设置较长时间 |
| 调试提示词 | 临时缩短缓存时间或关闭缓存 |
排错
| 问题 | 检查 |
|---|---|
| 测试连接失败 | API URL、API Key、模型名、代理设置 |
| 返回内容无法解析 | 提示词是否要求只返回 JSON |
| 识别错季集 | 文件名是否本身缺少季集,可配合自定义识别词 |
| 没有被调用 | 总开关是否开启,相关流程是否启用强制或兜底辅助识别 |
| 调用频繁 | 开启缓存,优先用识别词处理固定规则 |
使用建议
- 能用自定义识别词稳定修正的,优先写识别词。
- 能用 TMDB ID 明确指定的,优先使用 TMDB ID。
- 辅助识别适合作为兜底,不建议对所有规范文件强制启用。
- 调整提示词后先用测试连接和少量任务验证,再批量整理。