NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-08-01 19:05:52 +00:00

Author	SHA1	Message	Date
Cindy Xu	14828256de	feat(sfx): 新增 Sonilo AI 音效模式（可选，默认关闭）在 #270 配乐模式基础上新增可选的 "AI 音效（Sonilo）"：将合并后的成片上传到 Sonilo API（POST /v1/video-to-sfx，异步任务管线），根据画面内容生成音效，再用 ffmpeg 混在成片现有音轨之下（视频流直接复制，不重编码画面）。解说配音在后续合成步骤中单独混入，音量策略不受影响。生成的音效为免版税素材。 - 复用 #270 的 sonilo_api_key 配置与 app/services/sonilo.py 模块，新增音效任务管线（提交 / 轮询 / 预签名 URL 下载） - 上传前 ffprobe 本地校验时长（音效接口上限 3 分钟），避免白传计费 - 轮询是免费幂等 GET：网络抖动与 5xx 在截止时间内重试，不报废已计费任务 - 任何失败（超时、HTTP 错误、任务失败、混音失败）只记录日志并沿用原视频，绝不中断成片任务 - WebUI 音频设置新增独立开关面板（默认关闭），选项处提示视频将上传至 Sonilo API - 现有 BGM / 合成逻辑不做任何改动，未勾选时行为与 main 完全一致	2026-07-22 13:17:14 -07:00
linyq-laien	0a5dcf5f21	功能: 新增字幕任务专用高效模型支持新增高推理模型和高效模型的中英文国际化配置字符串新增高效文本模型配置项，支持空值时自动回退到高推理模型添加resolve_text_model_name工具函数用于根据偏好解析对应文本模型更新字幕校对和翻译服务，默认使用高效模型处理批量字幕任务优化OpenAI兼容提供商的模型参数处理逻辑，支持通过参数覆盖模型名称更新WebUI基础设置页面，新增高效模型配置项并支持测试两个模型的连接同步更新示例配置文件、默认配置项与相关测试用例	2026-07-19 14:53:06 +08:00
linyq-laien	022b8bbea3	feat(webui, llm, i18n): 添加可自定义的解说文案字数配置在WebUI脚本设置页面新增字数输入控件，支持100-5000区间的目标字数设置更新LLM提示词模板，使用用户指定字数作为目标（±10%浮动）替代原固定范围补充中英文国际化翻译文案升级项目版本至0.8.7 更新相关服务函数与单元测试适配新参数	2026-07-18 04:26:44 +08:00
linyq-laien	7639c9d289	feat(audio): 新增voxcpm-0.5b和voxcpm-2b本地语音合成支持新增完整的voxcpm系列本地语音合成功能，包括： - 新增配置常量、加载逻辑与示例配置项 - 集成webui界面：引擎选型、参数配置与语音预览 - 实现核心调用逻辑，包含API地址标准化、重试机制与文件处理 - 新增两套单元测试覆盖核心流程 - 在字幕转录设置页面补充转录工具包的下载提示文本	2026-07-16 19:11:51 +08:00
viccy	445feb14ae	Merge remote-tracking branch 'origin/main'	2026-07-16 11:24:39 +08:00
Cindy Xu	d29874a163	feat(bgm): 新增 Sonilo AI 配乐模式（可选，默认关闭）背景音乐来源新增 "AI 生成配乐（Sonilo）"：将合成完成的视频（未加 BGM）上传到 Sonilo API，根据画面内容与剪辑节奏生成配乐，音频文件交还给现有合成流程混音，解说配音音量策略保持不变。 - 独立模块 app/services/sonilo.py，仅在配置 sonilo_api_key 后可用 - 上传前 ffprobe 本地校验时长（接口上限 6 分钟），避免白传计费 - 任何失败只记录日志并回退到随机背景音乐，绝不中断成片任务 - WebUI 选项处提示：视频将上传至 Sonilo API，生成的音乐已获授权、可商用（以条款为准） - 现有 resource/upload/none 的 BGM 逻辑不做任何改动 Closes #269	2026-07-13 21:00:03 -07:00
viccy	b56222725d	feat: add IndexTTS 1.5 macOS engine	2026-07-13 06:19:56 +08:00
viccy	39eae0d511	fix: adapt IndexTTS-2 MLX Pack API	2026-07-13 04:41:09 +08:00
viccy	990fb36e98	fix(webui, tests): 修复硬编码路径与组件默认值问题并新增测试替换音频设置模块的硬编码本地路径为资源目录工具函数，提升跨平台兼容性修正字幕预览方向选择组件的默认值处理逻辑，移除冗余的默认参数新增Streamlit组件会话状态合规性测试，确保带key的组件不会同时声明default参数更新.gitignore以允许提交新增的测试文件	2026-07-13 03:48:05 +08:00
viccy	4a5b699b11	Fix reference audio source pill state	2026-07-13 02:33:06 +08:00
viccy	0733bb9528	Merge pull request #265 from leoz9/codex/add-clear-cache-button Add system cache clearing action	2026-07-02 16:07:42 +08:00
viccy	ec1a1a4c52	Merge pull request #263 from leoz9/codex/normalize-pills-state Normalize audio source pill state	2026-07-02 15:46:35 +08:00
zhanglei	4666190181	Add system cache clearing action	2026-07-02 15:43:34 +08:00
zhanglei	207900a59a	Normalize audio pills source state	2026-07-02 14:34:54 +08:00
zhanglei	3eaf61c3f8	Fix subtitle preview orientation state	2026-07-02 14:33:15 +08:00
viccy	c288a76ff8	Merge pull request #255 from hamizan-azman/codex/validate-openai-base-url Validate OpenAI-compatible base URLs	2026-07-02 11:58:37 +08:00
viccy	0774ac5385	Warn for custom OpenAI base URLs	2026-07-02 11:57:31 +08:00
viccy	1b7bd79654	feat: support Doubao TTS API key auth	2026-07-02 11:35:23 +08:00
Kirito	acd27aedc7	腾讯云TTS音色列表更新	2026-06-21 21:10:56 +08:00
Hamizan Azman	5f7eed9f85	Validate OpenAI-compatible base URLs	2026-06-19 15:08:17 +08:00
viccy	ed4a5d07e5	feat(short_drama_editing): 添加强短剧混剪剪辑脚本生成完整功能 - 新增短剧混剪脚本生成专用提示词类并完成注册 - 优化merge_script工具函数，支持多视频路径输入、自动填充视频信息 - 扩展SDP处理流水线，新增直接基于剧情分析和字幕生成剪辑脚本的逻辑 - 更新WebUI相关组件与工具函数，适配新的短剧混剪脚本生成流程 - 添加字幕时间戳校验与路径规范化工具，确保生成脚本合法性	2026-06-15 01:16:30 +08:00
viccy	9f28fcfa98	feat: 添加LLM驱动的字幕翻译功能新增配置项以配置字幕翻译批次大小和最大并发数补充中、英文国际化文案支持翻译相关界面实现核心字幕翻译服务，支持批量处理与并发执行添加WebUI界面用于触发和监控字幕翻译任务新增完整单元测试覆盖翻译功能全流程	2026-06-11 10:09:58 +08:00
viccy	99fcd45704	feat(subtitle, ui): 新增字幕安全区预览，优化字体与字幕配置 - 新增竖屏/横屏字幕安全区预览背景图，支持切换预览比例 - 将项目版本从0.8.1升级至0.8.2 - 扩展字体搜索候选列表，新增SourceHanSerifSC-SemiBold.otf和LXGWWenKaiScreen.ttf两款字体 - 修改默认字幕字体为SourceHanSansCN-Regular.otf，替换原Microsoft YaHei默认值 - 新增内置字体检测逻辑，检测到resource/fonts目录有有效字体时跳过下载 - 更新中英文多语言文案，优化字幕位置提示文本 - 重构字幕设置面板，合并位置控制到预览区域并精简标签页 - 调整字体大小滑块范围从20-100扩展至20-160，新增数值边界校验	2026-06-10 12:05:05 +08:00
viccy	f6bda521b2	feat(webui, jianying): 添加自动字幕匹配功能并修复webui状态问题 - 为剪映任务模块新增自动根据视频文件名匹配对应字幕文件的逻辑，当未传入原始字幕路径时自动查找并选择最新的匹配字幕 - 修复webui脚本设置页的selectbox状态同步问题，改用session_state作为唯一状态源，避免同时传递index和key导致的冲突 - 更新webui脚本路径的特殊路径判断列表，新增MODE_FILE的特殊情况处理 - 新增两个单元测试用例验证自动字幕匹配和原片字幕导入功能	2026-06-08 16:23:10 +08:00
viccy	7a5303aa20	feat(ffmpeg,webui): 新增 FFmpeg 引擎管理与检测功能 - 新增配置项 ffmpeg_path 及路径应用逻辑，自动配置 FFmpeg 环境变量 - 实现全量 FFmpeg 引擎自动发现、能力检测工具链，支持多来源识别 - 添加 WebUI 系统设置面板，支持选择、测试和保存 FFmpeg 引擎 - 优化视频合并模块的 FFmpeg 调用，新增进度日志与流式输出处理 - 新增 FFmpeg 检测器单元测试覆盖核心功能	2026-06-08 13:28:27 +08:00
viccy	dc12f390bb	feat: 新增原片字幕支持并优化视频合并流程 - 为VideoClipParams新增原字幕路径配置字段，支持单条/多条字幕路径 - 完善webui参数获取逻辑，处理字幕路径兼容性并对接前端选择 - 重构后端字幕处理流程，支持自动匹配视频对应原字幕，合并原声字幕 - 优化视频合并逻辑，新增ffmpeg无损copy合并判断，自动回退重编码提升效率 - 新增ffmpeg快速素材合并路径，支持自定义字幕样式与多音轨混合 - 新增多个单元测试覆盖字幕匹配、合并及视频合并场景	2026-06-08 13:05:30 +08:00
viccy	d10c2ff7c5	feat(prompts, webui, llm): 新增影视解说功能及配套更新 - 新增影视解说专属提示词模块，覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程 - 注册影视解说模块到全局提示词系统，更新初始化加载逻辑 - 重构Tavily搜索服务，拆分通用搜索函数适配短剧和影视两类作品 - 更新WebUI界面，新增影视解说配置项、多语言翻译与版本号展示 - 升级项目版本号从0.7.9到0.8.1 - 调整LLM服务与适配器逻辑，支持自定义prompt分类适配不同解说类型 - 完善相关工具类与单元测试，覆盖影视解说场景调用流程	2026-06-08 00:30:37 +08:00
viccy	4ab29fd776	feat: 优化视频生成进度展示与UI细节 - 为视频生成任务的每个处理步骤添加详细的中文状态提示 - 重构WebUI的视频生成弹窗，使用Streamlit原生状态组件优化进度展示 - 清理多语言翻译文本中的冗余表情符号，统一UI文本风格 - 调整TTS设置面板的折叠面板默认展开状态为关闭，并移除标题中的表情前缀	2026-06-07 18:36:47 +08:00
viccy	34d5532119	feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持添加 FireRedASR2 本地 ASR 转写后端的完整支持： 1. 新增配置参数与数据模型字段 2. 更新示例配置文件，添加默认本地服务地址 3. 完善任务服务中的转写逻辑，支持 FireRedASR 后端 4. 更新 WebUI 界面，新增对应配置选项 5. 补充中英文多语言翻译 6. 新增本地 FireRedASR 服务的单元测试	2026-06-07 17:58:02 +08:00
viccy	e6e39d2dcd	feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持 - 新增短剧解说全流程四类提示词模板：解说文案生成、片段规划、文案画面匹配、脚本修复 - 重构原有脚本生成提示词至v2.1，改为基于上游规划片段生成合规解说脚本 - 为LLM基础服务层新增流式文本生成接口，完善OpenAI兼容提供商的流式实现，支持流式回调与推理内容提取 - 重构OpenAI兼容文本提供商的生成逻辑，提取公共参数构建方法 - 新增多语言国际化文案，覆盖解说语言、短剧类型、原片占比等配置项与交互提示 - 新增多套单元测试，覆盖脚本校验、适配器流程、工具函数等模块 - 封装SubtitleAnalyzerAdapter，统一短剧解说脚本生成的整套业务接口 - 新增前端交互所需的解说文案审核相关提示文案	2026-06-07 17:10:48 +08:00
viccy	342fc15f3b	feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持新增OmniVoice语音合成引擎全流程支持，包含配置项、WebUI界面与服务实现集成Tavily联网搜索能力，支持短剧剧情分析前自动检索剧情背景信息新增多视频源剪辑支持，完善脚本校验规则并重构剪辑逻辑适配多视频路径重构LLM剧情分析Prompt，优化输出格式适配多场景与联网检索结果调整streamlit版本至1.56.0修复兼容性问题新增相关单元测试与多语言翻译，更新配置示例文件	2026-06-07 01:24:32 +08:00
viccy	d147fe66e4	feat(tts): 新增IndexTTS-2语音合成引擎支持实现兼容IndexTTS2-Pack API的完整TTS调用流程，包含音频下载、错误重试等处理重构原有IndexTTS-1.5代码，抽象通用逻辑以同时兼容indextts和indextts2两个引擎新增IndexTTS-2的WebUI配置界面，支持情感控制与高级生成参数调整更新配置示例文件与中英多语言文案，完善配置迁移逻辑兼容旧版配置新增对应单元测试覆盖参数处理与配置迁移流程	2026-06-06 14:31:09 +08:00
viccy	a2645aebd3	feat(webui): 优化剪映草稿导出的用户体验 - 更新streamlit依赖至1.57.0以支持原生弹窗组件 - 重构剪映导出逻辑，使用原生弹窗替代旧的内联表单 - 新增带样式的导出确认面板并补充多语言翻译 - 简化导出状态渲染与会话状态管理逻辑	2026-06-06 12:43:57 +08:00
viccy	5a9775d62d	feat: 支持横竖屏自定义字幕位置，重构剪映导出逻辑 - 新增横竖屏分别的字幕垂直位置配置，默认值分别为85%和82% - 更新WebUI字幕设置界面，新增独立的横屏/竖屏字幕位置标签页，在预览画面中添加蓝线标注当前字幕位置 - 重构剪映草稿导出逻辑，将相关代码抽离至独立模块，移除requirements.txt中的pyJianYingDraft直接依赖 - 优化媒体时长处理逻辑，新增时长缓存和自动裁剪处理，添加完整的单元测试覆盖 - 更新配置示例文件、数据Schema定义和中英多语言翻译文件	2026-06-06 12:01:36 +08:00
viccy	33c17c2636	feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能，优化背景音乐设置 - 新增字幕遮罩功能，可在烧录新字幕前遮盖原视频自带的字幕区域，支持横屏/竖屏自定义配置与预览调试 - 新增自动字幕转录功能，支持本地FunASR和阿里百炼在线转写，在最终视频合并完成后自动生成并压入成片字幕 - 重构背景音乐设置面板，新增从资源目录选择BGM、上传本地BGM文件的功能，新增BGM试听预览，优化交互流程 - 更新配置示例文件、数据Schema与多语言翻译文件，完善前后端参数传递逻辑	2026-06-06 01:08:35 +08:00
viccy	5b2487e879	feat(indextts2, webui): 完善 IndexTTS2 支持，新增参考音频选择与预览功能修改内容包括： - 修正缺失参考音频的错误提示文本 - 更新示例配置文件，新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎 - 更新语音服务模块的注释与文档字符串 - 新增多语言适配文案，支持新UI的所有提示内容 - 重构 IndexTTS2 设置页面：支持从资源目录选择音频、上传本地音频、预览音频效果 - 调整TTS引擎选项的排序与默认选中项	2026-06-05 23:52:31 +08:00
viccy	0bd001ce33	feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置 - 添加字幕校准服务，支持通过LLM校对SRT格式字幕文件，支持批量处理 - 为视频参数模型新增video_origin_paths字段，支持多视频上传与批量处理 - 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持 - 重构WebUI模型设置页面，将通用生成参数配置拆分到各模型的独立配置项中 - 更新示例配置文件与默认配置，新增对应参数的默认值 - 完善多语言国际化文案，添加批量操作与字幕校准相关翻译 - 添加相关单元测试以覆盖新功能与配置项	2026-06-05 23:15:11 +08:00
viccy	e6d15fe246	feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置 - 抽离通用生成参数设置组件，统一管理temperature等LLM生成参数 - 新增短剧字幕剧情分析功能，支持一键分析与手动编辑分析结果 - 重构短剧脚本生成逻辑，支持传入预先生成的剧情分析内容 - 新增可视化视频脚本表格编辑器，支持增删编辑行与原始JSON预览 - 优化多语言翻译、UI交互细节与字幕相关提示文案	2026-06-05 19:31:35 +08:00
viccy	e744960ac1	feat: 新增本地FunASR支持并优化网页端视频与字幕工作流 - 更新示例配置文件，添加本地FunASR后端配置项 - 重构fun_asr_subtitle服务，完整支持本地FunASR-Pack API调用 - 优化多语言翻译文件，更新界面相关译文 - 重写网页端视频选择组件，支持本地资源目录选择和直接上传 - 重构字幕转写UI，支持本地/在线百炼/直接上传三种模式 - 新增本地FunASR相关单元测试	2026-06-05 18:46:56 +08:00
viccy	89eebb8b41	feat(webui): 完善国际化多语言适配将webui所有页面的硬编码中文提示文本替换为多语言翻译调用，为相关函数添加兼容的tr参数，同时补充zh.json和en.json中的对应翻译词条。	2026-06-05 16:36:03 +08:00
viccy	35477a933d	feat(edge-tts, webui): 新增动态获取音色列表功能，更新内置列表并简化UI - 新增`get_all_edge_voices()`工具函数链，支持缓存与代理，拉取失败时回退到内置音色列表 - 更新内置音色文档与列表，修正部分命名并新增多语言神经音色及因纽特语相关音色 - 简化WebUI的Edge TTS设置界面，不再硬编码筛选音色，直接展示所有已加载的音色	2026-06-05 15:59:54 +08:00
viccy	a1b434fbda	refactor: 优化脚本设置与配置更新逻辑重构 script_settings.py 中的脚本模式状态处理逻辑，完善会话状态 fallback 与默认值处理，新增 required 参数修复空选择问题。新增 update_app_config_if_changed 工具函数，仅在配置值实际变更时更新配置，替换基础设置中多处直接修改配置的代码，统一逻辑并减少不必要的状态更新。	2026-06-05 15:29:15 +08:00
viccy	99dd4193ae	feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能 - 在 WebUI 中增加 Fun-ASR 转录界面，支持上传多种音视频格式并生成 SRT 字幕 - 新增 `app/services/fun_asr_subtitle.py` 服务模块，实现完整的 REST API 调用流程，包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换 - 在配置文件中增加 `[fun_asr]` 配置段，支持保存 API Key - 添加完整的单元测试，覆盖核心转换逻辑和服务流程 - 为兼容 Python 3.11 以下版本，将 `tomllib` 导入改为尝试导入并回退到 `tomli` - 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解	2026-04-27 18:15:54 +08:00
viccy	8c129790c7	Merge pull request #237 from aw123456dew/feature/doubao-tts add doubao tts	2026-04-08 15:14:10 +08:00
aw123456dew	d45c1858c9	add export jianying draft feature	2026-04-07 11:33:12 +08:00
aw123456dew	71dfc99839	add doubao tts	2026-04-07 09:10:50 +08:00
linyq	16dbbf3461	refactor(config): 重构配置系统以支持默认值和模型名称规范化 - 新增 defaults.py 提供共享默认配置和模型名称处理工具 - 重构 config.py 使用默认值填充缺失配置 - 修改 openai_compatible_provider.py 简化模型名称处理逻辑 - 更新 WebUI 组件使用新的默认值系统 - 添加测试用例验证配置引导和模型名称处理	2026-03-28 00:34:01 +08:00
linyq	3396644593	feat: 移除 LiteLLM 依赖并迁移至 OpenAI 兼容接口 - 移除 LiteLLM 相关代码和依赖，改用原生 OpenAI 兼容接口 - 重构 LLM 服务提供商注册逻辑，仅支持 OpenAI 兼容接口 - 更新配置文件和文档，移除 LiteLLM 相关说明 - 添加新的测试用例验证 OpenAI 兼容接口集成 - 更新 WebUI 组件以适配新的 OpenAI 兼容接口	2026-03-27 23:49:58 +08:00
linyq	7ca594a788	feat(voice): 添加代理支持和改进 edge-tts 字幕处理添加代理配置支持，包括代理开关和地址设置重构 edge-tts 字幕处理逻辑，兼容新旧 API 版本改进错误处理和日志记录，增加连接超时设置更新 edge-tts 依赖至最新版本	2026-03-10 21:46:03 +08:00
linyq	0706b00577	feat: 修复 windows 环境下短剧混剪报错 bug，添加字幕文本处理模块，优化字幕读取和规范化逻辑	2026-01-10 02:28:01 +08:00

1 2 3

125 Commits