51 Commits

Author SHA1 Message Date
viccy
ed4a5d07e5 feat(short_drama_editing): 添加强短剧混剪剪辑脚本生成完整功能
- 新增短剧混剪脚本生成专用提示词类并完成注册
- 优化merge_script工具函数,支持多视频路径输入、自动填充视频信息
- 扩展SDP处理流水线,新增直接基于剧情分析和字幕生成剪辑脚本的逻辑
- 更新WebUI相关组件与工具函数,适配新的短剧混剪脚本生成流程
- 添加字幕时间戳校验与路径规范化工具,确保生成脚本合法性
2026-06-15 01:16:30 +08:00
viccy
9f28fcfa98 feat: 添加LLM驱动的字幕翻译功能
新增配置项以配置字幕翻译批次大小和最大并发数
补充中、英文国际化文案支持翻译相关界面
实现核心字幕翻译服务,支持批量处理与并发执行
添加WebUI界面用于触发和监控字幕翻译任务
新增完整单元测试覆盖翻译功能全流程
2026-06-11 10:09:58 +08:00
viccy
f6bda521b2 feat(webui, jianying): 添加自动字幕匹配功能并修复webui状态问题
- 为剪映任务模块新增自动根据视频文件名匹配对应字幕文件的逻辑,当未传入原始字幕路径时自动查找并选择最新的匹配字幕
- 修复webui脚本设置页的selectbox状态同步问题,改用session_state作为唯一状态源,避免同时传递index和key导致的冲突
- 更新webui脚本路径的特殊路径判断列表,新增MODE_FILE的特殊情况处理
- 新增两个单元测试用例验证自动字幕匹配和原片字幕导入功能
2026-06-08 16:23:10 +08:00
viccy
dc12f390bb feat: 新增原片字幕支持并优化视频合并流程
- 为VideoClipParams新增原字幕路径配置字段,支持单条/多条字幕路径
- 完善webui参数获取逻辑,处理字幕路径兼容性并对接前端选择
- 重构后端字幕处理流程,支持自动匹配视频对应原字幕,合并原声字幕
- 优化视频合并逻辑,新增ffmpeg无损copy合并判断,自动回退重编码提升效率
- 新增ffmpeg快速素材合并路径,支持自定义字幕样式与多音轨混合
- 新增多个单元测试覆盖字幕匹配、合并及视频合并场景
2026-06-08 13:05:30 +08:00
viccy
d10c2ff7c5 feat(prompts, webui, llm): 新增影视解说功能及配套更新
- 新增影视解说专属提示词模块,覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程
- 注册影视解说模块到全局提示词系统,更新初始化加载逻辑
- 重构Tavily搜索服务,拆分通用搜索函数适配短剧和影视两类作品
- 更新WebUI界面,新增影视解说配置项、多语言翻译与版本号展示
- 升级项目版本号从0.7.9到0.8.1
- 调整LLM服务与适配器逻辑,支持自定义prompt分类适配不同解说类型
- 完善相关工具类与单元测试,覆盖影视解说场景调用流程
2026-06-08 00:30:37 +08:00
viccy
34d5532119 feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持
添加 FireRedASR2 本地 ASR 转写后端的完整支持:
1. 新增配置参数与数据模型字段
2. 更新示例配置文件,添加默认本地服务地址
3. 完善任务服务中的转写逻辑,支持 FireRedASR 后端
4. 更新 WebUI 界面,新增对应配置选项
5. 补充中英文多语言翻译
6. 新增本地 FireRedASR 服务的单元测试
2026-06-07 17:58:02 +08:00
viccy
e6e39d2dcd feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持
- 新增短剧解说全流程四类提示词模板:解说文案生成、片段规划、文案画面匹配、脚本修复
- 重构原有脚本生成提示词至v2.1,改为基于上游规划片段生成合规解说脚本
- 为LLM基础服务层新增流式文本生成接口,完善OpenAI兼容提供商的流式实现,支持流式回调与推理内容提取
- 重构OpenAI兼容文本提供商的生成逻辑,提取公共参数构建方法
- 新增多语言国际化文案,覆盖解说语言、短剧类型、原片占比等配置项与交互提示
- 新增多套单元测试,覆盖脚本校验、适配器流程、工具函数等模块
- 封装SubtitleAnalyzerAdapter,统一短剧解说脚本生成的整套业务接口
- 新增前端交互所需的解说文案审核相关提示文案
2026-06-07 17:10:48 +08:00
viccy
342fc15f3b feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持
新增OmniVoice语音合成引擎全流程支持,包含配置项、WebUI界面与服务实现
集成Tavily联网搜索能力,支持短剧剧情分析前自动检索剧情背景信息
新增多视频源剪辑支持,完善脚本校验规则并重构剪辑逻辑适配多视频路径
重构LLM剧情分析Prompt,优化输出格式适配多场景与联网检索结果
调整streamlit版本至1.56.0修复兼容性问题
新增相关单元测试与多语言翻译,更新配置示例文件
2026-06-07 01:24:32 +08:00
viccy
0bd001ce33 feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置
- 添加字幕校准服务,支持通过LLM校对SRT格式字幕文件,支持批量处理
- 为视频参数模型新增video_origin_paths字段,支持多视频上传与批量处理
- 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持
- 重构WebUI模型设置页面,将通用生成参数配置拆分到各模型的独立配置项中
- 更新示例配置文件与默认配置,新增对应参数的默认值
- 完善多语言国际化文案,添加批量操作与字幕校准相关翻译
- 添加相关单元测试以覆盖新功能与配置项
2026-06-05 23:15:11 +08:00
viccy
e6d15fe246 feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置
- 抽离通用生成参数设置组件,统一管理temperature等LLM生成参数
- 新增短剧字幕剧情分析功能,支持一键分析与手动编辑分析结果
- 重构短剧脚本生成逻辑,支持传入预先生成的剧情分析内容
- 新增可视化视频脚本表格编辑器,支持增删编辑行与原始JSON预览
- 优化多语言翻译、UI交互细节与字幕相关提示文案
2026-06-05 19:31:35 +08:00
viccy
e744960ac1 feat: 新增本地FunASR支持并优化网页端视频与字幕工作流
- 更新示例配置文件,添加本地FunASR后端配置项
- 重构fun_asr_subtitle服务,完整支持本地FunASR-Pack API调用
- 优化多语言翻译文件,更新界面相关译文
- 重写网页端视频选择组件,支持本地资源目录选择和直接上传
- 重构字幕转写UI,支持本地/在线百炼/直接上传三种模式
- 新增本地FunASR相关单元测试
2026-06-05 18:46:56 +08:00
viccy
89eebb8b41 feat(webui): 完善国际化多语言适配
将webui所有页面的硬编码中文提示文本替换为多语言翻译调用,为相关函数添加兼容的tr参数,同时补充zh.json和en.json中的对应翻译词条。
2026-06-05 16:36:03 +08:00
viccy
a1b434fbda refactor: 优化脚本设置与配置更新逻辑
重构 script_settings.py 中的脚本模式状态处理逻辑,完善会话状态 fallback 与默认值处理,新增 required 参数修复空选择问题。新增 update_app_config_if_changed 工具函数,仅在配置值实际变更时更新配置,替换基础设置中多处直接修改配置的代码,统一逻辑并减少不必要的状态更新。
2026-06-05 15:29:15 +08:00
viccy
99dd4193ae feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能
- 在 WebUI 中增加 Fun-ASR 转录界面,支持上传多种音视频格式并生成 SRT 字幕
- 新增 `app/services/fun_asr_subtitle.py` 服务模块,实现完整的 REST API 调用流程,包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换
- 在配置文件中增加 `[fun_asr]` 配置段,支持保存 API Key
- 添加完整的单元测试,覆盖核心转换逻辑和服务流程
- 为兼容 Python 3.11 以下版本,将 `tomllib` 导入改为尝试导入并回退到 `tomli`
- 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解
2026-04-27 18:15:54 +08:00
linyq
0706b00577 feat: 修复 windows 环境下 短剧混剪 报错 bug,添加字幕文本处理模块,优化字幕读取和规范化逻辑 2026-01-10 02:28:01 +08:00
linyq
26f0dfeab5 fix: 修复短剧混剪字幕在 windows 环境下加载失败 2025-12-25 01:16:00 +08:00
linyq
5f73c57313 fix: 优化短剧混剪使用体验 2025-12-24 13:18:52 +08:00
linyq
d5f089c9a7 feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译 2025-12-12 11:42:12 +08:00
linyq
bb7362809a refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
2025-12-12 11:36:04 +08:00
linyq
787d17a1a9 feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
2025-12-12 11:36:04 +08:00
linyq
e7db1668f8 feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
2025-12-12 11:36:04 +08:00
linyq
2ef42fda46 feat(webui): 优化短剧解说功能
- 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数
- 修改 prompt 模板以包含短剧名称
- 调整组件渲染顺序,提高用户体验
2025-05-11 00:13:56 +08:00
linyq
f5c4e93fcd feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
2025-05-10 23:37:58 +08:00
linyq
048b2ff39a feat(webui): 新增短剧解说脚本生成功能
- 添加短剧解说模式,支持上传字幕文件
- 实现短剧解说脚本生成逻辑
-优化脚本设置界面布局,支持多种脚本类型
- 修复部分功能模块的引用错误
2025-05-10 22:57:05 +08:00
linyq
0ccb019f88 refactor(app): 重构视频剪辑功能并优化性能
- 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑
- 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则
- 调整了错误处理和日志记录方式
2025-05-07 23:08:26 +08:00
linyq
2dc83bc18e perf(vision): 优化视觉分析流程和批量处理逻辑
- 移除了 vision_analysis_prompt 配置项
- 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑
- 更新了文档生成脚本和 UI 组件以适应新的分析流程
- 调整了视频帧提取相关函数,移除了不必要的 skip_seconds 参数
- 更新了中文翻译文件,添加了新的批处理大小相关提示
2025-05-07 18:44:37 +08:00
linyq
82823297f2 feat(script): 添加帧间隔输入参数并更新相关逻辑
- 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数,默认为 5
- 更新 VideoProcessor 的 process_video_pipeline 方法,调整帧提取间隔逻辑
- 修改前端界面,增加帧间隔输入框并更新相关翻译文本
- 优化 generate_script_docu 函数,使用新的帧间隔参数进行视频处理
2025-05-07 16:43:00 +08:00
linyqh
bc236cd195 更新配置文件和Web界面,支持自定义短剧混剪片段
- 将项目版本更新至0.5.3
- 修改视觉大模型提供商为qwenvl,并更新相关API密钥和模型名称
- 新增DeepSeek API支持,更新文本生成模型设置
- 在Web界面中添加短视频生成模式的选项,调整脚本设置以支持自定义片段数量
- 修改代理设置的默认值为False
2025-04-13 14:07:35 +08:00
linyq
c065800072 feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
2024-12-10 18:33:44 +08:00
linyq
d2f724217c refactor(webui): 重构视频脚本生成-目录结果
- 将视频脚本生成相关代码从 script_settings.py 移动到新的 generate_script_docu.py 文件
- 新增 base.py 文件,提取公共工具函数
- 优化代码结构,提高可维护性和可读性- 重构函数名称,更清晰地反映功能
2024-12-06 18:18:23 +08:00
linyqh
f44d56110e feat(vision): 添加 QwenVL 视觉分析支持
- 新增 QwenVL 视觉分析器类,实现对阿里云 Qwen 模型的支持
- 更新基础设置界面,增加代理配置和 QwenVL 模型可用性检测
- 修改脚本生成逻辑,支持 QwenVL 模型的图像分析
- 重构视觉分析器初始化和调用接口,提高代码复用性和可维护性
2024-12-05 21:43:26 +08:00
linyqh
0caa15e762 build: 添加 pysrt 字幕处理库 2024-12-05 20:27:01 +08:00
linyqh
0021a868b6 feat(webui): 增加脚本上传功能并更新相关组件
- 在 script_settings.py 中添加脚本上传功能
- 更新 config.example.toml 中的项目版本号
- 在 zh.json 中添加新的国际化支持项
2024-12-04 21:07:51 +08:00
linyqh
9efccea97f refactor(app): 优化视频剪辑函数(毫秒+缓存目录)
- 优化时间格式处理,支持更灵活的时间输入- 改进视频缓存目录结构,基于原视频生成哈希值
- 优化日志输出和错误处理
- 调整合并视频功能,移除未使用的示例代码
- 修复了一些与时间戳相关的小问题
2024-12-03 22:26:54 +08:00
linyqh
974a219dd3 refactor(script): 优化脚本生成中的时间戳处理(毫秒级)
- 重构 calculate_duration_and_word_count 函数,提高时间戳解析精度到毫秒级
- 更新 get_batch_timestamps 函数,支持毫秒级时间戳格式- 优化字数计算公式,调整为每0.4秒一个字,并限制在10-500字范围内
-增加日志输出,提高代码可调试性
2024-12-03 21:37:33 +08:00
linyqh
f6ba1824e9 feat(video): 提升关键帧时间戳精度到毫秒
- 将关键帧时间戳精确到毫秒,格式为 HHMMSSmmm
- 优化场景检测算法,增加帧数检查和未检测到边界时的处理
-调整帧差计算方式,使用浮点数提高精度
- 修改文件名格式匹配规则,支持毫秒级时间戳
2024-12-03 21:19:49 +08:00
linyq
d67300cdd5 feat(webui): 增加文案生成模型设置和测试连接功能
- 在基本设置中添加新的视觉模型提供商选项
- 实现文本模型连接测试功能,支持 OpenAI、Moonshot、DeepSeek等提供商
- 更新多语言文案,增加新的提示信息
2024-11-27 21:52:39 +08:00
linyq
53b8cded04 refactor(webui): 优化视觉分析批次处理逻辑
- 提取 vision_batch_size 到单独变量,提高代码可读性
- 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size")
- 添加调试日志,记录批次数量和每批次的图片数量
2024-11-26 16:38:57 +08:00
linyq
6fa80d1266 refactor(webui): 优化剧本生成功能
- 调整 API 请求方式,使用 JSON 数据发送请求
- 添加请求头,指定内容类型为 application/json
-优化异常处理,捕获具体异常信息
2024-11-21 16:50:46 +08:00
linyqh
bfc601e679 refactor(webui): 重构 API 参数格式
- 移除了 config.example.toml 中的多余注释
- 更新了 script_settings.py 中的 API 参数格式,简化为更通用的结构
- 调整了参数名称,使其更加清晰和一致
2024-11-21 03:21:18 +08:00
linyq
420f9392e3 feat(webui): 新增脚本设置功能并优化关键帧提取- 在 script_settings.py 中添加了三个新的输入框,用于设置 skip_seconds、threshold 和 vision_batch_size- 更新了关键帧提取过程,使用新设置的参数替代了配置文件中的固定值
- 在 i18n/zh.json 中添加了相关翻译,确保新功能支持中文
2024-11-18 12:19:48 +08:00
linyq
cc44aab181 feat(video): 实现关键帧提取 V2 版本
- 新增 VideoProcessor 类,实现视频预处理、场景边界检测、关键帧提取等功能
- 在 config.example.toml 中添加 frames 配置项,用于控制关键帧提取参数- 修改 script_settings.py,支持使用新的 VideoProcessor 进行关键帧提取
- 优化关键帧提取流程,提高处理效率和准确性
2024-11-15 18:03:23 +08:00
linyq
4c57fe0fa9 feat(webui): 集成 DeepSeek 文本生成模型
- 在文本生成模型提供商列表中添加 DeepSeek
- 实现 DeepSeek API 的生成器类
- 在脚本生成器中支持 DeepSeek 模型
- 优化脚本处理过程中的错误提示
2024-11-15 16:03:59 +08:00
linyqh
d0462ce91b 0.3.4 修改各种bug 2024-11-10 16:22:04 +08:00
linyqh
4bafd696a1 0.3.3 解决脚本验证问题 2024-11-10 14:26:06 +08:00
linyqh
b37b0abaff 0.3.2 发版2 2024-11-10 01:31:19 +08:00
linyqh
624889a32f 0.3.2 发版 2024-11-10 01:12:44 +08:00
linyqh
072cfb9856 完成汉化和自定义提示词 2024-11-09 22:35:12 +08:00
linyqh
49b52041ce 完成了 narrato-api 生成视频脚本的逻辑 2024-11-09 20:08:51 +08:00
linyqh
8267a0b3eb 完成了gemini 生成视频脚本的逻辑 2024-11-09 18:18:57 +08:00