viccy
|
99fcd45704
|
feat(subtitle, ui): 新增字幕安全区预览,优化字体与字幕配置
- 新增竖屏/横屏字幕安全区预览背景图,支持切换预览比例
- 将项目版本从0.8.1升级至0.8.2
- 扩展字体搜索候选列表,新增SourceHanSerifSC-SemiBold.otf和LXGWWenKaiScreen.ttf两款字体
- 修改默认字幕字体为SourceHanSansCN-Regular.otf,替换原Microsoft YaHei默认值
- 新增内置字体检测逻辑,检测到resource/fonts目录有有效字体时跳过下载
- 更新中英文多语言文案,优化字幕位置提示文本
- 重构字幕设置面板,合并位置控制到预览区域并精简标签页
- 调整字体大小滑块范围从20-100扩展至20-160,新增数值边界校验
|
2026-06-10 12:05:05 +08:00 |
|
viccy
|
7a5303aa20
|
feat(ffmpeg,webui): 新增 FFmpeg 引擎管理与检测功能
- 新增配置项 ffmpeg_path 及路径应用逻辑,自动配置 FFmpeg 环境变量
- 实现全量 FFmpeg 引擎自动发现、能力检测工具链,支持多来源识别
- 添加 WebUI 系统设置面板,支持选择、测试和保存 FFmpeg 引擎
- 优化视频合并模块的 FFmpeg 调用,新增进度日志与流式输出处理
- 新增 FFmpeg 检测器单元测试覆盖核心功能
|
2026-06-08 13:28:27 +08:00 |
|
viccy
|
d10c2ff7c5
|
feat(prompts, webui, llm): 新增影视解说功能及配套更新
- 新增影视解说专属提示词模块,覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程
- 注册影视解说模块到全局提示词系统,更新初始化加载逻辑
- 重构Tavily搜索服务,拆分通用搜索函数适配短剧和影视两类作品
- 更新WebUI界面,新增影视解说配置项、多语言翻译与版本号展示
- 升级项目版本号从0.7.9到0.8.1
- 调整LLM服务与适配器逻辑,支持自定义prompt分类适配不同解说类型
- 完善相关工具类与单元测试,覆盖影视解说场景调用流程
|
2026-06-08 00:30:37 +08:00 |
|
viccy
|
4ab29fd776
|
feat: 优化视频生成进度展示与UI细节
- 为视频生成任务的每个处理步骤添加详细的中文状态提示
- 重构WebUI的视频生成弹窗,使用Streamlit原生状态组件优化进度展示
- 清理多语言翻译文本中的冗余表情符号,统一UI文本风格
- 调整TTS设置面板的折叠面板默认展开状态为关闭,并移除标题中的表情前缀
|
2026-06-07 18:36:47 +08:00 |
|
viccy
|
34d5532119
|
feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持
添加 FireRedASR2 本地 ASR 转写后端的完整支持:
1. 新增配置参数与数据模型字段
2. 更新示例配置文件,添加默认本地服务地址
3. 完善任务服务中的转写逻辑,支持 FireRedASR 后端
4. 更新 WebUI 界面,新增对应配置选项
5. 补充中英文多语言翻译
6. 新增本地 FireRedASR 服务的单元测试
|
2026-06-07 17:58:02 +08:00 |
|
viccy
|
e6e39d2dcd
|
feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持
- 新增短剧解说全流程四类提示词模板:解说文案生成、片段规划、文案画面匹配、脚本修复
- 重构原有脚本生成提示词至v2.1,改为基于上游规划片段生成合规解说脚本
- 为LLM基础服务层新增流式文本生成接口,完善OpenAI兼容提供商的流式实现,支持流式回调与推理内容提取
- 重构OpenAI兼容文本提供商的生成逻辑,提取公共参数构建方法
- 新增多语言国际化文案,覆盖解说语言、短剧类型、原片占比等配置项与交互提示
- 新增多套单元测试,覆盖脚本校验、适配器流程、工具函数等模块
- 封装SubtitleAnalyzerAdapter,统一短剧解说脚本生成的整套业务接口
- 新增前端交互所需的解说文案审核相关提示文案
|
2026-06-07 17:10:48 +08:00 |
|
viccy
|
342fc15f3b
|
feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持
新增OmniVoice语音合成引擎全流程支持,包含配置项、WebUI界面与服务实现
集成Tavily联网搜索能力,支持短剧剧情分析前自动检索剧情背景信息
新增多视频源剪辑支持,完善脚本校验规则并重构剪辑逻辑适配多视频路径
重构LLM剧情分析Prompt,优化输出格式适配多场景与联网检索结果
调整streamlit版本至1.56.0修复兼容性问题
新增相关单元测试与多语言翻译,更新配置示例文件
|
2026-06-07 01:24:32 +08:00 |
|
viccy
|
d147fe66e4
|
feat(tts): 新增IndexTTS-2语音合成引擎支持
实现兼容IndexTTS2-Pack API的完整TTS调用流程,包含音频下载、错误重试等处理
重构原有IndexTTS-1.5代码,抽象通用逻辑以同时兼容indextts和indextts2两个引擎
新增IndexTTS-2的WebUI配置界面,支持情感控制与高级生成参数调整
更新配置示例文件与中英多语言文案,完善配置迁移逻辑兼容旧版配置
新增对应单元测试覆盖参数处理与配置迁移流程
|
2026-06-06 14:31:09 +08:00 |
|
viccy
|
a2645aebd3
|
feat(webui): 优化剪映草稿导出的用户体验
- 更新streamlit依赖至1.57.0以支持原生弹窗组件
- 重构剪映导出逻辑,使用原生弹窗替代旧的内联表单
- 新增带样式的导出确认面板并补充多语言翻译
- 简化导出状态渲染与会话状态管理逻辑
|
2026-06-06 12:43:57 +08:00 |
|
viccy
|
5a9775d62d
|
feat: 支持横竖屏自定义字幕位置,重构剪映导出逻辑
- 新增横竖屏分别的字幕垂直位置配置,默认值分别为85%和82%
- 更新WebUI字幕设置界面,新增独立的横屏/竖屏字幕位置标签页,在预览画面中添加蓝线标注当前字幕位置
- 重构剪映草稿导出逻辑,将相关代码抽离至独立模块,移除requirements.txt中的pyJianYingDraft直接依赖
- 优化媒体时长处理逻辑,新增时长缓存和自动裁剪处理,添加完整的单元测试覆盖
- 更新配置示例文件、数据Schema定义和中英多语言翻译文件
|
2026-06-06 12:01:36 +08:00 |
|
viccy
|
33c17c2636
|
feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能,优化背景音乐设置
- 新增字幕遮罩功能,可在烧录新字幕前遮盖原视频自带的字幕区域,支持横屏/竖屏自定义配置与预览调试
- 新增自动字幕转录功能,支持本地FunASR和阿里百炼在线转写,在最终视频合并完成后自动生成并压入成片字幕
- 重构背景音乐设置面板,新增从资源目录选择BGM、上传本地BGM文件的功能,新增BGM试听预览,优化交互流程
- 更新配置示例文件、数据Schema与多语言翻译文件,完善前后端参数传递逻辑
|
2026-06-06 01:08:35 +08:00 |
|
viccy
|
5b2487e879
|
feat(indextts2, webui): 完善 IndexTTS2 支持,新增参考音频选择与预览功能
修改内容包括:
- 修正缺失参考音频的错误提示文本
- 更新示例配置文件,新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎
- 更新语音服务模块的注释与文档字符串
- 新增多语言适配文案,支持新UI的所有提示内容
- 重构 IndexTTS2 设置页面:支持从资源目录选择音频、上传本地音频、预览音频效果
- 调整TTS引擎选项的排序与默认选中项
|
2026-06-05 23:52:31 +08:00 |
|
viccy
|
0bd001ce33
|
feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置
- 添加字幕校准服务,支持通过LLM校对SRT格式字幕文件,支持批量处理
- 为视频参数模型新增video_origin_paths字段,支持多视频上传与批量处理
- 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持
- 重构WebUI模型设置页面,将通用生成参数配置拆分到各模型的独立配置项中
- 更新示例配置文件与默认配置,新增对应参数的默认值
- 完善多语言国际化文案,添加批量操作与字幕校准相关翻译
- 添加相关单元测试以覆盖新功能与配置项
|
2026-06-05 23:15:11 +08:00 |
|
viccy
|
e6d15fe246
|
feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置
- 抽离通用生成参数设置组件,统一管理temperature等LLM生成参数
- 新增短剧字幕剧情分析功能,支持一键分析与手动编辑分析结果
- 重构短剧脚本生成逻辑,支持传入预先生成的剧情分析内容
- 新增可视化视频脚本表格编辑器,支持增删编辑行与原始JSON预览
- 优化多语言翻译、UI交互细节与字幕相关提示文案
|
2026-06-05 19:31:35 +08:00 |
|
viccy
|
e744960ac1
|
feat: 新增本地FunASR支持并优化网页端视频与字幕工作流
- 更新示例配置文件,添加本地FunASR后端配置项
- 重构fun_asr_subtitle服务,完整支持本地FunASR-Pack API调用
- 优化多语言翻译文件,更新界面相关译文
- 重写网页端视频选择组件,支持本地资源目录选择和直接上传
- 重构字幕转写UI,支持本地/在线百炼/直接上传三种模式
- 新增本地FunASR相关单元测试
|
2026-06-05 18:46:56 +08:00 |
|
viccy
|
89eebb8b41
|
feat(webui): 完善国际化多语言适配
将webui所有页面的硬编码中文提示文本替换为多语言翻译调用,为相关函数添加兼容的tr参数,同时补充zh.json和en.json中的对应翻译词条。
|
2026-06-05 16:36:03 +08:00 |
|
linyq
|
474ebe46e2
|
feat: 新增基础设置项并提供中文翻译
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
d5f089c9a7
|
feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
d7b1b51a36
|
fix: 使用 litellm 管理模型供应商
|
2025-12-12 11:40:44 +08:00 |
|
linyq
|
b5548b050d
|
dev0.7.1 预发布
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
bb7362809a
|
refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
a184662f8b
|
refactor: 移除视频字幕合并功能及相关代码
清理不再使用的视频字幕合并功能,包括删除合并设置组件、合并工具函数和相关的国际化文本
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
e7db1668f8
|
feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
e389412dc2
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
342a4ac1a8
|
refactor(webui): 修复合并视频与字幕功能
- 注释掉 merge_settings.py 中的一键转录功能
- 更新 base.py 中的 API URL
- 在 merge_video.py 中添加 pysrt导入
- 更新 requirements.txt,添加 pysrt 依赖
- 修改 zh.json 中的缺失字幕文件提示信息
|
2025-05-12 10:55:17 +08:00 |
|
linyq
|
7b75f12524
|
feat(webui): 更新简体中文翻译
- 在 zh.json 文件中更新了短剧解说功能的描述
- 明确指出短剧解说功能目前仅支持 gemini-2.0-flash 模型
|
2025-05-11 00:16:15 +08:00 |
|
linyq
|
f5c4e93fcd
|
feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
|
2025-05-10 23:37:58 +08:00 |
|
linyq
|
2dc83bc18e
|
perf(vision): 优化视觉分析流程和批量处理逻辑
- 移除了 vision_analysis_prompt 配置项
- 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑
- 更新了文档生成脚本和 UI 组件以适应新的分析流程
- 调整了视频帧提取相关函数,移除了不必要的 skip_seconds 参数
- 更新了中文翻译文件,添加了新的批处理大小相关提示
|
2025-05-07 18:44:37 +08:00 |
|
linyq
|
82823297f2
|
feat(script): 添加帧间隔输入参数并更新相关逻辑
- 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数,默认为 5
- 更新 VideoProcessor 的 process_video_pipeline 方法,调整帧提取间隔逻辑
- 修改前端界面,增加帧间隔输入框并更新相关翻译文本
- 优化 generate_script_docu 函数,使用新的帧间隔参数进行视频处理
|
2025-05-07 16:43:00 +08:00 |
|
linyqh
|
074f1d103b
|
feat(webui): 更新文案生成模型设置支持 DeepSeek
- 调整文本生成模型提供商顺序,将 DeepSeek 置顶
- 修改 DeepSeek API 基础 URL 和模型名称
- 移除短剧混剪功能中的模型限制描述
|
2025-03-06 01:52:26 +08:00 |
|
linyq
|
c065800072
|
feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
|
2024-12-10 18:33:44 +08:00 |
|
linyq
|
65d5a681ac
|
feat(webui): 视频合并添加一键转录功能
-改进文件上传和预览逻辑,支持视频和字幕文件的独立上传
- 添加字幕预览功能,可显示已上传字幕文件的内容
- 实现一键转录功能,为没有字幕的视频生成字幕
-优化合并文件的流程,提高合并效率
- 增加合并结果预览,方便用户查看合并后的视频和字幕
-重构代码,提高可维护性和可扩展性
|
2024-12-06 18:01:14 +08:00 |
|
linyqh
|
4e590380f5
|
feat(webui): 添加系统设置功能
- 新增系统设置面板,包含清理缓存、关键帧、裁剪视频和任务目录的功能- 实现清理指定目录的通用函数 clear_directory
- 更新中文翻译文件,添加相关提示信息
|
2024-12-05 22:36:17 +08:00 |
|
linyqh
|
f44d56110e
|
feat(vision): 添加 QwenVL 视觉分析支持
- 新增 QwenVL 视觉分析器类,实现对阿里云 Qwen 模型的支持
- 更新基础设置界面,增加代理配置和 QwenVL 模型可用性检测
- 修改脚本生成逻辑,支持 QwenVL 模型的图像分析
- 重构视觉分析器初始化和调用接口,提高代码复用性和可维护性
|
2024-12-05 21:43:26 +08:00 |
|
linyqh
|
52180d49c9
|
feat(merge): 合并视频字幕
- 新增 merge_settings 组件用于视频字幕合并设置
- 实现视频和字幕文件的上传、匹配和排序功能
- 添加合并视频和字幕的逻辑,支持多文件合并- 优化用户界面,增加预览和错误处理功能
|
2024-12-05 00:56:09 +08:00 |
|
linyqh
|
0021a868b6
|
feat(webui): 增加脚本上传功能并更新相关组件
- 在 script_settings.py 中添加脚本上传功能
- 更新 config.example.toml 中的项目版本号
- 在 zh.json 中添加新的国际化支持项
|
2024-12-04 21:07:51 +08:00 |
|
linyq
|
8dd4b27fc3
|
feat(app): 新增脚本生成 V2 接口并重构相关功能
- 新增 V2脚本生成接口和相关服务
- 重构脚本生成逻辑,提高可维护性和可扩展性
- 优化关键帧提取和处理流程
- 改进错误处理和日志记录
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
d67300cdd5
|
feat(webui): 增加文案生成模型设置和测试连接功能
- 在基本设置中添加新的视觉模型提供商选项
- 实现文本模型连接测试功能,支持 OpenAI、Moonshot、DeepSeek等提供商
- 更新多语言文案,增加新的提示信息
|
2024-11-27 21:52:39 +08:00 |
|
linyq
|
9c58102558
|
feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词
- 在视频审查面板中添加剪辑模式选择选项
- 提供三种剪辑模式:仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息
|
2024-11-22 15:39:10 +08:00 |
|
linyq
|
420f9392e3
|
feat(webui): 新增脚本设置功能并优化关键帧提取- 在 script_settings.py 中添加了三个新的输入框,用于设置 skip_seconds、threshold 和 vision_batch_size- 更新了关键帧提取过程,使用新设置的参数替代了配置文件中的固定值
- 在 i18n/zh.json 中添加了相关翻译,确保新功能支持中文
|
2024-11-18 12:19:48 +08:00 |
|
linyqh
|
072cfb9856
|
完成汉化和自定义提示词
|
2024-11-09 22:35:12 +08:00 |
|
linyqh
|
bb18a754fe
|
webui 代码重构;
|
2024-11-09 02:26:39 +08:00 |
|
linyq
|
e926e8676a
|
优化 TTS 新增 proxy 配置,新增语调配置
|
2024-11-05 18:33:46 +08:00 |
|
linyqh
|
56b027bd43
|
优化基础配置
|
2024-09-30 02:14:20 +08:00 |
|
linyq
|
decac3b11d
|
完成优化webui体验-剪辑逻辑进度90%;
待优化点:
1. 优化脚本-解说质量
|
2024-09-29 18:34:36 +08:00 |
|
linyqh
|
d6663fde21
|
优化 webui.py;
脚本剪辑不稳定
|
2024-09-25 01:43:55 +08:00 |
|
linyq
|
6669b28361
|
优化 webui 代码逻辑
|
2024-09-24 18:25:02 +08:00 |
|
linyq
|
d67be7f98d
|
优化文档
|
2024-08-20 10:53:55 +08:00 |
|
linyq
|
49edc15c3c
|
优化中英文档;配置视频上传限制为2G
|
2024-08-13 18:08:39 +08:00 |
|
linyqh
|
f0dee9a8e2
|
新增上传视频功能;优化系统bug
|
2024-08-12 23:44:28 +08:00 |
|