viccy
|
4ab29fd776
|
feat: 优化视频生成进度展示与UI细节
- 为视频生成任务的每个处理步骤添加详细的中文状态提示
- 重构WebUI的视频生成弹窗,使用Streamlit原生状态组件优化进度展示
- 清理多语言翻译文本中的冗余表情符号,统一UI文本风格
- 调整TTS设置面板的折叠面板默认展开状态为关闭,并移除标题中的表情前缀
|
2026-06-07 18:36:47 +08:00 |
|
viccy
|
342fc15f3b
|
feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持
新增OmniVoice语音合成引擎全流程支持,包含配置项、WebUI界面与服务实现
集成Tavily联网搜索能力,支持短剧剧情分析前自动检索剧情背景信息
新增多视频源剪辑支持,完善脚本校验规则并重构剪辑逻辑适配多视频路径
重构LLM剧情分析Prompt,优化输出格式适配多场景与联网检索结果
调整streamlit版本至1.56.0修复兼容性问题
新增相关单元测试与多语言翻译,更新配置示例文件
|
2026-06-07 01:24:32 +08:00 |
|
viccy
|
d147fe66e4
|
feat(tts): 新增IndexTTS-2语音合成引擎支持
实现兼容IndexTTS2-Pack API的完整TTS调用流程,包含音频下载、错误重试等处理
重构原有IndexTTS-1.5代码,抽象通用逻辑以同时兼容indextts和indextts2两个引擎
新增IndexTTS-2的WebUI配置界面,支持情感控制与高级生成参数调整
更新配置示例文件与中英多语言文案,完善配置迁移逻辑兼容旧版配置
新增对应单元测试覆盖参数处理与配置迁移流程
|
2026-06-06 14:31:09 +08:00 |
|
viccy
|
a2645aebd3
|
feat(webui): 优化剪映草稿导出的用户体验
- 更新streamlit依赖至1.57.0以支持原生弹窗组件
- 重构剪映导出逻辑,使用原生弹窗替代旧的内联表单
- 新增带样式的导出确认面板并补充多语言翻译
- 简化导出状态渲染与会话状态管理逻辑
|
2026-06-06 12:43:57 +08:00 |
|
viccy
|
33c17c2636
|
feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能,优化背景音乐设置
- 新增字幕遮罩功能,可在烧录新字幕前遮盖原视频自带的字幕区域,支持横屏/竖屏自定义配置与预览调试
- 新增自动字幕转录功能,支持本地FunASR和阿里百炼在线转写,在最终视频合并完成后自动生成并压入成片字幕
- 重构背景音乐设置面板,新增从资源目录选择BGM、上传本地BGM文件的功能,新增BGM试听预览,优化交互流程
- 更新配置示例文件、数据Schema与多语言翻译文件,完善前后端参数传递逻辑
|
2026-06-06 01:08:35 +08:00 |
|
viccy
|
5b2487e879
|
feat(indextts2, webui): 完善 IndexTTS2 支持,新增参考音频选择与预览功能
修改内容包括:
- 修正缺失参考音频的错误提示文本
- 更新示例配置文件,新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎
- 更新语音服务模块的注释与文档字符串
- 新增多语言适配文案,支持新UI的所有提示内容
- 重构 IndexTTS2 设置页面:支持从资源目录选择音频、上传本地音频、预览音频效果
- 调整TTS引擎选项的排序与默认选中项
|
2026-06-05 23:52:31 +08:00 |
|
viccy
|
89eebb8b41
|
feat(webui): 完善国际化多语言适配
将webui所有页面的硬编码中文提示文本替换为多语言翻译调用,为相关函数添加兼容的tr参数,同时补充zh.json和en.json中的对应翻译词条。
|
2026-06-05 16:36:03 +08:00 |
|
viccy
|
35477a933d
|
feat(edge-tts, webui): 新增动态获取音色列表功能,更新内置列表并简化UI
- 新增`get_all_edge_voices()`工具函数链,支持缓存与代理,拉取失败时回退到内置音色列表
- 更新内置音色文档与列表,修正部分命名并新增多语言神经音色及因纽特语相关音色
- 简化WebUI的Edge TTS设置界面,不再硬编码筛选音色,直接展示所有已加载的音色
|
2026-06-05 15:59:54 +08:00 |
|
aw123456dew
|
71dfc99839
|
add doubao tts
|
2026-04-07 09:10:50 +08:00 |
|
linyq
|
97bb59220f
|
fix: 移除未使用的 logger 导入
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
169daac94d
|
fix: 移除未使用的 tkinter 导入
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
7b9ef2f244
|
feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
|
2025-12-12 11:42:12 +08:00 |
|
harry
|
4423195313
|
Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function
|
2025-12-12 11:38:06 +08:00 |
|
harry
|
4b0f7c3bb9
|
新增qwen3 tts服务
|
2025-12-12 11:38:06 +08:00 |
|
linyq
|
a99d752069
|
移除 SoulVoice 引擎相关设置,优化 TTS 引擎选项
|
2025-12-12 11:38:06 +08:00 |
|
linyq
|
6b8082244c
|
修复试听 tts bug
|
2025-12-12 11:38:06 +08:00 |
|
linyq
|
52f96f9eae
|
优化腾讯tts引擎
|
2025-12-12 11:36:04 +08:00 |
|
Emily-LMH
|
2c5c7cbd77
|
新增腾讯云 TTS 服务
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
aebd169900
|
feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
e389412dc2
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
70b8b49e41
|
feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
|
2025-12-12 11:36:03 +08:00 |
|
linyqh
|
fb8021c30e
|
新增 en-US TTS
|
2025-01-11 23:13:57 +08:00 |
|
linyq
|
e3b5fa4d0e
|
feat(audio): 本地测试-1
- 调整背景音乐音量默认值为 0.3- 优化任务服务中的音量配置逻辑
- 更新视频生成服务,移除默认音量配置- 在 WebUI 中添加原声音量设置并更新相关参数
|
2024-12-11 15:19:17 +08:00 |
|
linyq
|
11a4cf0900
|
(subfeattitle): 优化字幕功能并增加位置设置
- 调整音频设置的滑块范围和默认值
- 修复生成脚本短片功能的导入问题
- 优化字幕设置界面,增加字幕位置选项- 改进字幕渲染逻辑,支持多种位置配置
- 调整视频设置中的原始音量滑块范围和默认值
|
2024-12-11 11:51:02 +08:00 |
|
linyq
|
c065800072
|
feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
|
2024-12-10 18:33:44 +08:00 |
|
linyqh
|
ee710499b9
|
refactor(webui): 优化音频设置界面并添加代理配置
- 修改支持的语音列表,仅保留中文语音
- 在主程序中添加代理配置环境变量
-优化剪辑视频函数,改为返回字典类型
- 更新任务服务中的剪辑视频函数,适应新的参数类型
- 修改测试用例中的视频剪辑函数,增加输出路径参数
- 更新脚本控制器中的剪辑视频函数,集成任务 ID 和子视频字典
|
2024-11-27 23:26:43 +08:00 |
|
linyqh
|
bb18a754fe
|
webui 代码重构;
|
2024-11-09 02:26:39 +08:00 |
|