linyq
|
a3ece54b60
|
fix: 移除未使用的 logger 导入
|
2025-11-20 00:18:01 +08:00 |
|
linyq
|
ee36adcc93
|
fix: 移除未使用的 tkinter 导入
|
2025-11-20 00:16:14 +08:00 |
|
linyq
|
cda5760e37
|
feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
|
2025-11-20 00:01:49 +08:00 |
|
linyq
|
d75c2e000f
|
feat: 显示字幕引擎支持提示
|
2025-11-19 21:05:21 +08:00 |
|
linyq
|
6c8a56a51c
|
feat: 新增基础设置项并提供中文翻译
|
2025-11-19 20:59:42 +08:00 |
|
linyq
|
238c1c13f1
|
feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译
|
2025-11-19 20:00:08 +08:00 |
|
linyq
|
6697535c57
|
feat: 增强 LiteLLM 提供商配置并更新基本设置界面
|
2025-11-19 19:10:07 +08:00 |
|
linyq
|
75fa931591
|
Merge remote-tracking branch 'origin/main' into pr-199
|
2025-10-21 11:40:06 +08:00 |
|
linyq
|
8b41e06d58
|
fix: 使用 litellm 管理模型供应商
|
2025-10-21 10:36:28 +08:00 |
|
harry
|
01c8c8097e
|
新增qwen3 tts服务
|
2025-10-11 19:56:03 +08:00 |
|
harry
|
af7c8601f8
|
Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function
|
2025-10-11 17:57:45 +08:00 |
|
linyq
|
ccadd2964a
|
移除 SoulVoice 引擎相关设置,优化 TTS 引擎选项
|
2025-10-06 14:53:13 +08:00 |
|
linyq
|
7c95b47db5
|
修复试听 tts bug
|
2025-09-17 00:27:16 +08:00 |
|
linyq
|
a39c11e0d5
|
优化腾讯tts引擎
|
2025-09-17 00:08:16 +08:00 |
|
Emily-LMH
|
a1474bed02
|
新增腾讯云 TTS 服务
|
2025-09-17 00:08:16 +08:00 |
|
linyq
|
d0f8027024
|
更新 gemini 模型请求参数设置
|
2025-09-16 22:45:19 +08:00 |
|
linyq
|
60e01bf6f2
|
refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
|
2025-08-03 20:15:26 +08:00 |
|
linyq
|
062d317261
|
feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
|
2025-08-03 18:45:33 +08:00 |
|
linyq
|
e59fd6030c
|
refactor: 移除视频字幕合并功能及相关代码
清理不再使用的视频字幕合并功能,包括删除合并设置组件、合并工具函数和相关的国际化文本
|
2025-08-03 17:12:07 +08:00 |
|
linyq
|
184286e5e0
|
feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
|
2025-08-03 17:06:55 +08:00 |
|
linyq
|
cd1ee1441e
|
feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
|
2025-08-03 16:34:13 +08:00 |
|
linyq
|
e1f45db95a
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-08-03 04:26:42 +08:00 |
|
linyq
|
6715c29057
|
feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
|
2025-07-07 20:48:36 +08:00 |
|
linyq
|
dd59d5295d
|
feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
|
2025-07-07 15:40:34 +08:00 |
|
linyq
|
1792311ef4
|
feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
|
2025-07-02 17:54:00 +08:00 |
|
linyq
|
342a4ac1a8
|
refactor(webui): 修复合并视频与字幕功能
- 注释掉 merge_settings.py 中的一键转录功能
- 更新 base.py 中的 API URL
- 在 merge_video.py 中添加 pysrt导入
- 更新 requirements.txt,添加 pysrt 依赖
- 修改 zh.json 中的缺失字幕文件提示信息
|
2025-05-12 10:55:17 +08:00 |
|
linyq
|
2ef42fda46
|
feat(webui): 优化短剧解说功能
- 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数
- 修改 prompt 模板以包含短剧名称
- 调整组件渲染顺序,提高用户体验
|
2025-05-11 00:13:56 +08:00 |
|
linyq
|
f5c4e93fcd
|
feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
|
2025-05-10 23:37:58 +08:00 |
|
linyq
|
048b2ff39a
|
feat(webui): 新增短剧解说脚本生成功能
- 添加短剧解说模式,支持上传字幕文件
- 实现短剧解说脚本生成逻辑
-优化脚本设置界面布局,支持多种脚本类型
- 修复部分功能模块的引用错误
|
2025-05-10 22:57:05 +08:00 |
|
linyq
|
3fe8eb50c0
|
(webfeatui): 重构视觉分析功能并添加新模型支持
- 移除了对 QwenVL模型的特定逻辑,改为更通用的实现
- 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面,增加了新的模型选项
- 重构了测试连接和创建分析器的代码,提高了可维护性
- 调整了配置文件结构,简化了视觉模型的配置
|
2025-05-09 12:03:27 +08:00 |
|
linyq
|
fef3b3c8fd
|
feat(subtitle): 添加字幕自定义位置功能
- 在 generate_video.py 中实现自定义字幕位置的逻辑
- 在 schema.py 中添加 custom_position 字段
- 更新 webui 组件以支持自定义位置设置
- 调整任务处理逻辑,支持新的自定义位置参数
|
2025-05-08 20:45:14 +08:00 |
|
linyq
|
dac23c7c31
|
(webfeatui): 重构并优化视频解说文案生成功能
-优化了基本设置组件,增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块,提高了代码可读性和可维护性
-改进了 generate_script_docu 工具,简化了文案生成流程- 添加了异常处理和日志记录,提高了系统稳定性
|
2025-05-08 17:02:02 +08:00 |
|
linyq
|
ce01c110be
|
refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出,减少冗余信息
- 修改视频脚本 ID 获取方式
- 优化视频路径获取逻辑
- 移除未使用的导入
- 增加异常日志输出,提高错误排查效率
|
2025-05-08 00:13:19 +08:00 |
|
linyq
|
0ccb019f88
|
refactor(app): 重构视频剪辑功能并优化性能
- 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑
- 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则
- 调整了错误处理和日志记录方式
|
2025-05-07 23:08:26 +08:00 |
|
linyq
|
2dc83bc18e
|
perf(vision): 优化视觉分析流程和批量处理逻辑
- 移除了 vision_analysis_prompt 配置项
- 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑
- 更新了文档生成脚本和 UI 组件以适应新的分析流程
- 调整了视频帧提取相关函数,移除了不必要的 skip_seconds 参数
- 更新了中文翻译文件,添加了新的批处理大小相关提示
|
2025-05-07 18:44:37 +08:00 |
|
linyq
|
82823297f2
|
feat(script): 添加帧间隔输入参数并更新相关逻辑
- 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数,默认为 5
- 更新 VideoProcessor 的 process_video_pipeline 方法,调整帧提取间隔逻辑
- 修改前端界面,增加帧间隔输入框并更新相关翻译文本
- 优化 generate_script_docu 函数,使用新的帧间隔参数进行视频处理
|
2025-05-07 16:43:00 +08:00 |
|
linyq
|
f6c3f1640b
|
移除 opencv 和 sklearn 提取关键帧的代码
|
2025-05-07 15:41:01 +08:00 |
|
linyqh
|
bc236cd195
|
更新配置文件和Web界面,支持自定义短剧混剪片段
- 将项目版本更新至0.5.3
- 修改视觉大模型提供商为qwenvl,并更新相关API密钥和模型名称
- 新增DeepSeek API支持,更新文本生成模型设置
- 在Web界面中添加短视频生成模式的选项,调整脚本设置以支持自定义片段数量
- 修改代理设置的默认值为False
|
2025-04-13 14:07:35 +08:00 |
|
linyqh
|
074f1d103b
|
feat(webui): 更新文案生成模型设置支持 DeepSeek
- 调整文本生成模型提供商顺序,将 DeepSeek 置顶
- 修改 DeepSeek API 基础 URL 和模型名称
- 移除短剧混剪功能中的模型限制描述
|
2025-03-06 01:52:26 +08:00 |
|
linyqh
|
fb8021c30e
|
新增 en-US TTS
|
2025-01-11 23:13:57 +08:00 |
|
linyq
|
e3b5fa4d0e
|
feat(audio): 本地测试-1
- 调整背景音乐音量默认值为 0.3- 优化任务服务中的音量配置逻辑
- 更新视频生成服务,移除默认音量配置- 在 WebUI 中添加原声音量设置并更新相关参数
|
2024-12-11 15:19:17 +08:00 |
|
linyq
|
11a4cf0900
|
(subfeattitle): 优化字幕功能并增加位置设置
- 调整音频设置的滑块范围和默认值
- 修复生成脚本短片功能的导入问题
- 优化字幕设置界面,增加字幕位置选项- 改进字幕渲染逻辑,支持多种位置配置
- 调整视频设置中的原始音量滑块范围和默认值
|
2024-12-11 11:51:02 +08:00 |
|
linyq
|
c065800072
|
feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
|
2024-12-10 18:33:44 +08:00 |
|
linyq
|
d2f724217c
|
refactor(webui): 重构视频脚本生成-目录结果
- 将视频脚本生成相关代码从 script_settings.py 移动到新的 generate_script_docu.py 文件
- 新增 base.py 文件,提取公共工具函数
- 优化代码结构,提高可维护性和可读性- 重构函数名称,更清晰地反映功能
|
2024-12-06 18:18:23 +08:00 |
|
linyq
|
65d5a681ac
|
feat(webui): 视频合并添加一键转录功能
-改进文件上传和预览逻辑,支持视频和字幕文件的独立上传
- 添加字幕预览功能,可显示已上传字幕文件的内容
- 实现一键转录功能,为没有字幕的视频生成字幕
-优化合并文件的流程,提高合并效率
- 增加合并结果预览,方便用户查看合并后的视频和字幕
-重构代码,提高可维护性和可扩展性
|
2024-12-06 18:01:14 +08:00 |
|
linyqh
|
4e590380f5
|
feat(webui): 添加系统设置功能
- 新增系统设置面板,包含清理缓存、关键帧、裁剪视频和任务目录的功能- 实现清理指定目录的通用函数 clear_directory
- 更新中文翻译文件,添加相关提示信息
|
2024-12-05 22:36:17 +08:00 |
|
linyqh
|
f44d56110e
|
feat(vision): 添加 QwenVL 视觉分析支持
- 新增 QwenVL 视觉分析器类,实现对阿里云 Qwen 模型的支持
- 更新基础设置界面,增加代理配置和 QwenVL 模型可用性检测
- 修改脚本生成逻辑,支持 QwenVL 模型的图像分析
- 重构视觉分析器初始化和调用接口,提高代码复用性和可维护性
|
2024-12-05 21:43:26 +08:00 |
|
linyqh
|
0caa15e762
|
build: 添加 pysrt 字幕处理库
|
2024-12-05 20:27:01 +08:00 |
|
linyqh
|
52180d49c9
|
feat(merge): 合并视频字幕
- 新增 merge_settings 组件用于视频字幕合并设置
- 实现视频和字幕文件的上传、匹配和排序功能
- 添加合并视频和字幕的逻辑,支持多文件合并- 优化用户界面,增加预览和错误处理功能
|
2024-12-05 00:56:09 +08:00 |
|
linyqh
|
0021a868b6
|
feat(webui): 增加脚本上传功能并更新相关组件
- 在 script_settings.py 中添加脚本上传功能
- 更新 config.example.toml 中的项目版本号
- 在 zh.json 中添加新的国际化支持项
|
2024-12-04 21:07:51 +08:00 |
|