15 Commits

Author SHA1 Message Date
viccy
99dd4193ae feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能
- 在 WebUI 中增加 Fun-ASR 转录界面,支持上传多种音视频格式并生成 SRT 字幕
- 新增 `app/services/fun_asr_subtitle.py` 服务模块,实现完整的 REST API 调用流程,包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换
- 在配置文件中增加 `[fun_asr]` 配置段,支持保存 API Key
- 添加完整的单元测试,覆盖核心转换逻辑和服务流程
- 为兼容 Python 3.11 以下版本,将 `tomllib` 导入改为尝试导入并回退到 `tomli`
- 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解
2026-04-27 18:15:54 +08:00
aw123456dew
71dfc99839 add doubao tts 2026-04-07 09:10:50 +08:00
linyq
16dbbf3461 refactor(config): 重构配置系统以支持默认值和模型名称规范化
- 新增 defaults.py 提供共享默认配置和模型名称处理工具
- 重构 config.py 使用默认值填充缺失配置
- 修改 openai_compatible_provider.py 简化模型名称处理逻辑
- 更新 WebUI 组件使用新的默认值系统
- 添加测试用例验证配置引导和模型名称处理
2026-03-28 00:34:01 +08:00
linyq
7ca594a788 feat(voice): 添加代理支持和改进 edge-tts 字幕处理
添加代理配置支持,包括代理开关和地址设置
重构 edge-tts 字幕处理逻辑,兼容新旧 API 版本
改进错误处理和日志记录,增加连接超时设置
更新 edge-tts 依赖至最新版本
2026-03-10 21:46:03 +08:00
linyq
7b9ef2f244 feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
2025-12-12 11:42:12 +08:00
linyq
d7b1b51a36 fix: 使用 litellm 管理模型供应商 2025-12-12 11:40:44 +08:00
harry
4b0f7c3bb9 新增qwen3 tts服务 2025-12-12 11:38:06 +08:00
Emily-LMH
2c5c7cbd77 新增腾讯云 TTS 服务 2025-12-12 11:36:04 +08:00
linyq
e389412dc2 feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
2025-12-12 11:36:04 +08:00
linyq
1c8b526c3c feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
2025-12-12 11:36:04 +08:00
linyq
706d73383e feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
2025-12-12 11:36:03 +08:00
linyq
2e0c492778 feat(audio): 增强音量管理和智能音量调整功能
更新AudioVolumeDefaults类,提升原声音量至1.2以平衡TTS音量,并允许最大音量达到2.0。新增智能音量调整功能,自动分析和调整音频轨道音量,确保音量在合理范围内。优化任务处理逻辑,结合用户设置和推荐音量配置,提升音频合成效果和用户体验。
2025-12-12 11:36:03 +08:00
linyq
c3d855c547 优化版本号获取逻辑,直接从文件读取版本号,并简化发布说明生成流程 2025-12-12 11:36:03 +08:00
linyq
cc44aab181 feat(video): 实现关键帧提取 V2 版本
- 新增 VideoProcessor 类,实现视频预处理、场景边界检测、关键帧提取等功能
- 在 config.example.toml 中添加 frames 配置项,用于控制关键帧提取参数- 修改 script_settings.py,支持使用新的 VideoProcessor 进行关键帧提取
- 优化关键帧提取流程,提高处理效率和准确性
2024-11-15 18:03:23 +08:00
linyqh
e874999bd1 first commit 2024-08-12 21:35:06 +08:00