5 Commits

Author SHA1 Message Date
viccy
d147fe66e4 feat(tts): 新增IndexTTS-2语音合成引擎支持
实现兼容IndexTTS2-Pack API的完整TTS调用流程,包含音频下载、错误重试等处理
重构原有IndexTTS-1.5代码,抽象通用逻辑以同时兼容indextts和indextts2两个引擎
新增IndexTTS-2的WebUI配置界面,支持情感控制与高级生成参数调整
更新配置示例文件与中英多语言文案,完善配置迁移逻辑兼容旧版配置
新增对应单元测试覆盖参数处理与配置迁移流程
2026-06-06 14:31:09 +08:00
viccy
a2645aebd3 feat(webui): 优化剪映草稿导出的用户体验
- 更新streamlit依赖至1.57.0以支持原生弹窗组件
- 重构剪映导出逻辑,使用原生弹窗替代旧的内联表单
- 新增带样式的导出确认面板并补充多语言翻译
- 简化导出状态渲染与会话状态管理逻辑
2026-06-06 12:43:57 +08:00
viccy
0bd001ce33 feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置
- 添加字幕校准服务,支持通过LLM校对SRT格式字幕文件,支持批量处理
- 为视频参数模型新增video_origin_paths字段,支持多视频上传与批量处理
- 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持
- 重构WebUI模型设置页面,将通用生成参数配置拆分到各模型的独立配置项中
- 更新示例配置文件与默认配置,新增对应参数的默认值
- 完善多语言国际化文案,添加批量操作与字幕校准相关翻译
- 添加相关单元测试以覆盖新功能与配置项
2026-06-05 23:15:11 +08:00
viccy
99dd4193ae feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能
- 在 WebUI 中增加 Fun-ASR 转录界面,支持上传多种音视频格式并生成 SRT 字幕
- 新增 `app/services/fun_asr_subtitle.py` 服务模块,实现完整的 REST API 调用流程,包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换
- 在配置文件中增加 `[fun_asr]` 配置段,支持保存 API Key
- 添加完整的单元测试,覆盖核心转换逻辑和服务流程
- 为兼容 Python 3.11 以下版本,将 `tomllib` 导入改为尝试导入并回退到 `tomli`
- 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解
2026-04-27 18:15:54 +08:00
linyq
16dbbf3461 refactor(config): 重构配置系统以支持默认值和模型名称规范化
- 新增 defaults.py 提供共享默认配置和模型名称处理工具
- 重构 config.py 使用默认值填充缺失配置
- 修改 openai_compatible_provider.py 简化模型名称处理逻辑
- 更新 WebUI 组件使用新的默认值系统
- 添加测试用例验证配置引导和模型名称处理
2026-03-28 00:34:01 +08:00