viccy
|
342fc15f3b
|
feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持
新增OmniVoice语音合成引擎全流程支持,包含配置项、WebUI界面与服务实现
集成Tavily联网搜索能力,支持短剧剧情分析前自动检索剧情背景信息
新增多视频源剪辑支持,完善脚本校验规则并重构剪辑逻辑适配多视频路径
重构LLM剧情分析Prompt,优化输出格式适配多场景与联网检索结果
调整streamlit版本至1.56.0修复兼容性问题
新增相关单元测试与多语言翻译,更新配置示例文件
|
2026-06-07 01:24:32 +08:00 |
|
viccy
|
d147fe66e4
|
feat(tts): 新增IndexTTS-2语音合成引擎支持
实现兼容IndexTTS2-Pack API的完整TTS调用流程,包含音频下载、错误重试等处理
重构原有IndexTTS-1.5代码,抽象通用逻辑以同时兼容indextts和indextts2两个引擎
新增IndexTTS-2的WebUI配置界面,支持情感控制与高级生成参数调整
更新配置示例文件与中英多语言文案,完善配置迁移逻辑兼容旧版配置
新增对应单元测试覆盖参数处理与配置迁移流程
|
2026-06-06 14:31:09 +08:00 |
|
viccy
|
a2645aebd3
|
feat(webui): 优化剪映草稿导出的用户体验
- 更新streamlit依赖至1.57.0以支持原生弹窗组件
- 重构剪映导出逻辑,使用原生弹窗替代旧的内联表单
- 新增带样式的导出确认面板并补充多语言翻译
- 简化导出状态渲染与会话状态管理逻辑
|
2026-06-06 12:43:57 +08:00 |
|
viccy
|
5a9775d62d
|
feat: 支持横竖屏自定义字幕位置,重构剪映导出逻辑
- 新增横竖屏分别的字幕垂直位置配置,默认值分别为85%和82%
- 更新WebUI字幕设置界面,新增独立的横屏/竖屏字幕位置标签页,在预览画面中添加蓝线标注当前字幕位置
- 重构剪映草稿导出逻辑,将相关代码抽离至独立模块,移除requirements.txt中的pyJianYingDraft直接依赖
- 优化媒体时长处理逻辑,新增时长缓存和自动裁剪处理,添加完整的单元测试覆盖
- 更新配置示例文件、数据Schema定义和中英多语言翻译文件
|
2026-06-06 12:01:36 +08:00 |
|
viccy
|
33c17c2636
|
feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能,优化背景音乐设置
- 新增字幕遮罩功能,可在烧录新字幕前遮盖原视频自带的字幕区域,支持横屏/竖屏自定义配置与预览调试
- 新增自动字幕转录功能,支持本地FunASR和阿里百炼在线转写,在最终视频合并完成后自动生成并压入成片字幕
- 重构背景音乐设置面板,新增从资源目录选择BGM、上传本地BGM文件的功能,新增BGM试听预览,优化交互流程
- 更新配置示例文件、数据Schema与多语言翻译文件,完善前后端参数传递逻辑
|
2026-06-06 01:08:35 +08:00 |
|
viccy
|
5b2487e879
|
feat(indextts2, webui): 完善 IndexTTS2 支持,新增参考音频选择与预览功能
修改内容包括:
- 修正缺失参考音频的错误提示文本
- 更新示例配置文件,新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎
- 更新语音服务模块的注释与文档字符串
- 新增多语言适配文案,支持新UI的所有提示内容
- 重构 IndexTTS2 设置页面:支持从资源目录选择音频、上传本地音频、预览音频效果
- 调整TTS引擎选项的排序与默认选中项
|
2026-06-05 23:52:31 +08:00 |
|
viccy
|
0bd001ce33
|
feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置
- 添加字幕校准服务,支持通过LLM校对SRT格式字幕文件,支持批量处理
- 为视频参数模型新增video_origin_paths字段,支持多视频上传与批量处理
- 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持
- 重构WebUI模型设置页面,将通用生成参数配置拆分到各模型的独立配置项中
- 更新示例配置文件与默认配置,新增对应参数的默认值
- 完善多语言国际化文案,添加批量操作与字幕校准相关翻译
- 添加相关单元测试以覆盖新功能与配置项
|
2026-06-05 23:15:11 +08:00 |
|
viccy
|
e744960ac1
|
feat: 新增本地FunASR支持并优化网页端视频与字幕工作流
- 更新示例配置文件,添加本地FunASR后端配置项
- 重构fun_asr_subtitle服务,完整支持本地FunASR-Pack API调用
- 优化多语言翻译文件,更新界面相关译文
- 重写网页端视频选择组件,支持本地资源目录选择和直接上传
- 重构字幕转写UI,支持本地/在线百炼/直接上传三种模式
- 新增本地FunASR相关单元测试
|
2026-06-05 18:46:56 +08:00 |
|
viccy
|
35477a933d
|
feat(edge-tts, webui): 新增动态获取音色列表功能,更新内置列表并简化UI
- 新增`get_all_edge_voices()`工具函数链,支持缓存与代理,拉取失败时回退到内置音色列表
- 更新内置音色文档与列表,修正部分命名并新增多语言神经音色及因纽特语相关音色
- 简化WebUI的Edge TTS设置界面,不再硬编码筛选音色,直接展示所有已加载的音色
|
2026-06-05 15:59:54 +08:00 |
|
viccy
|
283617deb0
|
feat(jianying, webui): 新增IndexTTS2支持,优化TTS处理并添加单元测试
- 重构WebUI的TTS语音名称获取逻辑,适配多种TTS引擎
- 为IndexTTS2添加参考音频校验与归一化处理
- 新增剪映任务工具函数的完整单元测试用例
- 修复音频时长取整逻辑以提升匹配精度
- 更新默认TTS引擎为配置值而非硬编码内容
|
2026-06-05 14:57:00 +08:00 |
|
viccy
|
99dd4193ae
|
feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能
- 在 WebUI 中增加 Fun-ASR 转录界面,支持上传多种音视频格式并生成 SRT 字幕
- 新增 `app/services/fun_asr_subtitle.py` 服务模块,实现完整的 REST API 调用流程,包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换
- 在配置文件中增加 `[fun_asr]` 配置段,支持保存 API Key
- 添加完整的单元测试,覆盖核心转换逻辑和服务流程
- 为兼容 Python 3.11 以下版本,将 `tomllib` 导入改为尝试导入并回退到 `tomli`
- 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解
|
2026-04-27 18:15:54 +08:00 |
|
viccy
|
8c129790c7
|
Merge pull request #237 from aw123456dew/feature/doubao-tts
add doubao tts
|
2026-04-08 15:14:10 +08:00 |
|
aw123456dew
|
852f5ae34c
|
fix: jianying draft export failure due to floating-point precision in audio duration
|
2026-04-07 17:13:43 +08:00 |
|
aw123456dew
|
d45c1858c9
|
add export jianying draft feature
|
2026-04-07 11:33:12 +08:00 |
|
aw123456dew
|
71dfc99839
|
add doubao tts
|
2026-04-07 09:10:50 +08:00 |
|
linyq
|
abc9db22e5
|
Fix documentary narration parsing and explicit vision overrides
|
2026-04-03 12:04:09 +08:00 |
|
linyq
|
4e2560651f
|
fix(documentary): restore narration repair and explicit vision overrides
|
2026-04-03 11:29:27 +08:00 |
|
linyq
|
a8b6a5bb6b
|
fix(documentary): fail on malformed narration payload
|
2026-04-03 02:45:33 +08:00 |
|
linyq
|
d678bf62b1
|
fix(documentary): centralize final script generation in shared service
|
2026-04-03 02:38:54 +08:00 |
|
linyq
|
ac63fea953
|
refactor(documentary): route adapters through shared analysis service
|
2026-04-03 02:24:30 +08:00 |
|
linyq
|
df034d104b
|
fix(documentary): keep frames when batch summary is missing
|
2026-04-03 02:09:02 +08:00 |
|
linyq
|
ad02059e5d
|
fix(documentary): validate batch response contract before success
|
2026-04-03 02:04:21 +08:00 |
|
linyq
|
4d21c43b89
|
feat(documentary): preserve failed batches and add vision concurrency
|
2026-04-03 01:54:47 +08:00 |
|
linyq
|
8201911b82
|
fix(documentary): harden fast-path fallback and cache key prefix
|
2026-04-03 01:42:43 +08:00 |
|
linyq
|
3d76bff442
|
perf(documentary): add fast frame extraction and cache keys
|
2026-04-03 01:30:51 +08:00 |
|
linyq
|
40a48cc9ff
|
fix(documentary): align batch result fields with prompt contract
|
2026-04-03 01:23:05 +08:00 |
|
linyq
|
f9539eac8c
|
fix(documentary): tighten prompt contract and config guards
|
2026-04-03 01:14:41 +08:00 |
|
linyq
|
1d148370c5
|
feat(documentary): add shared frame analysis contract
|
2026-04-03 00:55:19 +08:00 |
|
linyq
|
16dbbf3461
|
refactor(config): 重构配置系统以支持默认值和模型名称规范化
- 新增 defaults.py 提供共享默认配置和模型名称处理工具
- 重构 config.py 使用默认值填充缺失配置
- 修改 openai_compatible_provider.py 简化模型名称处理逻辑
- 更新 WebUI 组件使用新的默认值系统
- 添加测试用例验证配置引导和模型名称处理
|
2026-03-28 00:34:01 +08:00 |
|
linyq
|
3396644593
|
feat: 移除 LiteLLM 依赖并迁移至 OpenAI 兼容接口
- 移除 LiteLLM 相关代码和依赖,改用原生 OpenAI 兼容接口
- 重构 LLM 服务提供商注册逻辑,仅支持 OpenAI 兼容接口
- 更新配置文件和文档,移除 LiteLLM 相关说明
- 添加新的测试用例验证 OpenAI 兼容接口集成
- 更新 WebUI 组件以适配新的 OpenAI 兼容接口
|
2026-03-27 23:49:58 +08:00 |
|
linyq
|
7ca594a788
|
feat(voice): 添加代理支持和改进 edge-tts 字幕处理
添加代理配置支持,包括代理开关和地址设置
重构 edge-tts 字幕处理逻辑,兼容新旧 API 版本
改进错误处理和日志记录,增加连接超时设置
更新 edge-tts 依赖至最新版本
|
2026-03-10 21:46:03 +08:00 |
|
linyq
|
0706b00577
|
feat: 修复 windows 环境下 短剧混剪 报错 bug,添加字幕文本处理模块,优化字幕读取和规范化逻辑
|
2026-01-10 02:28:01 +08:00 |
|
linyq
|
08f682bb50
|
fix: 优化短剧混剪字幕上传逻辑,与短剧解说保持一致
|
2025-12-25 10:43:28 +08:00 |
|
linyq
|
26f0dfeab5
|
fix: 修复短剧混剪字幕在 windows 环境下加载失败
|
2025-12-25 01:16:00 +08:00 |
|
linyq
|
5e46ea2746
|
fix: 优化短剧混剪提示词
|
2025-12-24 13:49:54 +08:00 |
|
linyq
|
d12dfbaf0f
|
fix: 优化注释
|
2025-12-24 13:26:20 +08:00 |
|
linyq
|
7b9ef2f244
|
feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
d5f089c9a7
|
feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
77c0aa47f2
|
feat: 增强 LiteLLM 提供商配置并更新基本设置界面
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
eca1fcbe67
|
fix: 修改荒野建造提示词为更加通用的提示词
|
2025-12-12 11:42:12 +08:00 |
|
linyq
|
d7b1b51a36
|
fix: 使用 litellm 管理模型供应商
|
2025-12-12 11:40:44 +08:00 |
|
harry
|
4b0f7c3bb9
|
新增qwen3 tts服务
|
2025-12-12 11:38:06 +08:00 |
|
linyq
|
6b8082244c
|
修复试听 tts bug
|
2025-12-12 11:38:06 +08:00 |
|
linyq
|
52f96f9eae
|
优化腾讯tts引擎
|
2025-12-12 11:36:04 +08:00 |
|
Emily-LMH
|
2c5c7cbd77
|
新增腾讯云 TTS 服务
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
a26c07d3dc
|
更新 gemini 模型请求参数设置
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
b1bcedd5d5
|
fix(subtitle): 修复字幕处理逻辑并添加有效性检查
处理空字幕文件情况并改进错误处理
确保合并失败时有默认返回值
添加字幕文件有效性检查函数
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
81d8c55580
|
refactor: 移除未使用的代码文件和端口配置
清理未使用的控制器、测试文件和模型定义
移除Dockerfile中未使用的8080端口暴露
删除requirements.txt中的注释依赖
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
c41bd682a9
|
fix(音频处理): 修复音频混合时的音量问题
修复amix导致的音量稀释问题,为每个音频添加音量补偿
保持原声片段音量为1.0不变,确保与原视频一致
仅在需要时调整原声音量,避免不必要的修改
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
07da580919
|
feat(llm): 添加gemini-2.5-flash支持并增强API调用可靠性
添加对gemini-2.5-flash模型的支持并更新示例配置
实现模型验证的严格/宽松模式配置
为API调用添加重试机制和超时配置
增加对更多HTTP错误状态码的处理
|
2025-12-12 11:36:04 +08:00 |
|