linyq
|
a3ece54b60
|
fix: 移除未使用的 logger 导入
|
2025-11-20 00:18:01 +08:00 |
|
linyq
|
ee36adcc93
|
fix: 移除未使用的 tkinter 导入
|
2025-11-20 00:16:14 +08:00 |
|
linyq
|
cda5760e37
|
feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
|
2025-11-20 00:01:49 +08:00 |
|
linyq
|
d75c2e000f
|
feat: 显示字幕引擎支持提示
|
2025-11-19 21:05:21 +08:00 |
|
linyq
|
6c8a56a51c
|
feat: 新增基础设置项并提供中文翻译
|
2025-11-19 20:59:42 +08:00 |
|
linyq
|
238c1c13f1
|
feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译
|
2025-11-19 20:00:08 +08:00 |
|
linyq
|
6697535c57
|
feat: 增强 LiteLLM 提供商配置并更新基本设置界面
|
2025-11-19 19:10:07 +08:00 |
|
linyq
|
75fa931591
|
Merge remote-tracking branch 'origin/main' into pr-199
|
2025-10-21 11:40:06 +08:00 |
|
linyq
|
8b41e06d58
|
fix: 使用 litellm 管理模型供应商
|
2025-10-21 10:36:28 +08:00 |
|
harry
|
01c8c8097e
|
新增qwen3 tts服务
|
2025-10-11 19:56:03 +08:00 |
|
harry
|
af7c8601f8
|
Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function
|
2025-10-11 17:57:45 +08:00 |
|
linyq
|
ccadd2964a
|
移除 SoulVoice 引擎相关设置,优化 TTS 引擎选项
|
2025-10-06 14:53:13 +08:00 |
|
linyq
|
7c95b47db5
|
修复试听 tts bug
|
2025-09-17 00:27:16 +08:00 |
|
linyq
|
a39c11e0d5
|
优化腾讯tts引擎
|
2025-09-17 00:08:16 +08:00 |
|
Emily-LMH
|
a1474bed02
|
新增腾讯云 TTS 服务
|
2025-09-17 00:08:16 +08:00 |
|
linyq
|
d0f8027024
|
更新 gemini 模型请求参数设置
|
2025-09-16 22:45:19 +08:00 |
|
linyq
|
e22cf0241c
|
dev0.7.1 预发布
|
2025-08-18 14:48:40 +08:00 |
|
linyq
|
60e01bf6f2
|
refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
|
2025-08-03 20:15:26 +08:00 |
|
linyq
|
062d317261
|
feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
|
2025-08-03 18:45:33 +08:00 |
|
linyq
|
e59fd6030c
|
refactor: 移除视频字幕合并功能及相关代码
清理不再使用的视频字幕合并功能,包括删除合并设置组件、合并工具函数和相关的国际化文本
|
2025-08-03 17:12:07 +08:00 |
|
linyq
|
184286e5e0
|
feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
|
2025-08-03 17:06:55 +08:00 |
|
linyq
|
cd1ee1441e
|
feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
|
2025-08-03 16:34:13 +08:00 |
|
linyq
|
e1f45db95a
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-08-03 04:26:42 +08:00 |
|
linyq
|
e3a5e34c78
|
feat(subtitle_analysis): 更新解说文案生成逻辑,增强字幕内容支持
在多个文件中重构了解说文案生成的实现,新增对原始字幕内容的支持,以提供准确的时间戳信息。更新了相关参数和提示词模板,优化了生成逻辑,提升了内容的准确性和用户体验。同时,注释部分进行了清理,去除了调试信息的输出。
|
2025-07-11 23:25:44 +08:00 |
|
linyqh
|
c61462d706
|
优化视频帧提取功能,新增超级兼容性方案以提高提取成功率,增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示,提升用户体验。
|
2025-07-07 21:33:25 +08:00 |
|
linyq
|
6715c29057
|
feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
|
2025-07-07 20:48:36 +08:00 |
|
linyq
|
8b71cba9fd
|
feat(llm): 增强解说文案生成和图片分析功能,优化JSON解析
在migration_adapter.py和generate_script_docu.py文件中,集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统,确保返回的JSON格式有效,并在图片分析中保持向后兼容性,提升了系统的灵活性和用户体验。
|
2025-07-07 18:17:15 +08:00 |
|
linyq
|
2f6c1eb88b
|
feat(llm): 重构字幕分析和脚本生成流程,支持统一LLM服务
删除了旧的提示词文件,并在多个文件中更新了字幕分析和脚本生成的实现,集成了统一的LLM服务架构。新增了对服务提供商的支持,优化了API调用和JSON响应解析,提升了系统的灵活性和稳定性,确保了对不同LLM的兼容性,增强了用户体验。
|
2025-07-07 18:03:48 +08:00 |
|
linyq
|
8ad81d27b6
|
feat(prompts): 更新JSON格式输出以增强解析兼容性
在多个文件中修正了JSON格式输出,确保使用标准格式 `{` 和 `}`,并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力,确保输出的JSON格式有效且符合要求,增强了整体用户体验。
|
2025-07-07 17:45:34 +08:00 |
|
linyq
|
7309208282
|
feat(llm): 重构解说文案生成和视觉分析器,支持新的LLM服务架构
更新generate_narration_script.py、base.py和generate_short_summary.py文件,重构解说文案生成和视觉分析器的实现,优先使用新的LLM服务架构。添加回退机制以确保兼容性,增强系统的稳定性和用户体验。
|
2025-07-07 16:33:26 +08:00 |
|
linyq
|
dd59d5295d
|
feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
|
2025-07-07 15:40:34 +08:00 |
|
linyq
|
1792311ef4
|
feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
|
2025-07-02 17:54:00 +08:00 |
|
linyq
|
7a8de5e791
|
优化版本号获取逻辑,直接从文件读取版本号,并简化发布说明生成流程
|
2025-05-19 10:18:54 +08:00 |
|
linyq
|
c0e0b8ec6d
|
feat(SDE): 优化剧情分析提示词和解说文案生成
- 在 generate_short_summary.py 中添加 temperature 参数,用于控制生成文案的随机性- 修改 prompt.py 中的段落数要求,改为与字幕长度成正比
- 在 short_drama_explanation.py 中添加日志输出,记录使用的模型和温度
|
2025-05-12 11:20:31 +08:00 |
|
linyq
|
342a4ac1a8
|
refactor(webui): 修复合并视频与字幕功能
- 注释掉 merge_settings.py 中的一键转录功能
- 更新 base.py 中的 API URL
- 在 merge_video.py 中添加 pysrt导入
- 更新 requirements.txt,添加 pysrt 依赖
- 修改 zh.json 中的缺失字幕文件提示信息
|
2025-05-12 10:55:17 +08:00 |
|
linyq
|
7b75f12524
|
feat(webui): 更新简体中文翻译
- 在 zh.json 文件中更新了短剧解说功能的描述
- 明确指出短剧解说功能目前仅支持 gemini-2.0-flash 模型
|
2025-05-11 00:16:15 +08:00 |
|
linyq
|
2ef42fda46
|
feat(webui): 优化短剧解说功能
- 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数
- 修改 prompt 模板以包含短剧名称
- 调整组件渲染顺序,提高用户体验
|
2025-05-11 00:13:56 +08:00 |
|
linyq
|
6cd1ff8b68
|
refactor(tools): 移除调试日志和未使用的参数- 在 base.py 中移除了调试日志,以减少日志噪音
- 在 generate_script_short.py 中移除了未使用的参数,简化了 API 调用
|
2025-05-10 23:57:15 +08:00 |
|
linyq
|
f5c4e93fcd
|
feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
|
2025-05-10 23:37:58 +08:00 |
|
linyq
|
048b2ff39a
|
feat(webui): 新增短剧解说脚本生成功能
- 添加短剧解说模式,支持上传字幕文件
- 实现短剧解说脚本生成逻辑
-优化脚本设置界面布局,支持多种脚本类型
- 修复部分功能模块的引用错误
|
2025-05-10 22:57:05 +08:00 |
|
linyq
|
e66a5969f0
|
actorref(tools): 重构工具模块并添加日志记录功能- 在 base.py 中添加了调试日志记录视频参数
- 修改了 generate_script_docu.py 和 generate_script_short.py 中的视觉和文本分析参数处理逻辑
- 优化了参数传递和视觉分析器实例创建过程
- 在 generate_script_docu.py 中添加了视频配置检查函数调用
|
2025-05-10 16:45:25 +08:00 |
|
linyq
|
3fe8eb50c0
|
(webfeatui): 重构视觉分析功能并添加新模型支持
- 移除了对 QwenVL模型的特定逻辑,改为更通用的实现
- 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面,增加了新的模型选项
- 重构了测试连接和创建分析器的代码,提高了可维护性
- 调整了配置文件结构,简化了视觉模型的配置
|
2025-05-09 12:03:27 +08:00 |
|
linyq
|
fef3b3c8fd
|
feat(subtitle): 添加字幕自定义位置功能
- 在 generate_video.py 中实现自定义字幕位置的逻辑
- 在 schema.py 中添加 custom_position 字段
- 更新 webui 组件以支持自定义位置设置
- 调整任务处理逻辑,支持新的自定义位置参数
|
2025-05-08 20:45:14 +08:00 |
|
linyq
|
b762bf8d93
|
refactor(app): 重构生成解说文案功能并支持 deepseek-reasoner 模型
- 引入 loguru 库用于日志记录
- 优化 API 请求流程,支持非 JSON 输出的模型- 更新 API 密钥和基础 URL
- 修改系统提示语以更符合短视频解说文案的需求
- 优化日志输出,使用 debug 级别记录 token 消耗
- 清理生成的解说文案中的多余字符
- 更新文档生成工具中的日志级别
|
2025-05-08 17:37:07 +08:00 |
|
linyq
|
dac23c7c31
|
(webfeatui): 重构并优化视频解说文案生成功能
-优化了基本设置组件,增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块,提高了代码可读性和可维护性
-改进了 generate_script_docu 工具,简化了文案生成流程- 添加了异常处理和日志记录,提高了系统稳定性
|
2025-05-08 17:02:02 +08:00 |
|
linyq
|
e1b694824b
|
在generate_script_docu.py中修正时间戳解析逻辑,支持新旧格式兼容,并确保分析结果以JSON格式保存到指定目录。移除冗余的日志输出,优化代码结构。
|
2025-05-08 15:13:13 +08:00 |
|
linyq
|
017f398cb1
|
在generate_script_docu.py中新增时间戳功能,优化分析结果保存逻辑,确保分析结果以JSON格式保存到指定目录,并记录保存路径。移除旧的文本格式输出逻辑,简化代码结构。
|
2025-05-08 11:23:34 +08:00 |
|
linyq
|
6c6ceeebea
|
优化qwenvl_analyzer.py中的base_url配置,移除默认值设置;在utils.py中新增format_time函数以支持秒数格式化为HH:MM:SS,mmm格式;在generate_script_docu.py中重构分析结果处理逻辑,合并批次分析结果并保存为JSON格式,同时兼容旧的文本格式输出。
|
2025-05-08 11:00:47 +08:00 |
|
linyq
|
ce01c110be
|
refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出,减少冗余信息
- 修改视频脚本 ID 获取方式
- 优化视频路径获取逻辑
- 移除未使用的导入
- 增加异常日志输出,提高错误排查效率
|
2025-05-08 00:13:19 +08:00 |
|
linyq
|
0ccb019f88
|
refactor(app): 重构视频剪辑功能并优化性能
- 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑
- 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则
- 调整了错误处理和日志记录方式
|
2025-05-07 23:08:26 +08:00 |
|