linyq
|
cda5760e37
|
feat: 新增 IndexTTS2 零样本语音克隆引擎支持
添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。
|
2025-11-20 00:01:49 +08:00 |
|
linyq
|
238c1c13f1
|
feat: 优化LLM服务配置与迁移适配,并更新相关UI设置及中文翻译
|
2025-11-19 20:00:08 +08:00 |
|
linyq
|
6697535c57
|
feat: 增强 LiteLLM 提供商配置并更新基本设置界面
|
2025-11-19 19:10:07 +08:00 |
|
linyq
|
75fa931591
|
Merge remote-tracking branch 'origin/main' into pr-199
|
2025-10-21 11:40:06 +08:00 |
|
linyq
|
6538b40baa
|
fix: 修改荒野建造提示词为更加通用的提示词
|
2025-10-21 10:51:23 +08:00 |
|
linyq
|
8b41e06d58
|
fix: 使用 litellm 管理模型供应商
|
2025-10-21 10:36:28 +08:00 |
|
harry
|
01c8c8097e
|
新增qwen3 tts服务
|
2025-10-11 19:56:03 +08:00 |
|
linyq
|
7c95b47db5
|
修复试听 tts bug
|
2025-09-17 00:27:16 +08:00 |
|
linyq
|
a39c11e0d5
|
优化腾讯tts引擎
|
2025-09-17 00:08:16 +08:00 |
|
Emily-LMH
|
a1474bed02
|
新增腾讯云 TTS 服务
|
2025-09-17 00:08:16 +08:00 |
|
linyq
|
d0f8027024
|
更新 gemini 模型请求参数设置
|
2025-09-16 22:45:19 +08:00 |
|
linyq
|
2569b7fee7
|
fix(subtitle): 修复字幕处理逻辑并添加有效性检查
处理空字幕文件情况并改进错误处理
确保合并失败时有默认返回值
添加字幕文件有效性检查函数
|
2025-08-16 01:24:56 +08:00 |
|
linyq
|
1fba4414aa
|
refactor: 移除未使用的代码文件和端口配置
清理未使用的控制器、测试文件和模型定义
移除Dockerfile中未使用的8080端口暴露
删除requirements.txt中的注释依赖
|
2025-08-16 01:16:05 +08:00 |
|
linyq
|
e9d0c013ef
|
fix(音频处理): 修复音频混合时的音量问题
修复amix导致的音量稀释问题,为每个音频添加音量补偿
保持原声片段音量为1.0不变,确保与原视频一致
仅在需要时调整原声音量,避免不必要的修改
|
2025-08-16 00:57:35 +08:00 |
|
linyq
|
864ebea1be
|
feat(llm): 添加gemini-2.5-flash支持并增强API调用可靠性
添加对gemini-2.5-flash模型的支持并更新示例配置
实现模型验证的严格/宽松模式配置
为API调用添加重试机制和超时配置
增加对更多HTTP错误状态码的处理
|
2025-08-03 20:06:14 +08:00 |
|
linyq
|
062d317261
|
feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
|
2025-08-03 18:45:33 +08:00 |
|
linyq
|
184286e5e0
|
feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
|
2025-08-03 17:06:55 +08:00 |
|
linyq
|
cd1ee1441e
|
feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
|
2025-08-03 16:34:13 +08:00 |
|
linyq
|
e1f45db95a
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-08-03 04:26:42 +08:00 |
|
linyq
|
2d4fe3399a
|
更新提示词
|
2025-07-12 16:13:15 +08:00 |
|
linyq
|
6d8cc671ab
|
fix(logging): 注释掉调试信息的日志输出,优化日志记录
在clip_video.py和merger_video.py中,注释掉了成功处理视频的日志信息,以减少调试时的冗余输出。同时,在manager.py中更新了提示词渲染成功的日志格式,确保版本信息的清晰展示。这些更改旨在提升日志的可读性和有效性,优化调试过程。
|
2025-07-12 02:27:51 +08:00 |
|
linyq
|
e3a5e34c78
|
feat(subtitle_analysis): 更新解说文案生成逻辑,增强字幕内容支持
在多个文件中重构了解说文案生成的实现,新增对原始字幕内容的支持,以提供准确的时间戳信息。更新了相关参数和提示词模板,优化了生成逻辑,提升了内容的准确性和用户体验。同时,注释部分进行了清理,去除了调试信息的输出。
|
2025-07-11 23:25:44 +08:00 |
|
linyqh
|
c61462d706
|
优化视频帧提取功能,新增超级兼容性方案以提高提取成功率,增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示,提升用户体验。
|
2025-07-07 21:33:25 +08:00 |
|
linyq
|
6270224d45
|
删除视频关键帧提取测试脚本,优化视频处理器中的提取逻辑,增加超级兼容性方案以解决Windows系统的MJPEG编码问题。更新了软件方案的提取命令,增强了错误处理和调试信息,提升了整体兼容性和用户体验。
|
2025-07-07 21:12:24 +08:00 |
|
linyq
|
6715c29057
|
feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
|
2025-07-07 20:48:36 +08:00 |
|
linyq
|
6e0d7f6971
|
更新注释
|
2025-07-07 18:57:35 +08:00 |
|
linyq
|
9982a2b70d
|
feat(prompts): 更新解说文案生成要求以提升内容质量和逻辑性
在script_generation.py文件中,重写了解说文案的输出要求,强调线性时间链、角色细节描写和情感关联,确保所有内容严格源自<plot>,并合理安排解说与原片的比例。这些更改旨在提升解说文案的生动性和吸引力,增强用户体验。
|
2025-07-07 18:25:06 +08:00 |
|
linyq
|
8b71cba9fd
|
feat(llm): 增强解说文案生成和图片分析功能,优化JSON解析
在migration_adapter.py和generate_script_docu.py文件中,集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统,确保返回的JSON格式有效,并在图片分析中保持向后兼容性,提升了系统的灵活性和用户体验。
|
2025-07-07 18:17:15 +08:00 |
|
linyq
|
2f6c1eb88b
|
feat(llm): 重构字幕分析和脚本生成流程,支持统一LLM服务
删除了旧的提示词文件,并在多个文件中更新了字幕分析和脚本生成的实现,集成了统一的LLM服务架构。新增了对服务提供商的支持,优化了API调用和JSON响应解析,提升了系统的灵活性和稳定性,确保了对不同LLM的兼容性,增强了用户体验。
|
2025-07-07 18:03:48 +08:00 |
|
linyq
|
8ad81d27b6
|
feat(prompts): 更新JSON格式输出以增强解析兼容性
在多个文件中修正了JSON格式输出,确保使用标准格式 `{` 和 `}`,并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力,确保输出的JSON格式有效且符合要求,增强了整体用户体验。
|
2025-07-07 17:45:34 +08:00 |
|
linyq
|
9a2d9cae9b
|
feat(prompts): 更新提示词管理系统以增强解说文案生成
在migration_adapter.py、base.py和template.py文件中集成新的提示词管理系统,优化提示词构建过程,提升解说文案生成的灵活性和兼容性。通过使用PromptManager和自定义模板渲染器,确保系统在处理新格式的JSON输出时保持向后兼容性,增强整体用户体验。
|
2025-07-07 17:30:43 +08:00 |
|
linyq
|
dbbb06eda8
|
feat(prompts): 引入新的提示词管理系统以优化解说文案生成
更新generate_narration_script.py、short_drama_explanation.py和step1_subtitle_analyzer_openai.py文件,集成新的提示词管理系统,提升解说文案和短剧分析的生成效率与准确性。通过使用PromptManager简化提示词构建过程,增强系统的灵活性和可维护性。
|
2025-07-07 17:13:54 +08:00 |
|
linyq
|
7309208282
|
feat(llm): 重构解说文案生成和视觉分析器,支持新的LLM服务架构
更新generate_narration_script.py、base.py和generate_short_summary.py文件,重构解说文案生成和视觉分析器的实现,优先使用新的LLM服务架构。添加回退机制以确保兼容性,增强系统的稳定性和用户体验。
|
2025-07-07 16:33:26 +08:00 |
|
linyq
|
dd59d5295d
|
feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
|
2025-07-07 15:40:34 +08:00 |
|
linyq
|
04ffda297f
|
feat(audio): 增强音量管理和智能音量调整功能
更新AudioVolumeDefaults类,提升原声音量至1.2以平衡TTS音量,并允许最大音量达到2.0。新增智能音量调整功能,自动分析和调整音频轨道音量,确保音量在合理范围内。优化任务处理逻辑,结合用户设置和推荐音量配置,提升音频合成效果和用户体验。
|
2025-07-07 10:44:19 +08:00 |
|
linyqh
|
c252b2a782
|
feat(video): 优化视频裁剪和合并功能,增强硬件加速兼容性
更新编码器配置,优先使用纯NVENC编码器以避免滤镜链错误,确保视频裁剪和合并过程中的兼容性和性能。改进错误处理机制,智能分析FFmpeg错误类型并选择合适的回退方案,提升整体稳定性和用户体验。
|
2025-07-07 02:21:02 +08:00 |
|
linyqh
|
13ed28626f
|
feat(video): 增强视频裁剪功能,优化Windows兼容性和错误处理
新增安全编码器配置和FFmpeg命令构建函数,支持硬件加速类型的动态选择。改进裁剪过程中的错误处理,记录失败片段并提供回退编码方案,确保视频裁剪的可靠性和兼容性。
|
2025-07-06 23:45:37 +08:00 |
|
linyq
|
57601e164f
|
feat(ffmpeg): 实现智能硬件加速检测和编码器选择
添加智能硬件加速检测功能,支持多平台和渐进式降级
优化编码器选择逻辑,根据硬件类型自动选择最优编码器
增加测试视频生成和清理功能,用于硬件加速兼容性测试
支持强制软件编码模式,提供更可靠的备选方案
|
2025-07-02 18:35:49 +08:00 |
|
linyq
|
06148a6b8c
|
fix(字幕): 修复字幕开关功能无效的问题
添加subtitle_enabled参数控制字幕处理逻辑,当禁用时跳过字幕处理
修复字幕文件不存在时的日志级别为warning
|
2025-07-02 18:16:44 +08:00 |
|
linyq
|
1792311ef4
|
feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
|
2025-07-02 17:54:00 +08:00 |
|
linyq
|
7a8de5e791
|
优化版本号获取逻辑,直接从文件读取版本号,并简化发布说明生成流程
|
2025-05-19 10:18:54 +08:00 |
|
linyq
|
0a3e497add
|
优化 ffmpeg 硬件加速美化日志
|
2025-05-19 03:01:21 +08:00 |
|
linyq
|
8fda320d50
|
优化 ffmpeg 硬件加速 独显 兼容性
|
2025-05-19 02:50:23 +08:00 |
|
linyq
|
47cd4f145d
|
优化 ffmpeg 硬件加速兼容性
|
2025-05-19 02:41:30 +08:00 |
|
linyq
|
fa2541f95c
|
优化视频处理中的硬件加速检测与兼容性检查
- 在 Windows 系统上增加显卡信息检测,避免使用不兼容的硬件加速
- 添加强制使用软件编码的选项,提升兼容性
- 增强错误处理机制,确保在硬件加速失败时能够回退到软件编码
- 更新日志信息,提供更清晰的处理反馈
|
2025-05-13 18:37:49 +08:00 |
|
linyq
|
c0e0b8ec6d
|
feat(SDE): 优化剧情分析提示词和解说文案生成
- 在 generate_short_summary.py 中添加 temperature 参数,用于控制生成文案的随机性- 修改 prompt.py 中的段落数要求,改为与字幕长度成正比
- 在 short_drama_explanation.py 中添加日志输出,记录使用的模型和温度
|
2025-05-12 11:20:31 +08:00 |
|
linyq
|
2ef42fda46
|
feat(webui): 优化短剧解说功能
- 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数
- 修改 prompt 模板以包含短剧名称
- 调整组件渲染顺序,提高用户体验
|
2025-05-11 00:13:56 +08:00 |
|
linyq
|
6cd1ff8b68
|
refactor(tools): 移除调试日志和未使用的参数- 在 base.py 中移除了调试日志,以减少日志噪音
- 在 generate_script_short.py 中移除了未使用的参数,简化了 API 调用
|
2025-05-10 23:57:15 +08:00 |
|
linyq
|
751d6fbb89
|
refactor(sde): 重构 Short Drama Explanation 服务
- 注释掉初始化日志输出,降低日志级别
- 更新 API base URL 为 NarratoAI 的生产环境地址
- 修改 API key 和模型名称为示例值
- 删除多余的测试代码
|
2025-05-10 23:46:39 +08:00 |
|
linyq
|
f5c4e93fcd
|
feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
|
2025-05-10 23:37:58 +08:00 |
|