linyq
|
207b49c9cc
|
忽略开发文件
|
2025-12-12 11:36:04 +08:00 |
|
viccy
|
f2ba9689e1
|
Update LICENSE
更新许可证
|
2025-12-12 11:36:04 +08:00 |
|
viccy
|
87afe738fe
|
Update README.md
更新许可证
|
2025-12-12 11:36:04 +08:00 |
|
viccy
|
74b52eec7b
|
Update README.md
更新防止被骗提示
|
2025-12-12 11:36:04 +08:00 |
|
viccy
|
b3fd32569e
|
Update README.md
防止被骗
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
b5548b050d
|
dev0.7.1 预发布
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
95e3b66bc7
|
refactor(docker): 优化docker配置和部署脚本
重构Docker相关配置,包括:
- 更新.dockerignore文件,增加更多忽略规则
- 优化requirements.txt依赖管理
- 新增Makefile提供常用命令
- 重构docker-compose.yml配置
- 增强docker-entrypoint.sh功能
- 改进Dockerfile多阶段构建
- 新增docker-deploy.sh一键部署脚本
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
b1bcedd5d5
|
fix(subtitle): 修复字幕处理逻辑并添加有效性检查
处理空字幕文件情况并改进错误处理
确保合并失败时有默认返回值
添加字幕文件有效性检查函数
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
81d8c55580
|
refactor: 移除未使用的代码文件和端口配置
清理未使用的控制器、测试文件和模型定义
移除Dockerfile中未使用的8080端口暴露
删除requirements.txt中的注释依赖
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
c41bd682a9
|
fix(音频处理): 修复音频混合时的音量问题
修复amix导致的音量稀释问题,为每个音频添加音量补偿
保持原声片段音量为1.0不变,确保与原视频一致
仅在需要时调整原声音量,避免不必要的修改
|
2025-12-12 11:36:04 +08:00 |
|
linyqh
|
9811607756
|
优化整合包bat启动脚本和环境检查
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
d8a06cc591
|
新增 azure 依赖
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
287cddcc35
|
refactor: 移除废弃脚本文件并更新项目版本至0.7.0
删除不再使用的脚本文件(check_gpu_cuda_cudnn.bat, changelog.py, main.py, release-notes.md, video_pipeline.py)
将项目版本从0.6.8更新至0.7.0,并同步更新config.example.toml中的版本号
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
bb7362809a
|
refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
07da580919
|
feat(llm): 添加gemini-2.5-flash支持并增强API调用可靠性
添加对gemini-2.5-flash模型的支持并更新示例配置
实现模型验证的严格/宽松模式配置
为API调用添加重试机制和超时配置
增加对更多HTTP错误状态码的处理
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
aebd169900
|
feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
a184662f8b
|
refactor: 移除视频字幕合并功能及相关代码
清理不再使用的视频字幕合并功能,包括删除合并设置组件、合并工具函数和相关的国际化文本
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
787d17a1a9
|
feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
e7db1668f8
|
feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
e389412dc2
|
feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
|
2025-12-12 11:36:04 +08:00 |
|
viccy
|
aff6aca00c
|
Update README.md
新增赞助
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
7ae4263943
|
更新提示词
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
cd3a5bc837
|
优化短剧解说画面匹配
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
4dc1448154
|
fix(logging): 注释掉调试信息的日志输出,优化日志记录
在clip_video.py和merger_video.py中,注释掉了成功处理视频的日志信息,以减少调试时的冗余输出。同时,在manager.py中更新了提示词渲染成功的日志格式,确保版本信息的清晰展示。这些更改旨在提升日志的可读性和有效性,优化调试过程。
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
33fc3dab10
|
feat(subtitle_analysis): 更新解说文案生成逻辑,增强字幕内容支持
在多个文件中重构了解说文案生成的实现,新增对原始字幕内容的支持,以提供准确的时间戳信息。更新了相关参数和提示词模板,优化了生成逻辑,提升了内容的准确性和用户体验。同时,注释部分进行了清理,去除了调试信息的输出。
|
2025-12-12 11:36:04 +08:00 |
|
linyqh
|
a15ab4c944
|
优化视频帧提取功能,新增超级兼容性方案以提高提取成功率,增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示,提升用户体验。
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
d83863182a
|
删除视频关键帧提取测试脚本,优化视频处理器中的提取逻辑,增加超级兼容性方案以解决Windows系统的MJPEG编码问题。更新了软件方案的提取命令,增强了错误处理和调试信息,提升了整体兼容性和用户体验。
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
1c8b526c3c
|
feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
|
2025-12-12 11:36:04 +08:00 |
|
linyq
|
4ca7ed9721
|
feat(config):更新配置文件
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
c7fdb3fc94
|
更新注释
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
9132e2b148
|
更新版本号 067
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
271401af99
|
feat(prompts): 更新解说文案生成要求以提升内容质量和逻辑性
在script_generation.py文件中,重写了解说文案的输出要求,强调线性时间链、角色细节描写和情感关联,确保所有内容严格源自<plot>,并合理安排解说与原片的比例。这些更改旨在提升解说文案的生动性和吸引力,增强用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
f70cfbab46
|
feat(llm): 增强解说文案生成和图片分析功能,优化JSON解析
在migration_adapter.py和generate_script_docu.py文件中,集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统,确保返回的JSON格式有效,并在图片分析中保持向后兼容性,提升了系统的灵活性和用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
5ef9f4a10c
|
feat(llm): 重构字幕分析和脚本生成流程,支持统一LLM服务
删除了旧的提示词文件,并在多个文件中更新了字幕分析和脚本生成的实现,集成了统一的LLM服务架构。新增了对服务提供商的支持,优化了API调用和JSON响应解析,提升了系统的灵活性和稳定性,确保了对不同LLM的兼容性,增强了用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
d55754c7fb
|
feat(prompts): 更新JSON格式输出以增强解析兼容性
在多个文件中修正了JSON格式输出,确保使用标准格式 `{` 和 `}`,并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力,确保输出的JSON格式有效且符合要求,增强了整体用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
e76031832c
|
feat(prompts): 更新提示词管理系统以增强解说文案生成
在migration_adapter.py、base.py和template.py文件中集成新的提示词管理系统,优化提示词构建过程,提升解说文案生成的灵活性和兼容性。通过使用PromptManager和自定义模板渲染器,确保系统在处理新格式的JSON输出时保持向后兼容性,增强整体用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
eadaf1be6e
|
feat(prompts): 引入新的提示词管理系统以优化解说文案生成
更新generate_narration_script.py、short_drama_explanation.py和step1_subtitle_analyzer_openai.py文件,集成新的提示词管理系统,提升解说文案和短剧分析的生成效率与准确性。通过使用PromptManager简化提示词构建过程,增强系统的灵活性和可维护性。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
79b0d613e3
|
feat(llm): 重构解说文案生成和视觉分析器,支持新的LLM服务架构
更新generate_narration_script.py、base.py和generate_short_summary.py文件,重构解说文案生成和视觉分析器的实现,优先使用新的LLM服务架构。添加回退机制以确保兼容性,增强系统的稳定性和用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
706d73383e
|
feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
2e0c492778
|
feat(audio): 增强音量管理和智能音量调整功能
更新AudioVolumeDefaults类,提升原声音量至1.2以平衡TTS音量,并允许最大音量达到2.0。新增智能音量调整功能,自动分析和调整音频轨道音量,确保音量在合理范围内。优化任务处理逻辑,结合用户设置和推荐音量配置,提升音频合成效果和用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyqh
|
13a87e2a00
|
新增bat脚本
|
2025-12-12 11:36:03 +08:00 |
|
linyqh
|
458071d583
|
feat(video): 优化视频裁剪和合并功能,增强硬件加速兼容性
更新编码器配置,优先使用纯NVENC编码器以避免滤镜链错误,确保视频裁剪和合并过程中的兼容性和性能。改进错误处理机制,智能分析FFmpeg错误类型并选择合适的回退方案,提升整体稳定性和用户体验。
|
2025-12-12 11:36:03 +08:00 |
|
linyqh
|
9c4b3338c2
|
feat(video): 增强视频裁剪功能,优化Windows兼容性和错误处理
新增安全编码器配置和FFmpeg命令构建函数,支持硬件加速类型的动态选择。改进裁剪过程中的错误处理,记录失败片段并提供回退编码方案,确保视频裁剪的可靠性和兼容性。
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
053212b182
|
chore: 更新项目版本号至0.6.5
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
6f48fa2563
|
feat(ffmpeg): 实现智能硬件加速检测和编码器选择
添加智能硬件加速检测功能,支持多平台和渐进式降级
优化编码器选择逻辑,根据硬件类型自动选择最优编码器
增加测试视频生成和清理功能,用于硬件加速兼容性测试
支持强制软件编码模式,提供更可靠的备选方案
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
18d2efd664
|
fix(字幕): 修复字幕开关功能无效的问题
添加subtitle_enabled参数控制字幕处理逻辑,当禁用时跳过字幕处理
修复字幕文件不存在时的日志级别为warning
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
70b8b49e41
|
feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
c3d855c547
|
优化版本号获取逻辑,直接从文件读取版本号,并简化发布说明生成流程
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
f740e5a4bd
|
更新版本号至0.6.2.5,调整发布说明生成逻辑,优化Discord通知格式,并删除不再使用的工作流文件
|
2025-12-12 11:36:03 +08:00 |
|
linyq
|
72165dbcd9
|
更新版本号至0.6.2.4,并增强发布说明生成和通知的调试信息
|
2025-12-12 11:36:03 +08:00 |
|