292 Commits

Author SHA1 Message Date
viccy
539dc7f27a
Merge pull request #170 from linyqh/dev071
Dev071
v0.7.1
2025-08-18 14:52:15 +08:00
linyq
e22cf0241c dev0.7.1 预发布 2025-08-18 14:48:40 +08:00
linyq
ced37047aa refactor(docker): 优化docker配置和部署脚本
重构Docker相关配置,包括:
- 更新.dockerignore文件,增加更多忽略规则
- 优化requirements.txt依赖管理
- 新增Makefile提供常用命令
- 重构docker-compose.yml配置
- 增强docker-entrypoint.sh功能
- 改进Dockerfile多阶段构建
- 新增docker-deploy.sh一键部署脚本
2025-08-16 01:52:28 +08:00
linyq
2569b7fee7 fix(subtitle): 修复字幕处理逻辑并添加有效性检查
处理空字幕文件情况并改进错误处理
确保合并失败时有默认返回值
添加字幕文件有效性检查函数
2025-08-16 01:24:56 +08:00
linyq
1fba4414aa refactor: 移除未使用的代码文件和端口配置
清理未使用的控制器、测试文件和模型定义
移除Dockerfile中未使用的8080端口暴露
删除requirements.txt中的注释依赖
2025-08-16 01:16:05 +08:00
linyq
e9d0c013ef fix(音频处理): 修复音频混合时的音量问题
修复amix导致的音量稀释问题,为每个音频添加音量补偿
保持原声片段音量为1.0不变,确保与原视频一致
仅在需要时调整原声音量,避免不必要的修改
2025-08-16 00:57:35 +08:00
viccy
cb02f2c897
Merge pull request #167 from linyqh/dev0.7
Dev0.7
v0.7.0
2025-08-03 21:34:21 +08:00
linyqh
8e933ff629 优化整合包bat启动脚本和环境检查 2025-08-03 21:29:16 +08:00
linyq
b1f2cd37ed 新增 azure 依赖 2025-08-03 20:29:07 +08:00
linyq
0d49812ad2 refactor: 移除废弃脚本文件并更新项目版本至0.7.0
删除不再使用的脚本文件(check_gpu_cuda_cudnn.bat, changelog.py, main.py, release-notes.md, video_pipeline.py)
将项目版本从0.6.8更新至0.7.0,并同步更新config.example.toml中的版本号
2025-08-03 20:27:34 +08:00
linyq
60e01bf6f2 refactor: 移除视频审查功能及相关代码
删除不再使用的视频审查功能,包括移除相关面板组件、i18n翻译条目和主程序中的调用
2025-08-03 20:15:26 +08:00
linyq
864ebea1be feat(llm): 添加gemini-2.5-flash支持并增强API调用可靠性
添加对gemini-2.5-flash模型的支持并更新示例配置
实现模型验证的严格/宽松模式配置
为API调用添加重试机制和超时配置
增加对更多HTTP错误状态码的处理
2025-08-03 20:06:14 +08:00
linyq
062d317261 feat(tts): 添加多引擎TTS支持并重构语音设置界面
- 新增Azure Speech Services和Edge TTS引擎支持
- 重构语音设置界面,支持不同引擎的独立配置
- 添加引擎选择器和详细说明
- 更新requirements.txt添加azure-cognitiveservices-speech依赖
- 改进音色名称验证逻辑
2025-08-03 18:45:33 +08:00
linyq
e59fd6030c refactor: 移除视频字幕合并功能及相关代码
清理不再使用的视频字幕合并功能,包括删除合并设置组件、合并工具函数和相关的国际化文本
2025-08-03 17:12:07 +08:00
linyq
184286e5e0 feat(script): 合并脚本保存与格式验证功能
重构脚本保存流程,将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能,包括字段类型、格式和必填项验证。
2025-08-03 17:06:55 +08:00
linyq
cd1ee1441e feat(video): 实现统一视频裁剪策略并移除旧逻辑
重构视频处理流程,引入基于OST类型的统一裁剪策略:
- 新增 clip_video_unified 函数处理三种OST类型
- 移除预裁剪步骤和相关UI组件
- 优化任务处理流程,减少重复裁剪
- 添加详细的错误处理和日志记录
2025-08-03 16:34:13 +08:00
linyq
e1f45db95a feat(tts): 添加 SoulVoice TTS 引擎支持
实现 SoulVoice TTS 引擎集成,包括配置管理、语音选择、API 调用和字幕处理
新增 SoulVoice 配置项和示例配置
修改音频设置面板以支持 SoulVoice 选项
优化音频时长计算和异常处理
更新多语言文案以反映 SoulVoice 支持
2025-08-03 04:26:42 +08:00
viccy
06cbee0654
Update README.md
新增赞助
2025-07-15 18:12:25 +08:00
linyq
2d4fe3399a 更新提示词 2025-07-12 16:13:15 +08:00
linyq
ae51a9f3a9 优化短剧解说画面匹配 v0.6.8 2025-07-12 02:28:22 +08:00
linyq
6d8cc671ab fix(logging): 注释掉调试信息的日志输出,优化日志记录
在clip_video.py和merger_video.py中,注释掉了成功处理视频的日志信息,以减少调试时的冗余输出。同时,在manager.py中更新了提示词渲染成功的日志格式,确保版本信息的清晰展示。这些更改旨在提升日志的可读性和有效性,优化调试过程。
2025-07-12 02:27:51 +08:00
linyq
e3a5e34c78 feat(subtitle_analysis): 更新解说文案生成逻辑,增强字幕内容支持
在多个文件中重构了解说文案生成的实现,新增对原始字幕内容的支持,以提供准确的时间戳信息。更新了相关参数和提示词模板,优化了生成逻辑,提升了内容的准确性和用户体验。同时,注释部分进行了清理,去除了调试信息的输出。
2025-07-11 23:25:44 +08:00
linyqh
c61462d706 优化视频帧提取功能,新增超级兼容性方案以提高提取成功率,增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示,提升用户体验。 2025-07-07 21:33:25 +08:00
linyq
6270224d45 删除视频关键帧提取测试脚本,优化视频处理器中的提取逻辑,增加超级兼容性方案以解决Windows系统的MJPEG编码问题。更新了软件方案的提取命令,增强了错误处理和调试信息,提升了整体兼容性和用户体验。 2025-07-07 21:12:24 +08:00
linyq
6715c29057 feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
2025-07-07 20:48:36 +08:00
linyq
a65e8e4a95 feat(config):更新配置文件 2025-07-07 19:22:33 +08:00
viccy
63375883c2
Merge pull request #157 from linyqh/dev066
Dev067 重构 LLM 管理器和提示词管理器
v0.6.7
2025-07-07 18:58:44 +08:00
linyq
6e0d7f6971 更新注释 2025-07-07 18:57:35 +08:00
linyq
c9555f253d 更新版本号 067 2025-07-07 18:55:02 +08:00
linyq
9982a2b70d feat(prompts): 更新解说文案生成要求以提升内容质量和逻辑性
在script_generation.py文件中,重写了解说文案的输出要求,强调线性时间链、角色细节描写和情感关联,确保所有内容严格源自<plot>,并合理安排解说与原片的比例。这些更改旨在提升解说文案的生动性和吸引力,增强用户体验。
2025-07-07 18:25:06 +08:00
linyq
8b71cba9fd feat(llm): 增强解说文案生成和图片分析功能,优化JSON解析
在migration_adapter.py和generate_script_docu.py文件中,集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统,确保返回的JSON格式有效,并在图片分析中保持向后兼容性,提升了系统的灵活性和用户体验。
2025-07-07 18:17:15 +08:00
linyq
2f6c1eb88b feat(llm): 重构字幕分析和脚本生成流程,支持统一LLM服务
删除了旧的提示词文件,并在多个文件中更新了字幕分析和脚本生成的实现,集成了统一的LLM服务架构。新增了对服务提供商的支持,优化了API调用和JSON响应解析,提升了系统的灵活性和稳定性,确保了对不同LLM的兼容性,增强了用户体验。
2025-07-07 18:03:48 +08:00
linyq
8ad81d27b6 feat(prompts): 更新JSON格式输出以增强解析兼容性
在多个文件中修正了JSON格式输出,确保使用标准格式 `{` 和 `}`,并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力,确保输出的JSON格式有效且符合要求,增强了整体用户体验。
2025-07-07 17:45:34 +08:00
linyq
9a2d9cae9b feat(prompts): 更新提示词管理系统以增强解说文案生成
在migration_adapter.py、base.py和template.py文件中集成新的提示词管理系统,优化提示词构建过程,提升解说文案生成的灵活性和兼容性。通过使用PromptManager和自定义模板渲染器,确保系统在处理新格式的JSON输出时保持向后兼容性,增强整体用户体验。
2025-07-07 17:30:43 +08:00
linyq
dbbb06eda8 feat(prompts): 引入新的提示词管理系统以优化解说文案生成
更新generate_narration_script.py、short_drama_explanation.py和step1_subtitle_analyzer_openai.py文件,集成新的提示词管理系统,提升解说文案和短剧分析的生成效率与准确性。通过使用PromptManager简化提示词构建过程,增强系统的灵活性和可维护性。
2025-07-07 17:13:54 +08:00
linyq
7309208282 feat(llm): 重构解说文案生成和视觉分析器,支持新的LLM服务架构
更新generate_narration_script.py、base.py和generate_short_summary.py文件,重构解说文案生成和视觉分析器的实现,优先使用新的LLM服务架构。添加回退机制以确保兼容性,增强系统的稳定性和用户体验。
2025-07-07 16:33:26 +08:00
linyq
dd59d5295d feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
2025-07-07 15:40:34 +08:00
viccy
5b04531b48
Merge pull request #156 from linyqh/dev066
feat(audio): 修复 window 平台 ffmpeg 硬件加速兼容性
2025-07-07 10:58:04 +08:00
linyq
04ffda297f feat(audio): 增强音量管理和智能音量调整功能
更新AudioVolumeDefaults类,提升原声音量至1.2以平衡TTS音量,并允许最大音量达到2.0。新增智能音量调整功能,自动分析和调整音频轨道音量,确保音量在合理范围内。优化任务处理逻辑,结合用户设置和推荐音量配置,提升音频合成效果和用户体验。
2025-07-07 10:44:19 +08:00
linyqh
e7ad308875 Merge branch 'main' of https://github.com/linyqh/NarratoAI 2025-07-07 02:21:09 +08:00
linyqh
c252b2a782 feat(video): 优化视频裁剪和合并功能,增强硬件加速兼容性
更新编码器配置,优先使用纯NVENC编码器以避免滤镜链错误,确保视频裁剪和合并过程中的兼容性和性能。改进错误处理机制,智能分析FFmpeg错误类型并选择合适的回退方案,提升整体稳定性和用户体验。
2025-07-07 02:21:02 +08:00
linyqh
13ed28626f feat(video): 增强视频裁剪功能,优化Windows兼容性和错误处理
新增安全编码器配置和FFmpeg命令构建函数,支持硬件加速类型的动态选择。改进裁剪过程中的错误处理,记录失败片段并提供回退编码方案,确保视频裁剪的可靠性和兼容性。
2025-07-06 23:45:37 +08:00
linyqh
db2696f1b6 Merge branch 'main' of github.com:linyqh/NarratoAI 2025-07-06 23:03:33 +08:00
viccy
d3df2931c4
Merge pull request #153 from linyqh/dev065
修复历史遗留 bug
v0.6.5
2025-07-03 00:04:13 +08:00
linyq
b3021f4f3c chore: 更新项目版本号至0.6.5 2025-07-03 00:03:21 +08:00
linyq
57601e164f feat(ffmpeg): 实现智能硬件加速检测和编码器选择
添加智能硬件加速检测功能,支持多平台和渐进式降级
优化编码器选择逻辑,根据硬件类型自动选择最优编码器
增加测试视频生成和清理功能,用于硬件加速兼容性测试
支持强制软件编码模式,提供更可靠的备选方案
2025-07-02 18:35:49 +08:00
linyq
06148a6b8c fix(字幕): 修复字幕开关功能无效的问题
添加subtitle_enabled参数控制字幕处理逻辑,当禁用时跳过字幕处理
修复字幕文件不存在时的日志级别为warning
2025-07-02 18:16:44 +08:00
linyq
1792311ef4 feat(audio): 统一音量配置并修复原声音量默认值问题
引入AudioVolumeDefaults类集中管理音量配置,确保全局一致性
修复原声音量默认值为0.7以解决短剧解说模式问题
添加音量验证和详细日志便于调试
2025-07-02 17:54:00 +08:00
linyq
7a8de5e791 优化版本号获取逻辑,直接从文件读取版本号,并简化发布说明生成流程 v0.6.3 2025-05-19 10:18:54 +08:00
linyq
6e10adfecb 更新版本号至0.6.2.5,调整发布说明生成逻辑,优化Discord通知格式,并删除不再使用的工作流文件 v0.6.2.5 2025-05-19 09:59:26 +08:00