29 Commits

Author SHA1 Message Date
linyq
d7b1b51a36 fix: 使用 litellm 管理模型供应商 2025-12-12 11:40:44 +08:00
linyq
33fc3dab10 feat(subtitle_analysis): 更新解说文案生成逻辑,增强字幕内容支持
在多个文件中重构了解说文案生成的实现,新增对原始字幕内容的支持,以提供准确的时间戳信息。更新了相关参数和提示词模板,优化了生成逻辑,提升了内容的准确性和用户体验。同时,注释部分进行了清理,去除了调试信息的输出。
2025-12-12 11:36:04 +08:00
linyqh
a15ab4c944 优化视频帧提取功能,新增超级兼容性方案以提高提取成功率,增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示,提升用户体验。 2025-12-12 11:36:04 +08:00
linyq
1c8b526c3c feat(video_processor): 优化视频帧提取功能,增强Windows系统兼容性
在video_processor.py中,添加了对Windows N卡硬件加速的支持,优化了帧提取过程,改进了提取成功率的统计和错误处理。同时,在generate_script_docu.py中,增强了对硬件加速失败的处理逻辑,提供了详细的错误信息和解决建议,提升了用户体验。
2025-12-12 11:36:04 +08:00
linyq
f70cfbab46 feat(llm): 增强解说文案生成和图片分析功能,优化JSON解析
在migration_adapter.py和generate_script_docu.py文件中,集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统,确保返回的JSON格式有效,并在图片分析中保持向后兼容性,提升了系统的灵活性和用户体验。
2025-12-12 11:36:03 +08:00
linyq
5ef9f4a10c feat(llm): 重构字幕分析和脚本生成流程,支持统一LLM服务
删除了旧的提示词文件,并在多个文件中更新了字幕分析和脚本生成的实现,集成了统一的LLM服务架构。新增了对服务提供商的支持,优化了API调用和JSON响应解析,提升了系统的灵活性和稳定性,确保了对不同LLM的兼容性,增强了用户体验。
2025-12-12 11:36:03 +08:00
linyq
d55754c7fb feat(prompts): 更新JSON格式输出以增强解析兼容性
在多个文件中修正了JSON格式输出,确保使用标准格式 `{` 和 `}`,并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力,确保输出的JSON格式有效且符合要求,增强了整体用户体验。
2025-12-12 11:36:03 +08:00
linyq
79b0d613e3 feat(llm): 重构解说文案生成和视觉分析器,支持新的LLM服务架构
更新generate_narration_script.py、base.py和generate_short_summary.py文件,重构解说文案生成和视觉分析器的实现,优先使用新的LLM服务架构。添加回退机制以确保兼容性,增强系统的稳定性和用户体验。
2025-12-12 11:36:03 +08:00
linyq
706d73383e feat: 更新作者信息并增强API配置验证功能
在基础设置中新增API密钥、基础URL和模型名称的验证功能,确保用户输入的配置有效性,提升系统的稳定性和用户体验。
2025-12-12 11:36:03 +08:00
linyq
716b22ef9a feat(SDE): 优化剧情分析提示词和解说文案生成
- 在 generate_short_summary.py 中添加 temperature 参数,用于控制生成文案的随机性- 修改 prompt.py 中的段落数要求,改为与字幕长度成正比
- 在 short_drama_explanation.py 中添加日志输出,记录使用的模型和温度
2025-12-12 11:35:44 +08:00
linyq
342a4ac1a8 refactor(webui): 修复合并视频与字幕功能
- 注释掉 merge_settings.py 中的一键转录功能
- 更新 base.py 中的 API URL
- 在 merge_video.py 中添加 pysrt导入
- 更新 requirements.txt,添加 pysrt 依赖
- 修改 zh.json 中的缺失字幕文件提示信息
2025-05-12 10:55:17 +08:00
linyq
2ef42fda46 feat(webui): 优化短剧解说功能
- 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数
- 修改 prompt 模板以包含短剧名称
- 调整组件渲染顺序,提高用户体验
2025-05-11 00:13:56 +08:00
linyq
6cd1ff8b68 refactor(tools): 移除调试日志和未使用的参数- 在 base.py 中移除了调试日志,以减少日志噪音
- 在 generate_script_short.py 中移除了未使用的参数,简化了 API 调用
2025-05-10 23:57:15 +08:00
linyq
f5c4e93fcd feat(webui): 添加短剧解说功能
- 新增短剧解说页面和相关功能
- 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能
- 优化用户交互和错误处理
2025-05-10 23:37:58 +08:00
linyq
e66a5969f0 actorref(tools): 重构工具模块并添加日志记录功能- 在 base.py 中添加了调试日志记录视频参数
- 修改了 generate_script_docu.py 和 generate_script_short.py 中的视觉和文本分析参数处理逻辑
- 优化了参数传递和视觉分析器实例创建过程
- 在 generate_script_docu.py 中添加了视频配置检查函数调用
2025-05-10 16:45:25 +08:00
linyq
3fe8eb50c0 (webfeatui): 重构视觉分析功能并添加新模型支持
- 移除了对 QwenVL模型的特定逻辑,改为更通用的实现
- 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面,增加了新的模型选项
- 重构了测试连接和创建分析器的代码,提高了可维护性
- 调整了配置文件结构,简化了视觉模型的配置
2025-05-09 12:03:27 +08:00
linyq
b762bf8d93 refactor(app): 重构生成解说文案功能并支持 deepseek-reasoner 模型
- 引入 loguru 库用于日志记录
- 优化 API 请求流程,支持非 JSON 输出的模型- 更新 API 密钥和基础 URL
- 修改系统提示语以更符合短视频解说文案的需求
- 优化日志输出,使用 debug 级别记录 token 消耗
- 清理生成的解说文案中的多余字符
- 更新文档生成工具中的日志级别
2025-05-08 17:37:07 +08:00
linyq
dac23c7c31 (webfeatui): 重构并优化视频解说文案生成功能
-优化了基本设置组件,增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块,提高了代码可读性和可维护性
-改进了 generate_script_docu 工具,简化了文案生成流程- 添加了异常处理和日志记录,提高了系统稳定性
2025-05-08 17:02:02 +08:00
linyq
e1b694824b 在generate_script_docu.py中修正时间戳解析逻辑,支持新旧格式兼容,并确保分析结果以JSON格式保存到指定目录。移除冗余的日志输出,优化代码结构。 2025-05-08 15:13:13 +08:00
linyq
017f398cb1 在generate_script_docu.py中新增时间戳功能,优化分析结果保存逻辑,确保分析结果以JSON格式保存到指定目录,并记录保存路径。移除旧的文本格式输出逻辑,简化代码结构。 2025-05-08 11:23:34 +08:00
linyq
6c6ceeebea 优化qwenvl_analyzer.py中的base_url配置,移除默认值设置;在utils.py中新增format_time函数以支持秒数格式化为HH:MM:SS,mmm格式;在generate_script_docu.py中重构分析结果处理逻辑,合并批次分析结果并保存为JSON格式,同时兼容旧的文本格式输出。 2025-05-08 11:00:47 +08:00
linyq
2dc83bc18e perf(vision): 优化视觉分析流程和批量处理逻辑
- 移除了 vision_analysis_prompt 配置项
- 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑
- 更新了文档生成脚本和 UI 组件以适应新的分析流程
- 调整了视频帧提取相关函数,移除了不必要的 skip_seconds 参数
- 更新了中文翻译文件,添加了新的批处理大小相关提示
2025-05-07 18:44:37 +08:00
linyq
82823297f2 feat(script): 添加帧间隔输入参数并更新相关逻辑
- 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数,默认为 5
- 更新 VideoProcessor 的 process_video_pipeline 方法,调整帧提取间隔逻辑
- 修改前端界面,增加帧间隔输入框并更新相关翻译文本
- 优化 generate_script_docu 函数,使用新的帧间隔参数进行视频处理
2025-05-07 16:43:00 +08:00
linyq
f6c3f1640b 移除 opencv 和 sklearn 提取关键帧的代码 2025-05-07 15:41:01 +08:00
linyqh
bc236cd195 更新配置文件和Web界面,支持自定义短剧混剪片段
- 将项目版本更新至0.5.3
- 修改视觉大模型提供商为qwenvl,并更新相关API密钥和模型名称
- 新增DeepSeek API支持,更新文本生成模型设置
- 在Web界面中添加短视频生成模式的选项,调整脚本设置以支持自定义片段数量
- 修改代理设置的默认值为False
2025-04-13 14:07:35 +08:00
linyq
11a4cf0900 (subfeattitle): 优化字幕功能并增加位置设置
- 调整音频设置的滑块范围和默认值
- 修复生成脚本短片功能的导入问题
- 优化字幕设置界面,增加字幕位置选项- 改进字幕渲染逻辑,支持多种位置配置
- 调整视频设置中的原始音量滑块范围和默认值
2024-12-11 11:51:02 +08:00
linyq
c065800072 feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
2024-12-10 18:33:44 +08:00
linyq
36e6018c74 refactor(webui): 降级 httpx==0.27.2
- 解决 Client.__init__() got an unexpected keyword argument 'proxies' 报错
2024-12-06 18:39:33 +08:00
linyq
d2f724217c refactor(webui): 重构视频脚本生成-目录结果
- 将视频脚本生成相关代码从 script_settings.py 移动到新的 generate_script_docu.py 文件
- 新增 base.py 文件,提取公共工具函数
- 优化代码结构,提高可维护性和可读性- 重构函数名称,更清晰地反映功能
2024-12-06 18:18:23 +08:00