164 Commits

Author SHA1 Message Date
linyq
3fe8eb50c0 (webfeatui): 重构视觉分析功能并添加新模型支持
- 移除了对 QwenVL模型的特定逻辑,改为更通用的实现
- 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面,增加了新的模型选项
- 重构了测试连接和创建分析器的代码,提高了可维护性
- 调整了配置文件结构,简化了视觉模型的配置
2025-05-09 12:03:27 +08:00
linyq
afeeb7c516 refactor: 更新文本 API密钥
- 将 OpenAI 的 API 密钥从具体的值替换为占位符 "sk-xxx"
- 此修改旨在保护敏感信息,避免在代码中直接暴露真实密钥
2025-05-08 20:56:38 +08:00
linyq
fef3b3c8fd feat(subtitle): 添加字幕自定义位置功能
- 在 generate_video.py 中实现自定义字幕位置的逻辑
- 在 schema.py 中添加 custom_position 字段
- 更新 webui 组件以支持自定义位置设置
- 调整任务处理逻辑,支持新的自定义位置参数
2025-05-08 20:45:14 +08:00
linyq
b762bf8d93 refactor(app): 重构生成解说文案功能并支持 deepseek-reasoner 模型
- 引入 loguru 库用于日志记录
- 优化 API 请求流程,支持非 JSON 输出的模型- 更新 API 密钥和基础 URL
- 修改系统提示语以更符合短视频解说文案的需求
- 优化日志输出,使用 debug 级别记录 token 消耗
- 清理生成的解说文案中的多余字符
- 更新文档生成工具中的日志级别
2025-05-08 17:37:07 +08:00
linyq
dac23c7c31 (webfeatui): 重构并优化视频解说文案生成功能
-优化了基本设置组件,增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块,提高了代码可读性和可维护性
-改进了 generate_script_docu 工具,简化了文案生成流程- 添加了异常处理和日志记录,提高了系统稳定性
2025-05-08 17:02:02 +08:00
linyq
e1b694824b 在generate_script_docu.py中修正时间戳解析逻辑,支持新旧格式兼容,并确保分析结果以JSON格式保存到指定目录。移除冗余的日志输出,优化代码结构。 2025-05-08 15:13:13 +08:00
linyq
6c6ceeebea 优化qwenvl_analyzer.py中的base_url配置,移除默认值设置;在utils.py中新增format_time函数以支持秒数格式化为HH:MM:SS,mmm格式;在generate_script_docu.py中重构分析结果处理逻辑,合并批次分析结果并保存为JSON格式,同时兼容旧的文本格式输出。 2025-05-08 11:00:47 +08:00
linyqh
c2660c6983 更新混剪pyd文件 2025-05-08 00:46:45 +08:00
linyq
11a15b9b78 refactor(app): 优化视频路径处理逻辑
- 更新视频路径获取方式,支持Windows和Unix/Mac系统的路径格式
- 增加对路径中单引号的处理,确保路径正确性
- 简化代码逻辑,提高可读性
2025-05-08 00:42:06 +08:00
linyq
ce01c110be refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出,减少冗余信息
- 修改视频脚本 ID 获取方式
- 优化视频路径获取逻辑
- 移除未使用的导入
- 增加异常日志输出,提高错误排查效率
2025-05-08 00:13:19 +08:00
linyq
0ccb019f88 refactor(app): 重构视频剪辑功能并优化性能
- 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑
- 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则
- 调整了错误处理和日志记录方式
2025-05-07 23:08:26 +08:00
linyq
bacc1adfad feat(clip_video): 支持亚秒级视频裁剪
- 增加对带毫秒时间戳的支持
- 优化时间戳解析和格式化逻辑
- 调整FFmpeg命令以支持毫秒级精度
- 更新文件命名规则以适应新时间戳格式
- 修复相关服务和接口以确保兼容性
2025-05-07 20:35:47 +08:00
linyq
bc732c10fd feat(video): 更新视频剪辑逻辑,支持硬件加速和错误处理
- 添加视频存在性检查,避免处理不存在的源视频
- 引入硬件加速检测,优化视频剪辑性能
- 更新日志信息,提供更清晰的错误提示
- 移除不必要的资源释放代码,简化逻辑
2025-05-07 19:03:21 +08:00
linyq
2dc83bc18e perf(vision): 优化视觉分析流程和批量处理逻辑
- 移除了 vision_analysis_prompt 配置项
- 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑
- 更新了文档生成脚本和 UI 组件以适应新的分析流程
- 调整了视频帧提取相关函数,移除了不必要的 skip_seconds 参数
- 更新了中文翻译文件,添加了新的批处理大小相关提示
2025-05-07 18:44:37 +08:00
linyq
82823297f2 feat(script): 添加帧间隔输入参数并更新相关逻辑
- 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数,默认为 5
- 更新 VideoProcessor 的 process_video_pipeline 方法,调整帧提取间隔逻辑
- 修改前端界面,增加帧间隔输入框并更新相关翻译文本
- 优化 generate_script_docu 函数,使用新的帧间隔参数进行视频处理
2025-05-07 16:43:00 +08:00
linyq
f6c3f1640b 移除 opencv 和 sklearn 提取关键帧的代码 2025-05-07 15:41:01 +08:00
linyq
c3ea0bcc69 build: 更新依赖并重构部分代码
- 更新 moviepy 依赖版本
- 添加 edge-tts、streamlit 等新依赖
- 移除 g4f、dashscope 等未使用的依赖- 重构 merge_video.py 中的导入语句
- 注释掉 task.py 中的多个函数定义
2025-05-07 13:52:18 +08:00
linyq
3d9b4b6d93 refactor(app): 重构视频生成逻辑
- 更新导入路径:从 moviepy.editor 改为 moviepy
- 优化合并字幕、BGM、配音、视频的逻辑
- 移除硬编码路径,使用参数化配置
-简化字幕样式和音量配置
- 调整 generate_video 函数的参数结构
2025-05-07 13:17:53 +08:00
linyq
4bc20c2902 refactor(video): 重构视频合并功能
- 移除了 video.py 中的 combine_clip_videos 函数- 新增 generate_video.py 文件,实现更强大的视频生成功能
- 新增 merge_materials 函数,支持合并视频、音频、BGM 和字幕素材
- 优化了字幕处理和音频混合逻辑
- 增加了更多可配置选项,提高灵活性
2025-05-07 12:29:55 +08:00
linyq
e40046d05d fix(task): 修复合并视频路径问题
- 修复了 new_script_list 中没有 video 时的处理逻辑
- 使用 subclip_path_videos 中的视频进行合并
- 优化了视频合并路径的生成方式
2025-05-07 11:52:49 +08:00
linyq
ba4871715c feat(update_script): 添加视频路径并更新打印信息
- 在 item_copy 中初始化 video 字段为空字符串- 根据 item_id 或 orig_timestamp 在 video_result 中查找并添加视频路径
- 更新打印信息,增加视频路径输出
2025-05-07 11:34:46 +08:00
linyq
6001e8038f feat(subtitle): 实现字幕文件合并功能
- 重构 subtitle_merger.py,增加对 editedTimeRange 的解析和排序
- 更新 merge_subtitle_files 函数,支持处理字幕项列表
- 在 task.py 中集成字幕合并逻辑
2025-05-07 11:32:11 +08:00
linyq
fcf568963a feat(update_script): 添加成品视频时间范围计算功能
- 在 update_script_timestamps 函数中添加 calculate_edited_timerange 参数
- 实现成品视频时间范围的计算并添加到脚本列表中
- 修改输出格式,增加 EditedTimeRange 字段
2025-05-07 11:09:21 +08:00
linyq
ecab257b75 refactor(task): 重构任务处理流程
- 修改音频合并文件名
- 优化视频裁剪结果处理
- 更新脚本处理逻辑,支持字幕路径
- 调整 TTS 多重处理函数,移除未使用的参数
2025-05-07 11:05:43 +08:00
linyq
aaea6d913c refactor(task): 重构任务处理流程
- 修改音频合并文件名
- 优化视频裁剪结果处理
- 更新脚本处理逻辑,支持字幕路径
- 调整 TTS 多重处理函数,移除未使用的参数
2025-05-07 11:00:22 +08:00
linyq
8b5ff0658b feat(task): 优化脚本时间戳更新逻辑并添加音频路径- 修改 update_script_timestamps 函数,支持同时更新视频和音频路径
- 在任务处理流程中生成 tts_clip_result 字典,用于更新脚本中的音频路径
-优化脚本列表的更新逻辑,确保所有时间戳都计算持续时间
2025-05-07 00:59:07 +08:00
linyq
5c4ff41274 refactor(task): 重构任务处理流程并添加新功能
- 更新了音频合并逻辑,现在基于脚本中的 duration 字段
- 添加了视频裁剪步骤,根据音频长度调整视频
- 新增了 update_script 模块,用于更新脚本中的时间戳和持续时间
- 优化了任务处理流程,提高了代码可读性和可维护性
2025-05-07 00:26:59 +08:00
linyq
2ed627890f feat(video): 增加4:3 画幅视频合并功能
- 在 VideoAspect 枚举中添加 landscape_2 (4:3) 和 portrait_2 (3:4) 选项
- 更新 combine_clip_videos 函数,支持 4:3 画幅的视频合并
- 修改任务处理流程,使用新的 merger_video 模块进行视频合并
2025-05-06 22:22:20 +08:00
linyq
c2711b97c7 refactor(app): 优化视频合并服务
- 移除了未使用的日志设置代码
- 替换 logging 为 loguru 库以简化日志记录
- 删除了多余的类型导入
- 移除了处理视频时不必要的日志信息
2025-05-06 21:53:01 +08:00
linyq
2914cd924d feat(task): 重构视频剪辑流程并添加新功能
-重构了 start_subclip 函数,优化了视频剪辑流程
- 新增 clip_video 函数,用于裁剪视频片段
- 改进了字幕生成和处理逻辑- 优化了音频合并和处理
- 更新了任务状态管理
2025-05-06 21:43:20 +08:00
linyq
42151f8766 更新文档/升级 faster-whisper 至 v3 2025-04-26 14:21:37 +08:00
linyq
5f778d5b15 更新 macos arm SDP文件 2025-04-14 09:59:14 +08:00
linyqh
bc236cd195 更新配置文件和Web界面,支持自定义短剧混剪片段
- 将项目版本更新至0.5.3
- 修改视觉大模型提供商为qwenvl,并更新相关API密钥和模型名称
- 新增DeepSeek API支持,更新文本生成模型设置
- 在Web界面中添加短视频生成模式的选项,调整脚本设置以支持自定义片段数量
- 修改代理设置的默认值为False
2025-04-13 14:07:35 +08:00
linyq
a9d4208352 feat(webui): 更新文案生成模型设置支持 DeepSeek
- 更新 mac 版本
2025-03-06 09:58:54 +08:00
linyqh
074f1d103b feat(webui): 更新文案生成模型设置支持 DeepSeek
- 调整文本生成模型提供商顺序,将 DeepSeek 置顶
- 修改 DeepSeek API 基础 URL 和模型名称
- 移除短剧混剪功能中的模型限制描述
2025-03-06 01:52:26 +08:00
linyq
e3b5fa4d0e feat(audio): 本地测试-1
- 调整背景音乐音量默认值为 0.3- 优化任务服务中的音量配置逻辑
- 更新视频生成服务,移除默认音量配置- 在 WebUI 中添加原声音量设置并更新相关参数
2024-12-11 15:19:17 +08:00
linyq
11a4cf0900 (subfeattitle): 优化字幕功能并增加位置设置
- 调整音频设置的滑块范围和默认值
- 修复生成脚本短片功能的导入问题
- 优化字幕设置界面,增加字幕位置选项- 改进字幕渲染逻辑,支持多种位置配置
- 调整视频设置中的原始音量滑块范围和默认值
2024-12-11 11:51:02 +08:00
linyq
c065800072 feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
2024-12-10 18:33:44 +08:00
linyq
36e6018c74 refactor(webui): 降级 httpx==0.27.2
- 解决 Client.__init__() got an unexpected keyword argument 'proxies' 报错
2024-12-06 18:39:33 +08:00
linyq
65d5a681ac feat(webui): 视频合并添加一键转录功能
-改进文件上传和预览逻辑,支持视频和字幕文件的独立上传
- 添加字幕预览功能,可显示已上传字幕文件的内容
- 实现一键转录功能,为没有字幕的视频生成字幕
-优化合并文件的流程,提高合并效率
- 增加合并结果预览,方便用户查看合并后的视频和字幕
-重构代码,提高可维护性和可扩展性
2024-12-06 18:01:14 +08:00
linyqh
f44d56110e feat(vision): 添加 QwenVL 视觉分析支持
- 新增 QwenVL 视觉分析器类,实现对阿里云 Qwen 模型的支持
- 更新基础设置界面,增加代理配置和 QwenVL 模型可用性检测
- 修改脚本生成逻辑,支持 QwenVL 模型的图像分析
- 重构视觉分析器初始化和调用接口,提高代码复用性和可维护性
2024-12-05 21:43:26 +08:00
linyqh
0caa15e762 build: 添加 pysrt 字幕处理库 2024-12-05 20:27:01 +08:00
linyqh
52180d49c9 feat(merge): 合并视频字幕
- 新增 merge_settings 组件用于视频字幕合并设置
- 实现视频和字幕文件的上传、匹配和排序功能
- 添加合并视频和字幕的逻辑,支持多文件合并- 优化用户界面,增加预览和错误处理功能
2024-12-05 00:56:09 +08:00
linyqh
1a332c72bb refactor(video): 可以剪辑短剧
- 添加多个视频处理相关函数,提高代码可复用性
- 优化日志输出,增加中文注释,提高代码可读性
-调整视频处理流程,提升效率和准确性
- 修复部分函数的参数类型和返回值类型
2024-12-04 01:56:42 +08:00
linyqh
bd879079c3 refactor(video): moviepy==2.0.0.dev2 这个版本往后变更很大
- 移除了不必要的缓存目录创建逻辑
- 优化了字幕处理流程
-重构了音频处理逻辑,支持多音轨混合
- 删除了未使用的函数和冗余代码
- 增加了参数验证和错误处理
2024-12-04 01:11:38 +08:00
linyqh
0bb811ea79 refactor(voice): 优化 Edge TTS 音频生成逻辑- 重构了 Edge TTS音频生成函数,提高了代码可读性和错误处理能力
-增加了重试机制,提高了生成音频的可靠性
-优化了日志输出,提供了更详细的错误信息和生成进度
- 删除了不必要的测试代码和注释,精简了代码结构
2024-12-03 23:24:20 +08:00
linyqh
9efccea97f refactor(app): 优化视频剪辑函数(毫秒+缓存目录)
- 优化时间格式处理,支持更灵活的时间输入- 改进视频缓存目录结构,基于原视频生成哈希值
- 优化日志输出和错误处理
- 调整合并视频功能,移除未使用的示例代码
- 修复了一些与时间戳相关的小问题
2024-12-03 22:26:54 +08:00
linyqh
974a219dd3 refactor(script): 优化脚本生成中的时间戳处理(毫秒级)
- 重构 calculate_duration_and_word_count 函数,提高时间戳解析精度到毫秒级
- 更新 get_batch_timestamps 函数,支持毫秒级时间戳格式- 优化字数计算公式,调整为每0.4秒一个字,并限制在10-500字范围内
-增加日志输出,提高代码可调试性
2024-12-03 21:37:33 +08:00
linyqh
f6ba1824e9 feat(video): 提升关键帧时间戳精度到毫秒
- 将关键帧时间戳精确到毫秒,格式为 HHMMSSmmm
- 优化场景检测算法,增加帧数检查和未检测到边界时的处理
-调整帧差计算方式,使用浮点数提高精度
- 修改文件名格式匹配规则,支持毫秒级时间戳
2024-12-03 21:19:49 +08:00
linyq
8fb7617c9b feat(utils): 优化时间戳处理并支持毫秒级精度
- 重构了时间戳转换函数,支持 HH:MM:SS,mmm 格式
- 优化了时间戳计算逻辑,提高了精度- 更新了相关服务和工具类中的时间戳处理方法
2024-11-27 23:26:43 +08:00