91 Commits

Author SHA1 Message Date
linyq
ecab257b75 refactor(task): 重构任务处理流程
- 修改音频合并文件名
- 优化视频裁剪结果处理
- 更新脚本处理逻辑,支持字幕路径
- 调整 TTS 多重处理函数,移除未使用的参数
2025-05-07 11:05:43 +08:00
linyq
aaea6d913c refactor(task): 重构任务处理流程
- 修改音频合并文件名
- 优化视频裁剪结果处理
- 更新脚本处理逻辑,支持字幕路径
- 调整 TTS 多重处理函数,移除未使用的参数
2025-05-07 11:00:22 +08:00
linyq
8b5ff0658b feat(task): 优化脚本时间戳更新逻辑并添加音频路径- 修改 update_script_timestamps 函数,支持同时更新视频和音频路径
- 在任务处理流程中生成 tts_clip_result 字典,用于更新脚本中的音频路径
-优化脚本列表的更新逻辑,确保所有时间戳都计算持续时间
2025-05-07 00:59:07 +08:00
linyq
5c4ff41274 refactor(task): 重构任务处理流程并添加新功能
- 更新了音频合并逻辑,现在基于脚本中的 duration 字段
- 添加了视频裁剪步骤,根据音频长度调整视频
- 新增了 update_script 模块,用于更新脚本中的时间戳和持续时间
- 优化了任务处理流程,提高了代码可读性和可维护性
2025-05-07 00:26:59 +08:00
linyq
2ed627890f feat(video): 增加4:3 画幅视频合并功能
- 在 VideoAspect 枚举中添加 landscape_2 (4:3) 和 portrait_2 (3:4) 选项
- 更新 combine_clip_videos 函数,支持 4:3 画幅的视频合并
- 修改任务处理流程,使用新的 merger_video 模块进行视频合并
2025-05-06 22:22:20 +08:00
linyq
c2711b97c7 refactor(app): 优化视频合并服务
- 移除了未使用的日志设置代码
- 替换 logging 为 loguru 库以简化日志记录
- 删除了多余的类型导入
- 移除了处理视频时不必要的日志信息
2025-05-06 21:53:01 +08:00
linyq
2914cd924d feat(task): 重构视频剪辑流程并添加新功能
-重构了 start_subclip 函数,优化了视频剪辑流程
- 新增 clip_video 函数,用于裁剪视频片段
- 改进了字幕生成和处理逻辑- 优化了音频合并和处理
- 更新了任务状态管理
2025-05-06 21:43:20 +08:00
linyq
42151f8766 更新文档/升级 faster-whisper 至 v3 2025-04-26 14:21:37 +08:00
linyq
5f778d5b15 更新 macos arm SDP文件 2025-04-14 09:59:14 +08:00
linyqh
bc236cd195 更新配置文件和Web界面,支持自定义短剧混剪片段
- 将项目版本更新至0.5.3
- 修改视觉大模型提供商为qwenvl,并更新相关API密钥和模型名称
- 新增DeepSeek API支持,更新文本生成模型设置
- 在Web界面中添加短视频生成模式的选项,调整脚本设置以支持自定义片段数量
- 修改代理设置的默认值为False
2025-04-13 14:07:35 +08:00
linyq
a9d4208352 feat(webui): 更新文案生成模型设置支持 DeepSeek
- 更新 mac 版本
2025-03-06 09:58:54 +08:00
linyqh
074f1d103b feat(webui): 更新文案生成模型设置支持 DeepSeek
- 调整文本生成模型提供商顺序,将 DeepSeek 置顶
- 修改 DeepSeek API 基础 URL 和模型名称
- 移除短剧混剪功能中的模型限制描述
2025-03-06 01:52:26 +08:00
linyq
e3b5fa4d0e feat(audio): 本地测试-1
- 调整背景音乐音量默认值为 0.3- 优化任务服务中的音量配置逻辑
- 更新视频生成服务,移除默认音量配置- 在 WebUI 中添加原声音量设置并更新相关参数
2024-12-11 15:19:17 +08:00
linyq
11a4cf0900 (subfeattitle): 优化字幕功能并增加位置设置
- 调整音频设置的滑块范围和默认值
- 修复生成脚本短片功能的导入问题
- 优化字幕设置界面,增加字幕位置选项- 改进字幕渲染逻辑,支持多种位置配置
- 调整视频设置中的原始音量滑块范围和默认值
2024-12-11 11:51:02 +08:00
linyq
c065800072 feat(webui): 大改动标记1
-重构音频设置面板,增加语音音量、背景音乐等设置
- 添加背景音乐文件选择功能
- 优化字幕设置,支持自定义字体和样式
-调整视频生成流程,支持新音频设置
- 更新文档示例,反映新功能
2024-12-10 18:33:44 +08:00
linyq
36e6018c74 refactor(webui): 降级 httpx==0.27.2
- 解决 Client.__init__() got an unexpected keyword argument 'proxies' 报错
2024-12-06 18:39:33 +08:00
linyq
65d5a681ac feat(webui): 视频合并添加一键转录功能
-改进文件上传和预览逻辑,支持视频和字幕文件的独立上传
- 添加字幕预览功能,可显示已上传字幕文件的内容
- 实现一键转录功能,为没有字幕的视频生成字幕
-优化合并文件的流程,提高合并效率
- 增加合并结果预览,方便用户查看合并后的视频和字幕
-重构代码,提高可维护性和可扩展性
2024-12-06 18:01:14 +08:00
linyqh
f44d56110e feat(vision): 添加 QwenVL 视觉分析支持
- 新增 QwenVL 视觉分析器类,实现对阿里云 Qwen 模型的支持
- 更新基础设置界面,增加代理配置和 QwenVL 模型可用性检测
- 修改脚本生成逻辑,支持 QwenVL 模型的图像分析
- 重构视觉分析器初始化和调用接口,提高代码复用性和可维护性
2024-12-05 21:43:26 +08:00
linyqh
0caa15e762 build: 添加 pysrt 字幕处理库 2024-12-05 20:27:01 +08:00
linyqh
52180d49c9 feat(merge): 合并视频字幕
- 新增 merge_settings 组件用于视频字幕合并设置
- 实现视频和字幕文件的上传、匹配和排序功能
- 添加合并视频和字幕的逻辑,支持多文件合并- 优化用户界面,增加预览和错误处理功能
2024-12-05 00:56:09 +08:00
linyqh
1a332c72bb refactor(video): 可以剪辑短剧
- 添加多个视频处理相关函数,提高代码可复用性
- 优化日志输出,增加中文注释,提高代码可读性
-调整视频处理流程,提升效率和准确性
- 修复部分函数的参数类型和返回值类型
2024-12-04 01:56:42 +08:00
linyqh
bd879079c3 refactor(video): moviepy==2.0.0.dev2 这个版本往后变更很大
- 移除了不必要的缓存目录创建逻辑
- 优化了字幕处理流程
-重构了音频处理逻辑,支持多音轨混合
- 删除了未使用的函数和冗余代码
- 增加了参数验证和错误处理
2024-12-04 01:11:38 +08:00
linyqh
0bb811ea79 refactor(voice): 优化 Edge TTS 音频生成逻辑- 重构了 Edge TTS音频生成函数,提高了代码可读性和错误处理能力
-增加了重试机制,提高了生成音频的可靠性
-优化了日志输出,提供了更详细的错误信息和生成进度
- 删除了不必要的测试代码和注释,精简了代码结构
2024-12-03 23:24:20 +08:00
linyqh
9efccea97f refactor(app): 优化视频剪辑函数(毫秒+缓存目录)
- 优化时间格式处理,支持更灵活的时间输入- 改进视频缓存目录结构,基于原视频生成哈希值
- 优化日志输出和错误处理
- 调整合并视频功能,移除未使用的示例代码
- 修复了一些与时间戳相关的小问题
2024-12-03 22:26:54 +08:00
linyqh
974a219dd3 refactor(script): 优化脚本生成中的时间戳处理(毫秒级)
- 重构 calculate_duration_and_word_count 函数,提高时间戳解析精度到毫秒级
- 更新 get_batch_timestamps 函数,支持毫秒级时间戳格式- 优化字数计算公式,调整为每0.4秒一个字,并限制在10-500字范围内
-增加日志输出,提高代码可调试性
2024-12-03 21:37:33 +08:00
linyqh
f6ba1824e9 feat(video): 提升关键帧时间戳精度到毫秒
- 将关键帧时间戳精确到毫秒,格式为 HHMMSSmmm
- 优化场景检测算法,增加帧数检查和未检测到边界时的处理
-调整帧差计算方式,使用浮点数提高精度
- 修改文件名格式匹配规则,支持毫秒级时间戳
2024-12-03 21:19:49 +08:00
linyq
8fb7617c9b feat(utils): 优化时间戳处理并支持毫秒级精度
- 重构了时间戳转换函数,支持 HH:MM:SS,mmm 格式
- 优化了时间戳计算逻辑,提高了精度- 更新了相关服务和工具类中的时间戳处理方法
2024-11-27 23:26:43 +08:00
linyq
401eb92fa3 feat(audio): 改进音频合并功能,支持 OST 设置,提升时间戳精度
-重构了 merge_audio_files 函数,增加了对 OST 设置的支持
- 新增 time_to_seconds 函数,支持多种时间格式的转换
- 修改了 audio_merger 模块的逻辑,根据 OST 设置处理音频
- 更新了 task 模块中的 start_subclip 函数,传入 OST 信息
- 优化了 subtitle 和 video 模块的逻辑,适应新的音频处理方式
2024-11-27 23:26:43 +08:00
linyqh
c03a13db13 feat(test): 添加与通义千问AI模型对话的功能
- 新增 chat_with_qwen 函数,用于与通义千问AI模型进行对话
- 添加错误处理和资源管理,提高代码健壮性
- 优化视频剪辑功能,增加输出路径参数
-读取字幕文件并将其作为输入发送给AI模型
-处理API调用异常,并提供错误文档链接
2024-11-27 23:26:43 +08:00
linyqh
f008804369 feat(subtitle): 添加从视频提取音频并生成字幕的功能
- 新增 extract_audio_and_create_subtitle函数,用于从视频文件中提取音频并生成字幕文件
- 更新 video_pipeline.py,修改视频下载和处理的相关参数
2024-11-27 23:26:43 +08:00
linyq
e98d0050d3 refactor(video_pipeline): 重构视频处理管道
- 新增参数以支持更灵活的配置
-优化脚本保存逻辑,支持自定义脚本名称
-增加视频下载和脚本生成的条件判断,提高效率
- 异步生成最终视频,返回任务路径
- 更新示例使用新的管道配置
2024-11-27 23:26:43 +08:00
linyqh
ee710499b9 refactor(webui): 优化音频设置界面并添加代理配置
- 修改支持的语音列表,仅保留中文语音
- 在主程序中添加代理配置环境变量
-优化剪辑视频函数,改为返回字典类型
- 更新任务服务中的剪辑视频函数,适应新的参数类型
- 修改测试用例中的视频剪辑函数,增加输出路径参数
- 更新脚本控制器中的剪辑视频函数,集成任务 ID 和子视频字典
2024-11-27 23:26:43 +08:00
linyq
1d5585e752 feat(v2): 添加开始视频剪辑任务的 API 接口- 新增 StartSubclipRequest 和 StartSubclipResponse 模型- 实现 /scripts/start-subclip 接口,用于启动视频剪辑任务
- 支持异步处理,返回任务 ID 和初始状态
2024-11-27 23:26:43 +08:00
linyq
bd1ce5c7b9 feat(v2): 新增视频裁剪和YouTube视频下载功能
- 在 schema_v2.py 中添加了新的请求和响应模型
- 在 script.py 中实现了 /scripts/crop 和 /youtube/download 接口- 新增 video_service.py 和 youtube_service.py 服务模块
- 更新 utils.py 中的工具函数以支持新功能
2024-11-27 23:26:43 +08:00
linyq
8dd4b27fc3 feat(app): 新增脚本生成 V2 接口并重构相关功能
- 新增 V2脚本生成接口和相关服务
- 重构脚本生成逻辑,提高可维护性和可扩展性
- 优化关键帧提取和处理流程
- 改进错误处理和日志记录
2024-11-27 23:26:43 +08:00
linyq
d67300cdd5 feat(webui): 增加文案生成模型设置和测试连接功能
- 在基本设置中添加新的视觉模型提供商选项
- 实现文本模型连接测试功能,支持 OpenAI、Moonshot、DeepSeek等提供商
- 更新多语言文案,增加新的提示信息
2024-11-27 21:52:39 +08:00
linyq
5b0344dd95 解决冲突 2024-11-26 16:38:57 +08:00
linyqh
29d6107cd2 feat(video_processor): 解决竖版视频解析出错;优化视频压缩处理
- 添加对横版和竖版视频的区分,使用不同的缩放比例
- 获取原始视频的宽度和高度,用于确定缩放比例
- 改进 FFmpeg 命令的执行,增加错误处理和日志记录
2024-11-26 16:38:57 +08:00
linyq
53b8cded04 refactor(webui): 优化视觉分析批次处理逻辑
- 提取 vision_batch_size 到单独变量,提高代码可读性
- 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size")
- 添加调试日志,记录批次数量和每批次的图片数量
2024-11-26 16:38:57 +08:00
linyqh
593b427061 fix(video_processor): cpu提取关键帧失败; 修复 KMeans 聚类失败问题
- 增加对空镜头帧的检查
- 添加异常捕获,当 KMeans 聚类失败时使用备选方案
- 备选方案:选择镜头中间的帧作为关键帧
-优化代码结构,提高鲁棒性
2024-11-26 16:38:57 +08:00
linyq
9c58102558 feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词
- 在视频审查面板中添加剪辑模式选择选项
- 提供三种剪辑模式:仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息
2024-11-22 15:39:10 +08:00
linyqh
6b436cba06 fix(video): 改进背景音乐随机选择功能
- 检查背景音乐目录是否存在
-支持 mp3 和 flac两种音频格式
- 增加找不到音乐文件时的错误处理
2024-11-16 01:42:10 +08:00
linyqh
97c3ed1fbe fix(video_processor_v2): 优化视频处理流程并添加异常处理- 在提取关键帧时添加 tqdm 进度条
- 移除不必要的空行和多余的换行符
- 添加异常捕获和详细的错误日志记录
-优化临时文件清理逻辑,增加重试机制
- 释放资源,包括视频文件句柄和临时对象
2024-11-16 00:30:51 +08:00
linyq
3d4a58e5cf feat(test): 添加 video 处理测试脚本
- 新增 test_moviepy_merge.py,实现视频合并功能
- 新增 test_moviepy_speed.py,实现视频加速处理- 添加 VideoMerger 和 VideoSpeedProcessor 类,分别用于视频合并和速度处理
- 测试脚本展示了如何使用 moviepy 进行视频编辑
2024-11-15 18:29:29 +08:00
linyq
cc44aab181 feat(video): 实现关键帧提取 V2 版本
- 新增 VideoProcessor 类,实现视频预处理、场景边界检测、关键帧提取等功能
- 在 config.example.toml 中添加 frames 配置项,用于控制关键帧提取参数- 修改 script_settings.py,支持使用新的 VideoProcessor 进行关键帧提取
- 优化关键帧提取流程,提高处理效率和准确性
2024-11-15 18:03:23 +08:00
linyq
d1cbaaf040 fix(app): 优化 Gemini 生成逻辑,增加重试机制
- 为 Gemini 生成器添加重试逻辑,以处理 API 限流情况
- Gemini 生成器在遇到空响应时也会进行重试- 优化异常处理,对不同的错误类型采取不同的重试策略
2024-11-15 16:32:14 +08:00
linyq
4c57fe0fa9 feat(webui): 集成 DeepSeek 文本生成模型
- 在文本生成模型提供商列表中添加 DeepSeek
- 实现 DeepSeek API 的生成器类
- 在脚本生成器中支持 DeepSeek 模型
- 优化脚本处理过程中的错误提示
2024-11-15 16:03:59 +08:00
linyq
1a16d2b655 feat(utils): 优化 Moonshot生成逻辑并添加重试机制- 在 Moonshot 生成逻辑中添加了对 429错误的重试机制
- 当遇到 429 错误时,等待 65秒后重试
- 更新了测试示例,直接返回固定文本以简化测试过程
- 更新了资源下载链接
2024-11-15 15:44:17 +08:00
linyq
af9e7fa279 feat(script_generator): 为 OpenAI、Qwen 和 Moonshot 生成器添加 base_url 参数
-为 OpenAIGenerator、QwenGenerator 和 MoonshotGenerator 类添加 base_url 参数
- 更新 ScriptProcessor 类以支持 base_url 参数
-调整 OpenAI 生成器的最大 token 数量从 7000 减少到 5000
- 移动 seconds_to_time 函数以减少代码重复
2024-11-15 14:35:33 +08:00
linyq
177304aec0 feat(test): 添加 moviepy 库视频剪辑测试脚本
- 新增 test_moviepy.py 文件,实现使用 moviepy 库剪辑指定时间戳视频的功能
- 添加时间字符串转换函数、格式化时长函数和视频剪辑函数- 编写主函数以测试视频剪辑功能
2024-11-15 12:08:41 +08:00