linyq
|
401eb92fa3
|
feat(audio): 改进音频合并功能,支持 OST 设置,提升时间戳精度
-重构了 merge_audio_files 函数,增加了对 OST 设置的支持
- 新增 time_to_seconds 函数,支持多种时间格式的转换
- 修改了 audio_merger 模块的逻辑,根据 OST 设置处理音频
- 更新了 task 模块中的 start_subclip 函数,传入 OST 信息
- 优化了 subtitle 和 video 模块的逻辑,适应新的音频处理方式
|
2024-11-27 23:26:43 +08:00 |
|
linyqh
|
c03a13db13
|
feat(test): 添加与通义千问AI模型对话的功能
- 新增 chat_with_qwen 函数,用于与通义千问AI模型进行对话
- 添加错误处理和资源管理,提高代码健壮性
- 优化视频剪辑功能,增加输出路径参数
-读取字幕文件并将其作为输入发送给AI模型
-处理API调用异常,并提供错误文档链接
|
2024-11-27 23:26:43 +08:00 |
|
linyqh
|
f008804369
|
feat(subtitle): 添加从视频提取音频并生成字幕的功能
- 新增 extract_audio_and_create_subtitle函数,用于从视频文件中提取音频并生成字幕文件
- 更新 video_pipeline.py,修改视频下载和处理的相关参数
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
e98d0050d3
|
refactor(video_pipeline): 重构视频处理管道
- 新增参数以支持更灵活的配置
-优化脚本保存逻辑,支持自定义脚本名称
-增加视频下载和脚本生成的条件判断,提高效率
- 异步生成最终视频,返回任务路径
- 更新示例使用新的管道配置
|
2024-11-27 23:26:43 +08:00 |
|
linyqh
|
ee710499b9
|
refactor(webui): 优化音频设置界面并添加代理配置
- 修改支持的语音列表,仅保留中文语音
- 在主程序中添加代理配置环境变量
-优化剪辑视频函数,改为返回字典类型
- 更新任务服务中的剪辑视频函数,适应新的参数类型
- 修改测试用例中的视频剪辑函数,增加输出路径参数
- 更新脚本控制器中的剪辑视频函数,集成任务 ID 和子视频字典
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
1d5585e752
|
feat(v2): 添加开始视频剪辑任务的 API 接口- 新增 StartSubclipRequest 和 StartSubclipResponse 模型- 实现 /scripts/start-subclip 接口,用于启动视频剪辑任务
- 支持异步处理,返回任务 ID 和初始状态
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
bd1ce5c7b9
|
feat(v2): 新增视频裁剪和YouTube视频下载功能
- 在 schema_v2.py 中添加了新的请求和响应模型
- 在 script.py 中实现了 /scripts/crop 和 /youtube/download 接口- 新增 video_service.py 和 youtube_service.py 服务模块
- 更新 utils.py 中的工具函数以支持新功能
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
8dd4b27fc3
|
feat(app): 新增脚本生成 V2 接口并重构相关功能
- 新增 V2脚本生成接口和相关服务
- 重构脚本生成逻辑,提高可维护性和可扩展性
- 优化关键帧提取和处理流程
- 改进错误处理和日志记录
|
2024-11-27 23:26:43 +08:00 |
|
linyq
|
d67300cdd5
|
feat(webui): 增加文案生成模型设置和测试连接功能
- 在基本设置中添加新的视觉模型提供商选项
- 实现文本模型连接测试功能,支持 OpenAI、Moonshot、DeepSeek等提供商
- 更新多语言文案,增加新的提示信息
|
2024-11-27 21:52:39 +08:00 |
|
linyq
|
5b0344dd95
|
解决冲突
|
2024-11-26 16:38:57 +08:00 |
|
linyqh
|
29d6107cd2
|
feat(video_processor): 解决竖版视频解析出错;优化视频压缩处理
- 添加对横版和竖版视频的区分,使用不同的缩放比例
- 获取原始视频的宽度和高度,用于确定缩放比例
- 改进 FFmpeg 命令的执行,增加错误处理和日志记录
|
2024-11-26 16:38:57 +08:00 |
|
linyq
|
53b8cded04
|
refactor(webui): 优化视觉分析批次处理逻辑
- 提取 vision_batch_size 到单独变量,提高代码可读性
- 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size")
- 添加调试日志,记录批次数量和每批次的图片数量
|
2024-11-26 16:38:57 +08:00 |
|
linyqh
|
593b427061
|
fix(video_processor): cpu提取关键帧失败; 修复 KMeans 聚类失败问题
- 增加对空镜头帧的检查
- 添加异常捕获,当 KMeans 聚类失败时使用备选方案
- 备选方案:选择镜头中间的帧作为关键帧
-优化代码结构,提高鲁棒性
|
2024-11-26 16:38:57 +08:00 |
|
linyq
|
9c58102558
|
feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词
- 在视频审查面板中添加剪辑模式选择选项
- 提供三种剪辑模式:仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息
|
2024-11-22 15:39:10 +08:00 |
|
linyqh
|
6b436cba06
|
fix(video): 改进背景音乐随机选择功能
- 检查背景音乐目录是否存在
-支持 mp3 和 flac两种音频格式
- 增加找不到音乐文件时的错误处理
|
2024-11-16 01:42:10 +08:00 |
|
linyqh
|
97c3ed1fbe
|
fix(video_processor_v2): 优化视频处理流程并添加异常处理- 在提取关键帧时添加 tqdm 进度条
- 移除不必要的空行和多余的换行符
- 添加异常捕获和详细的错误日志记录
-优化临时文件清理逻辑,增加重试机制
- 释放资源,包括视频文件句柄和临时对象
|
2024-11-16 00:30:51 +08:00 |
|
linyq
|
3d4a58e5cf
|
feat(test): 添加 video 处理测试脚本
- 新增 test_moviepy_merge.py,实现视频合并功能
- 新增 test_moviepy_speed.py,实现视频加速处理- 添加 VideoMerger 和 VideoSpeedProcessor 类,分别用于视频合并和速度处理
- 测试脚本展示了如何使用 moviepy 进行视频编辑
|
2024-11-15 18:29:29 +08:00 |
|
linyq
|
cc44aab181
|
feat(video): 实现关键帧提取 V2 版本
- 新增 VideoProcessor 类,实现视频预处理、场景边界检测、关键帧提取等功能
- 在 config.example.toml 中添加 frames 配置项,用于控制关键帧提取参数- 修改 script_settings.py,支持使用新的 VideoProcessor 进行关键帧提取
- 优化关键帧提取流程,提高处理效率和准确性
|
2024-11-15 18:03:23 +08:00 |
|
linyq
|
d1cbaaf040
|
fix(app): 优化 Gemini 生成逻辑,增加重试机制
- 为 Gemini 生成器添加重试逻辑,以处理 API 限流情况
- Gemini 生成器在遇到空响应时也会进行重试- 优化异常处理,对不同的错误类型采取不同的重试策略
|
2024-11-15 16:32:14 +08:00 |
|
linyq
|
4c57fe0fa9
|
feat(webui): 集成 DeepSeek 文本生成模型
- 在文本生成模型提供商列表中添加 DeepSeek
- 实现 DeepSeek API 的生成器类
- 在脚本生成器中支持 DeepSeek 模型
- 优化脚本处理过程中的错误提示
|
2024-11-15 16:03:59 +08:00 |
|
linyq
|
1a16d2b655
|
feat(utils): 优化 Moonshot生成逻辑并添加重试机制- 在 Moonshot 生成逻辑中添加了对 429错误的重试机制
- 当遇到 429 错误时,等待 65秒后重试
- 更新了测试示例,直接返回固定文本以简化测试过程
- 更新了资源下载链接
|
2024-11-15 15:44:17 +08:00 |
|
linyq
|
af9e7fa279
|
feat(script_generator): 为 OpenAI、Qwen 和 Moonshot 生成器添加 base_url 参数
-为 OpenAIGenerator、QwenGenerator 和 MoonshotGenerator 类添加 base_url 参数
- 更新 ScriptProcessor 类以支持 base_url 参数
-调整 OpenAI 生成器的最大 token 数量从 7000 减少到 5000
- 移动 seconds_to_time 函数以减少代码重复
|
2024-11-15 14:35:33 +08:00 |
|
linyq
|
177304aec0
|
feat(test): 添加 moviepy 库视频剪辑测试脚本
- 新增 test_moviepy.py 文件,实现使用 moviepy 库剪辑指定时间戳视频的功能
- 添加时间字符串转换函数、格式化时长函数和视频剪辑函数- 编写主函数以测试视频剪辑功能
|
2024-11-15 12:08:41 +08:00 |
|
linyq
|
94b983a545
|
refactor(app): 调整脚本生成器默认参数并移除未使用的代码
- 移除了 script_generator.py 中的多余参数 'enable_search'
- 删除了 webui.sh 脚本,可能是因为不再需要或已改为其他方式实现
- 新增了 test_gemini.py 测试文件,用于测试 Gemini 模型
|
2024-11-15 11:27:33 +08:00 |
|
linyqh
|
d10a84caca
|
feat(video_processor): 优化镜头边界检测和关键帧提取功能
- 将镜头边界检测的阈值从 30 调整到 70,提高检测精度
- 添加 tqdm 进度条,增强处理过程的可视化
- 优化内存管理,提高程序运行效率
- 调整关键帧提取日志输出,增加处理进度信息
|
2024-11-13 20:19:29 +08:00 |
|
linyq
|
2f41c13e19
|
feat(vision_analyzer): 开放 Gemini 模型安全设置
- 在配置 API 客户端时,添加了安全设置配置
- 设置所有危害类别的阻塞阈值为 BLOCK_NONE,以开放模型的限制
|
2024-11-12 09:42:35 +08:00 |
|
linyq
|
eaa8ceb7e3
|
refactor(script_generator): 重构脚本生成器
- 优化了基本设置中的文本生成模型提供商选择
- 重新设计了脚本生成器的架构,提高了可扩展性和维护性
- 为 OpenAI、Gemini、Qwen 和 Moonshot 生成器实现了统一的接口和流程
- 移除了字数控制要求,简化了生成逻辑
|
2024-11-11 17:22:01 +08:00 |
|
linyq
|
ee52600ae2
|
feat(app): 优化关键帧提取功能
- 重构 VideoProcessor 类,优化内存使用和性能
- 添加分批处理逻辑,支持大视频文件的处理
- 使用 MiniBatchKMeans 替代 KMeans,减少内存消耗
- 优化镜头边界检测和关键帧提取算法
- 增加日志记录和错误处理,提高程序的健壮性
|
2024-11-11 15:53:33 +08:00 |
|
linyqh
|
d0462ce91b
|
0.3.4 修改各种bug
|
2024-11-10 16:22:04 +08:00 |
|
linyqh
|
624889a32f
|
0.3.2 发版
|
2024-11-10 01:12:44 +08:00 |
|
linyqh
|
072cfb9856
|
完成汉化和自定义提示词
|
2024-11-09 22:35:12 +08:00 |
|
linyqh
|
8267a0b3eb
|
完成了gemini 生成视频脚本的逻辑
|
2024-11-09 18:18:57 +08:00 |
|
linyqh
|
ec282adb1b
|
Merge branch 'dev' of github.com:linyqh/NarratoAI into dev
|
2024-11-09 02:28:28 +08:00 |
|
linyqh
|
bb18a754fe
|
webui 代码重构;
|
2024-11-09 02:26:39 +08:00 |
|
linyq
|
8e6890b608
|
优化日志输出内容
|
2024-11-07 16:51:36 +08:00 |
|
linyqh
|
242f8d5355
|
优化剪辑方法,新增语调
|
2024-11-06 02:15:44 +08:00 |
|
linyq
|
e926e8676a
|
优化 TTS 新增 proxy 配置,新增语调配置
|
2024-11-05 18:33:46 +08:00 |
|
linyq
|
1d9b27bf46
|
优化 ost 新增状态
- 0: 只播放解说音频
- 1: 只播放视频原声
- 2: 播放解说同时保留原声
|
2024-11-05 18:04:21 +08:00 |
|
linyq
|
04c4406e24
|
优化 mac 中合并视频的逻辑;
下一步优化 ost 新增状态
- 0: 只播放解说音频
- 1: 只播放视频原声
- 2: 播放解说同时保留原声
|
2024-11-05 17:32:03 +08:00 |
|
linyqh
|
6c341388f7
|
优化tts
|
2024-11-04 01:05:06 +08:00 |
|
linyq
|
2ff72e8b06
|
升级几个包;python升级到py11,准备对比优化视频转录;看中英文提示词效果对比;
|
2024-10-28 18:32:17 +08:00 |
|
linyq
|
95828144be
|
123
|
2024-09-30 17:41:11 +08:00 |
|
linyqh
|
f04fd70ab8
|
查漏补缺
|
2024-09-30 01:37:39 +08:00 |
|
linyq
|
decac3b11d
|
完成优化webui体验-剪辑逻辑进度90%;
待优化点:
1. 优化脚本-解说质量
|
2024-09-29 18:34:36 +08:00 |
|
linyq
|
dc4ce80ea5
|
剪辑逻辑进度80%;
待优化点:
1. 优化脚本-解说质量
2. 优化webui体验
|
2024-09-29 14:39:20 +08:00 |
|
linyq
|
02589c8355
|
剪辑逻辑进度70%;
待优化点:
1. 生成字幕逻辑优化
2. 优化脚本-解说质量
3. 修复字幕bug
|
2024-09-29 00:02:40 +08:00 |
|
linyq
|
7b3014ad42
|
剪辑逻辑进度60%;
待优化点:
1. 生成字幕逻辑优化
2. 文案解说的时间和脚本时间的优化
|
2024-09-28 17:10:43 +08:00 |
|
linyq
|
e440dc619f
|
优化剪辑逻辑123
|
2024-09-27 12:01:42 +08:00 |
|
linyqh
|
67d6f353eb
|
剩余最后一步,合成所有素材
|
2024-09-27 01:01:49 +08:00 |
|
linyq
|
e75157a7ac
|
优化剪辑逻辑
|
2024-09-26 18:32:26 +08:00 |
|