NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-03-15 08:10:59 +00:00

Author	SHA1	Message	Date
linyq	0a3e497add	优化 ffmpeg 硬件加速美化日志	2025-05-19 03:01:21 +08:00
linyq	8fda320d50	优化 ffmpeg 硬件加速独显兼容性	2025-05-19 02:50:23 +08:00
linyq	47cd4f145d	优化 ffmpeg 硬件加速兼容性	2025-05-19 02:41:30 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	6c6ceeebea	优化qwenvl_analyzer.py中的base_url配置，移除默认值设置；在utils.py中新增format_time函数以支持秒数格式化为HH:MM:SS,mmm格式；在generate_script_docu.py中重构分析结果处理逻辑，合并批次分析结果并保存为JSON格式，同时兼容旧的文本格式输出。	2025-05-08 11:00:47 +08:00
linyq	ce01c110be	refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出，减少冗余信息 - 修改视频脚本 ID 获取方式 - 优化视频路径获取逻辑 - 移除未使用的导入 - 增加异常日志输出，提高错误排查效率	2025-05-08 00:13:19 +08:00
linyq	2dc83bc18e	perf(vision): 优化视觉分析流程和批量处理逻辑 - 移除了 vision_analysis_prompt 配置项 - 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑 - 更新了文档生成脚本和 UI 组件以适应新的分析流程 - 调整了视频帧提取相关函数，移除了不必要的 skip_seconds 参数 - 更新了中文翻译文件，添加了新的批处理大小相关提示	2025-05-07 18:44:37 +08:00
linyq	82823297f2	feat(script): 添加帧间隔输入参数并更新相关逻辑 - 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数，默认为 5 - 更新 VideoProcessor 的 process_video_pipeline 方法，调整帧提取间隔逻辑 - 修改前端界面，增加帧间隔输入框并更新相关翻译文本 - 优化 generate_script_docu 函数，使用新的帧间隔参数进行视频处理	2025-05-07 16:43:00 +08:00
linyq	f6c3f1640b	移除 opencv 和 sklearn 提取关键帧的代码	2025-05-07 15:41:01 +08:00
linyq	c065800072	feat(webui): 大改动标记1 -重构音频设置面板，增加语音音量、背景音乐等设置 - 添加背景音乐文件选择功能 - 优化字幕设置，支持自定义字体和样式 -调整视频生成流程，支持新音频设置 - 更新文档示例，反映新功能	2024-12-10 18:33:44 +08:00
linyq	36e6018c74	refactor(webui): 降级 httpx==0.27.2 - 解决 Client.__init__() got an unexpected keyword argument 'proxies' 报错	2024-12-06 18:39:33 +08:00
linyqh	f44d56110e	feat(vision): 添加 QwenVL 视觉分析支持 - 新增 QwenVL 视觉分析器类，实现对阿里云 Qwen 模型的支持 - 更新基础设置界面，增加代理配置和 QwenVL 模型可用性检测 - 修改脚本生成逻辑，支持 QwenVL 模型的图像分析 - 重构视觉分析器初始化和调用接口，提高代码复用性和可维护性	2024-12-05 21:43:26 +08:00
linyqh	0caa15e762	build: 添加 pysrt 字幕处理库	2024-12-05 20:27:01 +08:00
linyqh	52180d49c9	feat(merge): 合并视频字幕 - 新增 merge_settings 组件用于视频字幕合并设置 - 实现视频和字幕文件的上传、匹配和排序功能 - 添加合并视频和字幕的逻辑，支持多文件合并- 优化用户界面，增加预览和错误处理功能	2024-12-05 00:56:09 +08:00
linyqh	1a332c72bb	refactor(video): 可以剪辑短剧 - 添加多个视频处理相关函数，提高代码可复用性 - 优化日志输出，增加中文注释，提高代码可读性 -调整视频处理流程，提升效率和准确性 - 修复部分函数的参数类型和返回值类型	2024-12-04 01:56:42 +08:00
linyqh	974a219dd3	refactor(script): 优化脚本生成中的时间戳处理（毫秒级） - 重构 calculate_duration_and_word_count 函数，提高时间戳解析精度到毫秒级 - 更新 get_batch_timestamps 函数，支持毫秒级时间戳格式- 优化字数计算公式，调整为每0.4秒一个字，并限制在10-500字范围内 -增加日志输出，提高代码可调试性	2024-12-03 21:37:33 +08:00
linyqh	f6ba1824e9	feat(video): 提升关键帧时间戳精度到毫秒 - 将关键帧时间戳精确到毫秒，格式为 HHMMSSmmm - 优化场景检测算法，增加帧数检查和未检测到边界时的处理 -调整帧差计算方式，使用浮点数提高精度 - 修改文件名格式匹配规则，支持毫秒级时间戳	2024-12-03 21:19:49 +08:00
linyq	8fb7617c9b	feat(utils): 优化时间戳处理并支持毫秒级精度 - 重构了时间戳转换函数，支持 HH:MM:SS,mmm 格式 - 优化了时间戳计算逻辑，提高了精度- 更新了相关服务和工具类中的时间戳处理方法	2024-11-27 23:26:43 +08:00
linyq	401eb92fa3	feat(audio): 改进音频合并功能，支持 OST 设置，提升时间戳精度 -重构了 merge_audio_files 函数，增加了对 OST 设置的支持 - 新增 time_to_seconds 函数，支持多种时间格式的转换 - 修改了 audio_merger 模块的逻辑，根据 OST 设置处理音频 - 更新了 task 模块中的 start_subclip 函数，传入 OST 信息 - 优化了 subtitle 和 video 模块的逻辑，适应新的音频处理方式	2024-11-27 23:26:43 +08:00
linyqh	29d6107cd2	feat(video_processor): 解决竖版视频解析出错；优化视频压缩处理 - 添加对横版和竖版视频的区分，使用不同的缩放比例 - 获取原始视频的宽度和高度，用于确定缩放比例 - 改进 FFmpeg 命令的执行，增加错误处理和日志记录	2024-11-26 16:38:57 +08:00
linyq	53b8cded04	refactor(webui): 优化视觉分析批次处理逻辑 - 提取 vision_batch_size 到单独变量，提高代码可读性 - 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size") - 添加调试日志，记录批次数量和每批次的图片数量	2024-11-26 16:38:57 +08:00
linyqh	593b427061	fix(video_processor): cpu提取关键帧失败; 修复 KMeans 聚类失败问题 - 增加对空镜头帧的检查 - 添加异常捕获，当 KMeans 聚类失败时使用备选方案 - 备选方案：选择镜头中间的帧作为关键帧 -优化代码结构，提高鲁棒性	2024-11-26 16:38:57 +08:00
linyq	9c58102558	feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词 - 在视频审查面板中添加剪辑模式选择选项 - 提供三种剪辑模式：仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息	2024-11-22 15:39:10 +08:00
linyqh	97c3ed1fbe	fix(video_processor_v2): 优化视频处理流程并添加异常处理- 在提取关键帧时添加 tqdm 进度条 - 移除不必要的空行和多余的换行符 - 添加异常捕获和详细的错误日志记录 -优化临时文件清理逻辑，增加重试机制 - 释放资源，包括视频文件句柄和临时对象	2024-11-16 00:30:51 +08:00
linyq	cc44aab181	feat(video): 实现关键帧提取 V2 版本 - 新增 VideoProcessor 类，实现视频预处理、场景边界检测、关键帧提取等功能 - 在 config.example.toml 中添加 frames 配置项，用于控制关键帧提取参数- 修改 script_settings.py，支持使用新的 VideoProcessor 进行关键帧提取 - 优化关键帧提取流程，提高处理效率和准确性	2024-11-15 18:03:23 +08:00
linyq	d1cbaaf040	fix(app): 优化 Gemini 生成逻辑，增加重试机制 - 为 Gemini 生成器添加重试逻辑，以处理 API 限流情况 - Gemini 生成器在遇到空响应时也会进行重试- 优化异常处理，对不同的错误类型采取不同的重试策略	2024-11-15 16:32:14 +08:00
linyq	4c57fe0fa9	feat(webui): 集成 DeepSeek 文本生成模型 - 在文本生成模型提供商列表中添加 DeepSeek - 实现 DeepSeek API 的生成器类 - 在脚本生成器中支持 DeepSeek 模型 - 优化脚本处理过程中的错误提示	2024-11-15 16:03:59 +08:00
linyq	1a16d2b655	feat(utils): 优化 Moonshot生成逻辑并添加重试机制- 在 Moonshot 生成逻辑中添加了对 429错误的重试机制 - 当遇到 429 错误时，等待 65秒后重试 - 更新了测试示例，直接返回固定文本以简化测试过程 - 更新了资源下载链接	2024-11-15 15:44:17 +08:00
linyq	af9e7fa279	feat(script_generator): 为 OpenAI、Qwen 和 Moonshot 生成器添加 base_url 参数 -为 OpenAIGenerator、QwenGenerator 和 MoonshotGenerator 类添加 base_url 参数 - 更新 ScriptProcessor 类以支持 base_url 参数 -调整 OpenAI 生成器的最大 token 数量从 7000 减少到 5000 - 移动 seconds_to_time 函数以减少代码重复	2024-11-15 14:35:33 +08:00
linyq	94b983a545	refactor(app): 调整脚本生成器默认参数并移除未使用的代码 - 移除了 script_generator.py 中的多余参数 'enable_search' - 删除了 webui.sh 脚本，可能是因为不再需要或已改为其他方式实现 - 新增了 test_gemini.py 测试文件，用于测试 Gemini 模型	2024-11-15 11:27:33 +08:00
linyqh	d10a84caca	feat(video_processor): 优化镜头边界检测和关键帧提取功能 - 将镜头边界检测的阈值从 30 调整到 70，提高检测精度 - 添加 tqdm 进度条，增强处理过程的可视化 - 优化内存管理，提高程序运行效率 - 调整关键帧提取日志输出，增加处理进度信息	2024-11-13 20:19:29 +08:00
linyq	2f41c13e19	feat(vision_analyzer): 开放 Gemini 模型安全设置 - 在配置 API 客户端时，添加了安全设置配置 - 设置所有危害类别的阻塞阈值为 BLOCK_NONE，以开放模型的限制	2024-11-12 09:42:35 +08:00
linyq	eaa8ceb7e3	refactor(script_generator): 重构脚本生成器 - 优化了基本设置中的文本生成模型提供商选择 - 重新设计了脚本生成器的架构，提高了可扩展性和维护性 - 为 OpenAI、Gemini、Qwen 和 Moonshot 生成器实现了统一的接口和流程 - 移除了字数控制要求，简化了生成逻辑	2024-11-11 17:22:01 +08:00
linyq	ee52600ae2	feat(app): 优化关键帧提取功能 - 重构 VideoProcessor 类，优化内存使用和性能 - 添加分批处理逻辑，支持大视频文件的处理 - 使用 MiniBatchKMeans 替代 KMeans，减少内存消耗 - 优化镜头边界检测和关键帧提取算法 - 增加日志记录和错误处理，提高程序的健壮性	2024-11-11 15:53:33 +08:00
linyqh	d0462ce91b	0.3.4 修改各种bug	2024-11-10 16:22:04 +08:00
linyqh	624889a32f	0.3.2 发版	2024-11-10 01:12:44 +08:00
linyqh	072cfb9856	完成汉化和自定义提示词	2024-11-09 22:35:12 +08:00
linyqh	8267a0b3eb	完成了gemini 生成视频脚本的逻辑	2024-11-09 18:18:57 +08:00
linyqh	bb18a754fe	webui 代码重构；	2024-11-09 02:26:39 +08:00
linyq	04c4406e24	优化 mac 中合并视频的逻辑；下一步优化 ost 新增状态 - 0: 只播放解说音频 - 1: 只播放视频原声 - 2: 播放解说同时保留原声	2024-11-05 17:32:03 +08:00
linyq	decac3b11d	完成优化webui体验-剪辑逻辑进度90%；待优化点： 1. 优化脚本-解说质量	2024-09-29 18:34:36 +08:00
linyq	02589c8355	剪辑逻辑进度70%；待优化点： 1. 生成字幕逻辑优化 2. 优化脚本-解说质量 3. 修复字幕bug	2024-09-29 00:02:40 +08:00
linyq	e75157a7ac	优化剪辑逻辑	2024-09-26 18:32:26 +08:00
linyq	18d4fff028	优化大模型生成脚本逻辑	2024-09-26 15:56:50 +08:00
linyq	990994e9cd	优化 webui task 逻辑30%；新增检查/修复脚本方法	2024-09-25 18:32:38 +08:00
linyq	93188e1328	新增音画同步提示词	2024-09-23 17:46:46 +08:00
linyqh	a675e35f1d	运行成功，但脚本问题还很大	2024-09-20 00:42:33 +08:00
linyq	2bc94651a2	未完成 generate_video_v2 功能	2024-09-19 18:23:54 +08:00
linyq	d1da23e37f	优化分段字幕生成逻辑；下一步优化分段视频合并；	2024-09-18 18:29:01 +08:00
linyq	11bd56bd02	## 本次更新： - 新增播放原声ost配置； - 优化解说提示词 - 修改视频合成配置，支持播放原声视频 - 新增获取当前网络区域 - 优化readme	2024-09-14 18:39:01 +08:00

1 2

51 Commits