NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-05-05 16:18:53 +00:00

Author	SHA1	Message	Date
linyq	60e01bf6f2	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-08-03 20:15:26 +08:00
linyq	062d317261	feat(tts): 添加多引擎TTS支持并重构语音设置界面 - 新增Azure Speech Services和Edge TTS引擎支持 - 重构语音设置界面，支持不同引擎的独立配置 - 添加引擎选择器和详细说明 - 更新requirements.txt添加azure-cognitiveservices-speech依赖 - 改进音色名称验证逻辑	2025-08-03 18:45:33 +08:00
linyq	e59fd6030c	refactor: 移除视频字幕合并功能及相关代码清理不再使用的视频字幕合并功能，包括删除合并设置组件、合并工具函数和相关的国际化文本	2025-08-03 17:12:07 +08:00
linyq	184286e5e0	feat(script): 合并脚本保存与格式验证功能重构脚本保存流程，将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能，包括字段类型、格式和必填项验证。	2025-08-03 17:06:55 +08:00
linyq	cd1ee1441e	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-08-03 16:34:13 +08:00
linyq	e1f45db95a	feat(tts): 添加 SoulVoice TTS 引擎支持实现 SoulVoice TTS 引擎集成，包括配置管理、语音选择、API 调用和字幕处理新增 SoulVoice 配置项和示例配置修改音频设置面板以支持 SoulVoice 选项优化音频时长计算和异常处理更新多语言文案以反映 SoulVoice 支持	2025-08-03 04:26:42 +08:00
linyq	6715c29057	feat(video_processor): 优化视频帧提取功能，增强Windows系统兼容性在video_processor.py中，添加了对Windows N卡硬件加速的支持，优化了帧提取过程，改进了提取成功率的统计和错误处理。同时，在generate_script_docu.py中，增强了对硬件加速失败的处理逻辑，提供了详细的错误信息和解决建议，提升了用户体验。	2025-07-07 20:48:36 +08:00
linyq	dd59d5295d	feat: 更新作者信息并增强API配置验证功能在基础设置中新增API密钥、基础URL和模型名称的验证功能，确保用户输入的配置有效性，提升系统的稳定性和用户体验。	2025-07-07 15:40:34 +08:00
linyq	1792311ef4	feat(audio): 统一音量配置并修复原声音量默认值问题引入AudioVolumeDefaults类集中管理音量配置，确保全局一致性修复原声音量默认值为0.7以解决短剧解说模式问题添加音量验证和详细日志便于调试	2025-07-02 17:54:00 +08:00
linyq	342a4ac1a8	refactor(webui): 修复合并视频与字幕功能 - 注释掉 merge_settings.py 中的一键转录功能 - 更新 base.py 中的 API URL - 在 merge_video.py 中添加 pysrt导入 - 更新 requirements.txt，添加 pysrt 依赖 - 修改 zh.json 中的缺失字幕文件提示信息	2025-05-12 10:55:17 +08:00
linyq	2ef42fda46	feat(webui): 优化短剧解说功能 - 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数 - 修改 prompt 模板以包含短剧名称 - 调整组件渲染顺序，提高用户体验	2025-05-11 00:13:56 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	048b2ff39a	feat(webui): 新增短剧解说脚本生成功能 - 添加短剧解说模式，支持上传字幕文件 - 实现短剧解说脚本生成逻辑 -优化脚本设置界面布局，支持多种脚本类型 - 修复部分功能模块的引用错误	2025-05-10 22:57:05 +08:00
linyq	3fe8eb50c0	(webfeatui): 重构视觉分析功能并添加新模型支持 - 移除了对 QwenVL模型的特定逻辑，改为更通用的实现 - 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面，增加了新的模型选项 - 重构了测试连接和创建分析器的代码，提高了可维护性 - 调整了配置文件结构，简化了视觉模型的配置	2025-05-09 12:03:27 +08:00
linyq	fef3b3c8fd	feat(subtitle): 添加字幕自定义位置功能 - 在 generate_video.py 中实现自定义字幕位置的逻辑 - 在 schema.py 中添加 custom_position 字段 - 更新 webui 组件以支持自定义位置设置 - 调整任务处理逻辑，支持新的自定义位置参数	2025-05-08 20:45:14 +08:00
linyq	dac23c7c31	(webfeatui): 重构并优化视频解说文案生成功能 -优化了基本设置组件，增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块，提高了代码可读性和可维护性 -改进了 generate_script_docu 工具，简化了文案生成流程- 添加了异常处理和日志记录，提高了系统稳定性	2025-05-08 17:02:02 +08:00
linyq	ce01c110be	refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出，减少冗余信息 - 修改视频脚本 ID 获取方式 - 优化视频路径获取逻辑 - 移除未使用的导入 - 增加异常日志输出，提高错误排查效率	2025-05-08 00:13:19 +08:00
linyq	0ccb019f88	refactor(app): 重构视频剪辑功能并优化性能 - 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑 - 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则 - 调整了错误处理和日志记录方式	2025-05-07 23:08:26 +08:00
linyq	2dc83bc18e	perf(vision): 优化视觉分析流程和批量处理逻辑 - 移除了 vision_analysis_prompt 配置项 - 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑 - 更新了文档生成脚本和 UI 组件以适应新的分析流程 - 调整了视频帧提取相关函数，移除了不必要的 skip_seconds 参数 - 更新了中文翻译文件，添加了新的批处理大小相关提示	2025-05-07 18:44:37 +08:00
linyq	82823297f2	feat(script): 添加帧间隔输入参数并更新相关逻辑 - 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数，默认为 5 - 更新 VideoProcessor 的 process_video_pipeline 方法，调整帧提取间隔逻辑 - 修改前端界面，增加帧间隔输入框并更新相关翻译文本 - 优化 generate_script_docu 函数，使用新的帧间隔参数进行视频处理	2025-05-07 16:43:00 +08:00
linyq	f6c3f1640b	移除 opencv 和 sklearn 提取关键帧的代码	2025-05-07 15:41:01 +08:00
linyqh	bc236cd195	更新配置文件和Web界面，支持自定义短剧混剪片段 - 将项目版本更新至0.5.3 - 修改视觉大模型提供商为qwenvl，并更新相关API密钥和模型名称 - 新增DeepSeek API支持，更新文本生成模型设置 - 在Web界面中添加短视频生成模式的选项，调整脚本设置以支持自定义片段数量 - 修改代理设置的默认值为False	2025-04-13 14:07:35 +08:00
linyqh	074f1d103b	feat(webui): 更新文案生成模型设置支持 DeepSeek - 调整文本生成模型提供商顺序，将 DeepSeek 置顶 - 修改 DeepSeek API 基础 URL 和模型名称 - 移除短剧混剪功能中的模型限制描述	2025-03-06 01:52:26 +08:00
linyqh	fb8021c30e	新增 en-US TTS	2025-01-11 23:13:57 +08:00
linyq	e3b5fa4d0e	feat(audio): 本地测试-1 - 调整背景音乐音量默认值为 0.3- 优化任务服务中的音量配置逻辑 - 更新视频生成服务，移除默认音量配置- 在 WebUI 中添加原声音量设置并更新相关参数	2024-12-11 15:19:17 +08:00
linyq	11a4cf0900	(subfeattitle): 优化字幕功能并增加位置设置 - 调整音频设置的滑块范围和默认值 - 修复生成脚本短片功能的导入问题 - 优化字幕设置界面，增加字幕位置选项- 改进字幕渲染逻辑，支持多种位置配置 - 调整视频设置中的原始音量滑块范围和默认值	2024-12-11 11:51:02 +08:00
linyq	c065800072	feat(webui): 大改动标记1 -重构音频设置面板，增加语音音量、背景音乐等设置 - 添加背景音乐文件选择功能 - 优化字幕设置，支持自定义字体和样式 -调整视频生成流程，支持新音频设置 - 更新文档示例，反映新功能	2024-12-10 18:33:44 +08:00
linyq	d2f724217c	refactor(webui): 重构视频脚本生成-目录结果 - 将视频脚本生成相关代码从 script_settings.py 移动到新的 generate_script_docu.py 文件 - 新增 base.py 文件，提取公共工具函数 - 优化代码结构，提高可维护性和可读性- 重构函数名称，更清晰地反映功能	2024-12-06 18:18:23 +08:00
linyq	65d5a681ac	feat(webui): 视频合并添加一键转录功能 -改进文件上传和预览逻辑，支持视频和字幕文件的独立上传 - 添加字幕预览功能，可显示已上传字幕文件的内容 - 实现一键转录功能，为没有字幕的视频生成字幕 -优化合并文件的流程，提高合并效率 - 增加合并结果预览，方便用户查看合并后的视频和字幕 -重构代码，提高可维护性和可扩展性	2024-12-06 18:01:14 +08:00
linyqh	4e590380f5	feat(webui): 添加系统设置功能 - 新增系统设置面板，包含清理缓存、关键帧、裁剪视频和任务目录的功能- 实现清理指定目录的通用函数 clear_directory - 更新中文翻译文件，添加相关提示信息	2024-12-05 22:36:17 +08:00
linyqh	f44d56110e	feat(vision): 添加 QwenVL 视觉分析支持 - 新增 QwenVL 视觉分析器类，实现对阿里云 Qwen 模型的支持 - 更新基础设置界面，增加代理配置和 QwenVL 模型可用性检测 - 修改脚本生成逻辑，支持 QwenVL 模型的图像分析 - 重构视觉分析器初始化和调用接口，提高代码复用性和可维护性	2024-12-05 21:43:26 +08:00
linyqh	0caa15e762	build: 添加 pysrt 字幕处理库	2024-12-05 20:27:01 +08:00
linyqh	52180d49c9	feat(merge): 合并视频字幕 - 新增 merge_settings 组件用于视频字幕合并设置 - 实现视频和字幕文件的上传、匹配和排序功能 - 添加合并视频和字幕的逻辑，支持多文件合并- 优化用户界面，增加预览和错误处理功能	2024-12-05 00:56:09 +08:00
linyqh	0021a868b6	feat(webui): 增加脚本上传功能并更新相关组件 - 在 script_settings.py 中添加脚本上传功能 - 更新 config.example.toml 中的项目版本号 - 在 zh.json 中添加新的国际化支持项	2024-12-04 21:07:51 +08:00
linyqh	9efccea97f	refactor(app): 优化视频剪辑函数（毫秒+缓存目录） - 优化时间格式处理，支持更灵活的时间输入- 改进视频缓存目录结构，基于原视频生成哈希值 - 优化日志输出和错误处理 - 调整合并视频功能，移除未使用的示例代码 - 修复了一些与时间戳相关的小问题	2024-12-03 22:26:54 +08:00
linyqh	974a219dd3	refactor(script): 优化脚本生成中的时间戳处理（毫秒级） - 重构 calculate_duration_and_word_count 函数，提高时间戳解析精度到毫秒级 - 更新 get_batch_timestamps 函数，支持毫秒级时间戳格式- 优化字数计算公式，调整为每0.4秒一个字，并限制在10-500字范围内 -增加日志输出，提高代码可调试性	2024-12-03 21:37:33 +08:00
linyqh	f6ba1824e9	feat(video): 提升关键帧时间戳精度到毫秒 - 将关键帧时间戳精确到毫秒，格式为 HHMMSSmmm - 优化场景检测算法，增加帧数检查和未检测到边界时的处理 -调整帧差计算方式，使用浮点数提高精度 - 修改文件名格式匹配规则，支持毫秒级时间戳	2024-12-03 21:19:49 +08:00
linyqh	ee710499b9	refactor(webui): 优化音频设置界面并添加代理配置 - 修改支持的语音列表，仅保留中文语音 - 在主程序中添加代理配置环境变量 -优化剪辑视频函数，改为返回字典类型 - 更新任务服务中的剪辑视频函数，适应新的参数类型 - 修改测试用例中的视频剪辑函数，增加输出路径参数 - 更新脚本控制器中的剪辑视频函数，集成任务 ID 和子视频字典	2024-11-27 23:26:43 +08:00
linyq	7346396c64	refactor(webui): 修复未选中字幕生效问题 - 将 get_subtitle_params 函数中的 'enabled' 键名修改为 'subtitle_enabled'，以保持与 session_state 中的键名一致	2024-11-27 22:11:31 +08:00
linyq	d67300cdd5	feat(webui): 增加文案生成模型设置和测试连接功能 - 在基本设置中添加新的视觉模型提供商选项 - 实现文本模型连接测试功能，支持 OpenAI、Moonshot、DeepSeek等提供商 - 更新多语言文案，增加新的提示信息	2024-11-27 21:52:39 +08:00
linyq	53b8cded04	refactor(webui): 优化视觉分析批次处理逻辑 - 提取 vision_batch_size 到单独变量，提高代码可读性 - 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size") - 添加调试日志，记录批次数量和每批次的图片数量	2024-11-26 16:38:57 +08:00
linyq	9c58102558	feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词 - 在视频审查面板中添加剪辑模式选择选项 - 提供三种剪辑模式：仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息	2024-11-22 15:39:10 +08:00
linyq	6fa80d1266	refactor(webui): 优化剧本生成功能 - 调整 API 请求方式，使用 JSON 数据发送请求 - 添加请求头，指定内容类型为 application/json -优化异常处理，捕获具体异常信息	2024-11-21 16:50:46 +08:00
linyqh	bfc601e679	refactor(webui): 重构 API 参数格式 - 移除了 config.example.toml 中的多余注释 - 更新了 script_settings.py 中的 API 参数格式，简化为更通用的结构 - 调整了参数名称，使其更加清晰和一致	2024-11-21 03:21:18 +08:00
linyq	420f9392e3	feat(webui): 新增脚本设置功能并优化关键帧提取- 在 script_settings.py 中添加了三个新的输入框，用于设置 skip_seconds、threshold 和 vision_batch_size- 更新了关键帧提取过程，使用新设置的参数替代了配置文件中的固定值 - 在 i18n/zh.json 中添加了相关翻译，确保新功能支持中文	2024-11-18 12:19:48 +08:00
linyq	07c3d540c5	feat(webui): 添加视觉模型连接测试功能 - 新增 test_vision_model_connection 函数，用于测试视觉模型连接 - 在视觉模型设置界面添加测试连接按钮 - 实现对 Gemini 和 NarratoAPI 两种提供商的连接测试 - 优化界面布局，注释掉部分冗余代码	2024-11-18 11:55:11 +08:00
linyq	cc44aab181	feat(video): 实现关键帧提取 V2 版本 - 新增 VideoProcessor 类，实现视频预处理、场景边界检测、关键帧提取等功能 - 在 config.example.toml 中添加 frames 配置项，用于控制关键帧提取参数- 修改 script_settings.py，支持使用新的 VideoProcessor 进行关键帧提取 - 优化关键帧提取流程，提高处理效率和准确性	2024-11-15 18:03:23 +08:00
linyq	4c57fe0fa9	feat(webui): 集成 DeepSeek 文本生成模型 - 在文本生成模型提供商列表中添加 DeepSeek - 实现 DeepSeek API 的生成器类 - 在脚本生成器中支持 DeepSeek 模型 - 优化脚本处理过程中的错误提示	2024-11-15 16:03:59 +08:00
linyq	eaa8ceb7e3	refactor(script_generator): 重构脚本生成器 - 优化了基本设置中的文本生成模型提供商选择 - 重新设计了脚本生成器的架构，提高了可扩展性和维护性 - 为 OpenAI、Gemini、Qwen 和 Moonshot 生成器实现了统一的接口和流程 - 移除了字数控制要求，简化了生成逻辑	2024-11-11 17:22:01 +08:00
linyqh	d0462ce91b	0.3.4 修改各种bug	2024-11-10 16:22:04 +08:00

1 2

57 Commits