NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-06-17 12:52:15 +00:00

Author	SHA1	Message	Date
viccy	ed4a5d07e5	feat(short_drama_editing): 添加强短剧混剪剪辑脚本生成完整功能 - 新增短剧混剪脚本生成专用提示词类并完成注册 - 优化merge_script工具函数，支持多视频路径输入、自动填充视频信息 - 扩展SDP处理流水线，新增直接基于剧情分析和字幕生成剪辑脚本的逻辑 - 更新WebUI相关组件与工具函数，适配新的短剧混剪脚本生成流程 - 添加字幕时间戳校验与路径规范化工具，确保生成脚本合法性	2026-06-15 01:16:30 +08:00
viccy	9f28fcfa98	feat: 添加LLM驱动的字幕翻译功能新增配置项以配置字幕翻译批次大小和最大并发数补充中、英文国际化文案支持翻译相关界面实现核心字幕翻译服务，支持批量处理与并发执行添加WebUI界面用于触发和监控字幕翻译任务新增完整单元测试覆盖翻译功能全流程	2026-06-11 10:09:58 +08:00
viccy	f6bda521b2	feat(webui, jianying): 添加自动字幕匹配功能并修复webui状态问题 - 为剪映任务模块新增自动根据视频文件名匹配对应字幕文件的逻辑，当未传入原始字幕路径时自动查找并选择最新的匹配字幕 - 修复webui脚本设置页的selectbox状态同步问题，改用session_state作为唯一状态源，避免同时传递index和key导致的冲突 - 更新webui脚本路径的特殊路径判断列表，新增MODE_FILE的特殊情况处理 - 新增两个单元测试用例验证自动字幕匹配和原片字幕导入功能	2026-06-08 16:23:10 +08:00
viccy	dc12f390bb	feat: 新增原片字幕支持并优化视频合并流程 - 为VideoClipParams新增原字幕路径配置字段，支持单条/多条字幕路径 - 完善webui参数获取逻辑，处理字幕路径兼容性并对接前端选择 - 重构后端字幕处理流程，支持自动匹配视频对应原字幕，合并原声字幕 - 优化视频合并逻辑，新增ffmpeg无损copy合并判断，自动回退重编码提升效率 - 新增ffmpeg快速素材合并路径，支持自定义字幕样式与多音轨混合 - 新增多个单元测试覆盖字幕匹配、合并及视频合并场景	2026-06-08 13:05:30 +08:00
viccy	d10c2ff7c5	feat(prompts, webui, llm): 新增影视解说功能及配套更新 - 新增影视解说专属提示词模块，覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程 - 注册影视解说模块到全局提示词系统，更新初始化加载逻辑 - 重构Tavily搜索服务，拆分通用搜索函数适配短剧和影视两类作品 - 更新WebUI界面，新增影视解说配置项、多语言翻译与版本号展示 - 升级项目版本号从0.7.9到0.8.1 - 调整LLM服务与适配器逻辑，支持自定义prompt分类适配不同解说类型 - 完善相关工具类与单元测试，覆盖影视解说场景调用流程	2026-06-08 00:30:37 +08:00
viccy	34d5532119	feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持添加 FireRedASR2 本地 ASR 转写后端的完整支持： 1. 新增配置参数与数据模型字段 2. 更新示例配置文件，添加默认本地服务地址 3. 完善任务服务中的转写逻辑，支持 FireRedASR 后端 4. 更新 WebUI 界面，新增对应配置选项 5. 补充中英文多语言翻译 6. 新增本地 FireRedASR 服务的单元测试	2026-06-07 17:58:02 +08:00
viccy	e6e39d2dcd	feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持 - 新增短剧解说全流程四类提示词模板：解说文案生成、片段规划、文案画面匹配、脚本修复 - 重构原有脚本生成提示词至v2.1，改为基于上游规划片段生成合规解说脚本 - 为LLM基础服务层新增流式文本生成接口，完善OpenAI兼容提供商的流式实现，支持流式回调与推理内容提取 - 重构OpenAI兼容文本提供商的生成逻辑，提取公共参数构建方法 - 新增多语言国际化文案，覆盖解说语言、短剧类型、原片占比等配置项与交互提示 - 新增多套单元测试，覆盖脚本校验、适配器流程、工具函数等模块 - 封装SubtitleAnalyzerAdapter，统一短剧解说脚本生成的整套业务接口 - 新增前端交互所需的解说文案审核相关提示文案	2026-06-07 17:10:48 +08:00
viccy	342fc15f3b	feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持新增OmniVoice语音合成引擎全流程支持，包含配置项、WebUI界面与服务实现集成Tavily联网搜索能力，支持短剧剧情分析前自动检索剧情背景信息新增多视频源剪辑支持，完善脚本校验规则并重构剪辑逻辑适配多视频路径重构LLM剧情分析Prompt，优化输出格式适配多场景与联网检索结果调整streamlit版本至1.56.0修复兼容性问题新增相关单元测试与多语言翻译，更新配置示例文件	2026-06-07 01:24:32 +08:00
viccy	0bd001ce33	feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置 - 添加字幕校准服务，支持通过LLM校对SRT格式字幕文件，支持批量处理 - 为视频参数模型新增video_origin_paths字段，支持多视频上传与批量处理 - 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持 - 重构WebUI模型设置页面，将通用生成参数配置拆分到各模型的独立配置项中 - 更新示例配置文件与默认配置，新增对应参数的默认值 - 完善多语言国际化文案，添加批量操作与字幕校准相关翻译 - 添加相关单元测试以覆盖新功能与配置项	2026-06-05 23:15:11 +08:00
viccy	e6d15fe246	feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置 - 抽离通用生成参数设置组件，统一管理temperature等LLM生成参数 - 新增短剧字幕剧情分析功能，支持一键分析与手动编辑分析结果 - 重构短剧脚本生成逻辑，支持传入预先生成的剧情分析内容 - 新增可视化视频脚本表格编辑器，支持增删编辑行与原始JSON预览 - 优化多语言翻译、UI交互细节与字幕相关提示文案	2026-06-05 19:31:35 +08:00
viccy	e744960ac1	feat: 新增本地FunASR支持并优化网页端视频与字幕工作流 - 更新示例配置文件，添加本地FunASR后端配置项 - 重构fun_asr_subtitle服务，完整支持本地FunASR-Pack API调用 - 优化多语言翻译文件，更新界面相关译文 - 重写网页端视频选择组件，支持本地资源目录选择和直接上传 - 重构字幕转写UI，支持本地/在线百炼/直接上传三种模式 - 新增本地FunASR相关单元测试	2026-06-05 18:46:56 +08:00
viccy	89eebb8b41	feat(webui): 完善国际化多语言适配将webui所有页面的硬编码中文提示文本替换为多语言翻译调用，为相关函数添加兼容的tr参数，同时补充zh.json和en.json中的对应翻译词条。	2026-06-05 16:36:03 +08:00
viccy	a1b434fbda	refactor: 优化脚本设置与配置更新逻辑重构 script_settings.py 中的脚本模式状态处理逻辑，完善会话状态 fallback 与默认值处理，新增 required 参数修复空选择问题。新增 update_app_config_if_changed 工具函数，仅在配置值实际变更时更新配置，替换基础设置中多处直接修改配置的代码，统一逻辑并减少不必要的状态更新。	2026-06-05 15:29:15 +08:00
viccy	99dd4193ae	feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能 - 在 WebUI 中增加 Fun-ASR 转录界面，支持上传多种音视频格式并生成 SRT 字幕 - 新增 `app/services/fun_asr_subtitle.py` 服务模块，实现完整的 REST API 调用流程，包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换 - 在配置文件中增加 `[fun_asr]` 配置段，支持保存 API Key - 添加完整的单元测试，覆盖核心转换逻辑和服务流程 - 为兼容 Python 3.11 以下版本，将 `tomllib` 导入改为尝试导入并回退到 `tomli` - 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解	2026-04-27 18:15:54 +08:00
linyq	0706b00577	feat: 修复 windows 环境下短剧混剪报错 bug，添加字幕文本处理模块，优化字幕读取和规范化逻辑	2026-01-10 02:28:01 +08:00
linyq	26f0dfeab5	fix: 修复短剧混剪字幕在 windows 环境下加载失败	2025-12-25 01:16:00 +08:00
linyq	5f73c57313	fix: 优化短剧混剪使用体验	2025-12-24 13:18:52 +08:00
linyq	d5f089c9a7	feat: 优化LLM服务配置与迁移适配，并更新相关UI设置及中文翻译	2025-12-12 11:42:12 +08:00
linyq	bb7362809a	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-12-12 11:36:04 +08:00
linyq	787d17a1a9	feat(script): 合并脚本保存与格式验证功能重构脚本保存流程，将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能，包括字段类型、格式和必填项验证。	2025-12-12 11:36:04 +08:00
linyq	e7db1668f8	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-12-12 11:36:04 +08:00
linyq	2ef42fda46	feat(webui): 优化短剧解说功能 - 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数 - 修改 prompt 模板以包含短剧名称 - 调整组件渲染顺序，提高用户体验	2025-05-11 00:13:56 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	048b2ff39a	feat(webui): 新增短剧解说脚本生成功能 - 添加短剧解说模式，支持上传字幕文件 - 实现短剧解说脚本生成逻辑 -优化脚本设置界面布局，支持多种脚本类型 - 修复部分功能模块的引用错误	2025-05-10 22:57:05 +08:00
linyq	0ccb019f88	refactor(app): 重构视频剪辑功能并优化性能 - 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑 - 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则 - 调整了错误处理和日志记录方式	2025-05-07 23:08:26 +08:00
linyq	2dc83bc18e	perf(vision): 优化视觉分析流程和批量处理逻辑 - 移除了 vision_analysis_prompt 配置项 - 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑 - 更新了文档生成脚本和 UI 组件以适应新的分析流程 - 调整了视频帧提取相关函数，移除了不必要的 skip_seconds 参数 - 更新了中文翻译文件，添加了新的批处理大小相关提示	2025-05-07 18:44:37 +08:00
linyq	82823297f2	feat(script): 添加帧间隔输入参数并更新相关逻辑 - 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数，默认为 5 - 更新 VideoProcessor 的 process_video_pipeline 方法，调整帧提取间隔逻辑 - 修改前端界面，增加帧间隔输入框并更新相关翻译文本 - 优化 generate_script_docu 函数，使用新的帧间隔参数进行视频处理	2025-05-07 16:43:00 +08:00
linyqh	bc236cd195	更新配置文件和Web界面，支持自定义短剧混剪片段 - 将项目版本更新至0.5.3 - 修改视觉大模型提供商为qwenvl，并更新相关API密钥和模型名称 - 新增DeepSeek API支持，更新文本生成模型设置 - 在Web界面中添加短视频生成模式的选项，调整脚本设置以支持自定义片段数量 - 修改代理设置的默认值为False	2025-04-13 14:07:35 +08:00
linyq	c065800072	feat(webui): 大改动标记1 -重构音频设置面板，增加语音音量、背景音乐等设置 - 添加背景音乐文件选择功能 - 优化字幕设置，支持自定义字体和样式 -调整视频生成流程，支持新音频设置 - 更新文档示例，反映新功能	2024-12-10 18:33:44 +08:00
linyq	d2f724217c	refactor(webui): 重构视频脚本生成-目录结果 - 将视频脚本生成相关代码从 script_settings.py 移动到新的 generate_script_docu.py 文件 - 新增 base.py 文件，提取公共工具函数 - 优化代码结构，提高可维护性和可读性- 重构函数名称，更清晰地反映功能	2024-12-06 18:18:23 +08:00
linyqh	f44d56110e	feat(vision): 添加 QwenVL 视觉分析支持 - 新增 QwenVL 视觉分析器类，实现对阿里云 Qwen 模型的支持 - 更新基础设置界面，增加代理配置和 QwenVL 模型可用性检测 - 修改脚本生成逻辑，支持 QwenVL 模型的图像分析 - 重构视觉分析器初始化和调用接口，提高代码复用性和可维护性	2024-12-05 21:43:26 +08:00
linyqh	0caa15e762	build: 添加 pysrt 字幕处理库	2024-12-05 20:27:01 +08:00
linyqh	0021a868b6	feat(webui): 增加脚本上传功能并更新相关组件 - 在 script_settings.py 中添加脚本上传功能 - 更新 config.example.toml 中的项目版本号 - 在 zh.json 中添加新的国际化支持项	2024-12-04 21:07:51 +08:00
linyqh	9efccea97f	refactor(app): 优化视频剪辑函数（毫秒+缓存目录） - 优化时间格式处理，支持更灵活的时间输入- 改进视频缓存目录结构，基于原视频生成哈希值 - 优化日志输出和错误处理 - 调整合并视频功能，移除未使用的示例代码 - 修复了一些与时间戳相关的小问题	2024-12-03 22:26:54 +08:00
linyqh	974a219dd3	refactor(script): 优化脚本生成中的时间戳处理（毫秒级） - 重构 calculate_duration_and_word_count 函数，提高时间戳解析精度到毫秒级 - 更新 get_batch_timestamps 函数，支持毫秒级时间戳格式- 优化字数计算公式，调整为每0.4秒一个字，并限制在10-500字范围内 -增加日志输出，提高代码可调试性	2024-12-03 21:37:33 +08:00
linyqh	f6ba1824e9	feat(video): 提升关键帧时间戳精度到毫秒 - 将关键帧时间戳精确到毫秒，格式为 HHMMSSmmm - 优化场景检测算法，增加帧数检查和未检测到边界时的处理 -调整帧差计算方式，使用浮点数提高精度 - 修改文件名格式匹配规则，支持毫秒级时间戳	2024-12-03 21:19:49 +08:00
linyq	d67300cdd5	feat(webui): 增加文案生成模型设置和测试连接功能 - 在基本设置中添加新的视觉模型提供商选项 - 实现文本模型连接测试功能，支持 OpenAI、Moonshot、DeepSeek等提供商 - 更新多语言文案，增加新的提示信息	2024-11-27 21:52:39 +08:00
linyq	53b8cded04	refactor(webui): 优化视觉分析批次处理逻辑 - 提取 vision_batch_size 到单独变量，提高代码可读性 - 使用 vision_batch_size 替代多次调用 config(frames.get("vision_batch_size") - 添加调试日志，记录批次数量和每批次的图片数量	2024-11-26 16:38:57 +08:00
linyq	6fa80d1266	refactor(webui): 优化剧本生成功能 - 调整 API 请求方式，使用 JSON 数据发送请求 - 添加请求头，指定内容类型为 application/json -优化异常处理，捕获具体异常信息	2024-11-21 16:50:46 +08:00
linyqh	bfc601e679	refactor(webui): 重构 API 参数格式 - 移除了 config.example.toml 中的多余注释 - 更新了 script_settings.py 中的 API 参数格式，简化为更通用的结构 - 调整了参数名称，使其更加清晰和一致	2024-11-21 03:21:18 +08:00
linyq	420f9392e3	feat(webui): 新增脚本设置功能并优化关键帧提取- 在 script_settings.py 中添加了三个新的输入框，用于设置 skip_seconds、threshold 和 vision_batch_size- 更新了关键帧提取过程，使用新设置的参数替代了配置文件中的固定值 - 在 i18n/zh.json 中添加了相关翻译，确保新功能支持中文	2024-11-18 12:19:48 +08:00
linyq	cc44aab181	feat(video): 实现关键帧提取 V2 版本 - 新增 VideoProcessor 类，实现视频预处理、场景边界检测、关键帧提取等功能 - 在 config.example.toml 中添加 frames 配置项，用于控制关键帧提取参数- 修改 script_settings.py，支持使用新的 VideoProcessor 进行关键帧提取 - 优化关键帧提取流程，提高处理效率和准确性	2024-11-15 18:03:23 +08:00
linyq	4c57fe0fa9	feat(webui): 集成 DeepSeek 文本生成模型 - 在文本生成模型提供商列表中添加 DeepSeek - 实现 DeepSeek API 的生成器类 - 在脚本生成器中支持 DeepSeek 模型 - 优化脚本处理过程中的错误提示	2024-11-15 16:03:59 +08:00
linyqh	d0462ce91b	0.3.4 修改各种bug	2024-11-10 16:22:04 +08:00
linyqh	4bafd696a1	0.3.3 解决脚本验证问题	2024-11-10 14:26:06 +08:00
linyqh	b37b0abaff	0.3.2 发版2	2024-11-10 01:31:19 +08:00
linyqh	624889a32f	0.3.2 发版	2024-11-10 01:12:44 +08:00
linyqh	072cfb9856	完成汉化和自定义提示词	2024-11-09 22:35:12 +08:00
linyqh	49b52041ce	完成了 narrato-api 生成视频脚本的逻辑	2024-11-09 20:08:51 +08:00
linyqh	8267a0b3eb	完成了gemini 生成视频脚本的逻辑	2024-11-09 18:18:57 +08:00

1 2

51 Commits