NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-06-29 18:52:07 +00:00

Author	SHA1	Message	Date
viccy	99fcd45704	feat(subtitle, ui): 新增字幕安全区预览，优化字体与字幕配置 - 新增竖屏/横屏字幕安全区预览背景图，支持切换预览比例 - 将项目版本从0.8.1升级至0.8.2 - 扩展字体搜索候选列表，新增SourceHanSerifSC-SemiBold.otf和LXGWWenKaiScreen.ttf两款字体 - 修改默认字幕字体为SourceHanSansCN-Regular.otf，替换原Microsoft YaHei默认值 - 新增内置字体检测逻辑，检测到resource/fonts目录有有效字体时跳过下载 - 更新中英文多语言文案，优化字幕位置提示文本 - 重构字幕设置面板，合并位置控制到预览区域并精简标签页 - 调整字体大小滑块范围从20-100扩展至20-160，新增数值边界校验	2026-06-10 12:05:05 +08:00
viccy	7a5303aa20	feat(ffmpeg,webui): 新增 FFmpeg 引擎管理与检测功能 - 新增配置项 ffmpeg_path 及路径应用逻辑，自动配置 FFmpeg 环境变量 - 实现全量 FFmpeg 引擎自动发现、能力检测工具链，支持多来源识别 - 添加 WebUI 系统设置面板，支持选择、测试和保存 FFmpeg 引擎 - 优化视频合并模块的 FFmpeg 调用，新增进度日志与流式输出处理 - 新增 FFmpeg 检测器单元测试覆盖核心功能	2026-06-08 13:28:27 +08:00
viccy	d10c2ff7c5	feat(prompts, webui, llm): 新增影视解说功能及配套更新 - 新增影视解说专属提示词模块，覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程 - 注册影视解说模块到全局提示词系统，更新初始化加载逻辑 - 重构Tavily搜索服务，拆分通用搜索函数适配短剧和影视两类作品 - 更新WebUI界面，新增影视解说配置项、多语言翻译与版本号展示 - 升级项目版本号从0.7.9到0.8.1 - 调整LLM服务与适配器逻辑，支持自定义prompt分类适配不同解说类型 - 完善相关工具类与单元测试，覆盖影视解说场景调用流程	2026-06-08 00:30:37 +08:00
viccy	4ab29fd776	feat: 优化视频生成进度展示与UI细节 - 为视频生成任务的每个处理步骤添加详细的中文状态提示 - 重构WebUI的视频生成弹窗，使用Streamlit原生状态组件优化进度展示 - 清理多语言翻译文本中的冗余表情符号，统一UI文本风格 - 调整TTS设置面板的折叠面板默认展开状态为关闭，并移除标题中的表情前缀	2026-06-07 18:36:47 +08:00
viccy	34d5532119	feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持添加 FireRedASR2 本地 ASR 转写后端的完整支持： 1. 新增配置参数与数据模型字段 2. 更新示例配置文件，添加默认本地服务地址 3. 完善任务服务中的转写逻辑，支持 FireRedASR 后端 4. 更新 WebUI 界面，新增对应配置选项 5. 补充中英文多语言翻译 6. 新增本地 FireRedASR 服务的单元测试	2026-06-07 17:58:02 +08:00
viccy	e6e39d2dcd	feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持 - 新增短剧解说全流程四类提示词模板：解说文案生成、片段规划、文案画面匹配、脚本修复 - 重构原有脚本生成提示词至v2.1，改为基于上游规划片段生成合规解说脚本 - 为LLM基础服务层新增流式文本生成接口，完善OpenAI兼容提供商的流式实现，支持流式回调与推理内容提取 - 重构OpenAI兼容文本提供商的生成逻辑，提取公共参数构建方法 - 新增多语言国际化文案，覆盖解说语言、短剧类型、原片占比等配置项与交互提示 - 新增多套单元测试，覆盖脚本校验、适配器流程、工具函数等模块 - 封装SubtitleAnalyzerAdapter，统一短剧解说脚本生成的整套业务接口 - 新增前端交互所需的解说文案审核相关提示文案	2026-06-07 17:10:48 +08:00
viccy	342fc15f3b	feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持新增OmniVoice语音合成引擎全流程支持，包含配置项、WebUI界面与服务实现集成Tavily联网搜索能力，支持短剧剧情分析前自动检索剧情背景信息新增多视频源剪辑支持，完善脚本校验规则并重构剪辑逻辑适配多视频路径重构LLM剧情分析Prompt，优化输出格式适配多场景与联网检索结果调整streamlit版本至1.56.0修复兼容性问题新增相关单元测试与多语言翻译，更新配置示例文件	2026-06-07 01:24:32 +08:00
viccy	d147fe66e4	feat(tts): 新增IndexTTS-2语音合成引擎支持实现兼容IndexTTS2-Pack API的完整TTS调用流程，包含音频下载、错误重试等处理重构原有IndexTTS-1.5代码，抽象通用逻辑以同时兼容indextts和indextts2两个引擎新增IndexTTS-2的WebUI配置界面，支持情感控制与高级生成参数调整更新配置示例文件与中英多语言文案，完善配置迁移逻辑兼容旧版配置新增对应单元测试覆盖参数处理与配置迁移流程	2026-06-06 14:31:09 +08:00
viccy	a2645aebd3	feat(webui): 优化剪映草稿导出的用户体验 - 更新streamlit依赖至1.57.0以支持原生弹窗组件 - 重构剪映导出逻辑，使用原生弹窗替代旧的内联表单 - 新增带样式的导出确认面板并补充多语言翻译 - 简化导出状态渲染与会话状态管理逻辑	2026-06-06 12:43:57 +08:00
viccy	5a9775d62d	feat: 支持横竖屏自定义字幕位置，重构剪映导出逻辑 - 新增横竖屏分别的字幕垂直位置配置，默认值分别为85%和82% - 更新WebUI字幕设置界面，新增独立的横屏/竖屏字幕位置标签页，在预览画面中添加蓝线标注当前字幕位置 - 重构剪映草稿导出逻辑，将相关代码抽离至独立模块，移除requirements.txt中的pyJianYingDraft直接依赖 - 优化媒体时长处理逻辑，新增时长缓存和自动裁剪处理，添加完整的单元测试覆盖 - 更新配置示例文件、数据Schema定义和中英多语言翻译文件	2026-06-06 12:01:36 +08:00
viccy	33c17c2636	feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能，优化背景音乐设置 - 新增字幕遮罩功能，可在烧录新字幕前遮盖原视频自带的字幕区域，支持横屏/竖屏自定义配置与预览调试 - 新增自动字幕转录功能，支持本地FunASR和阿里百炼在线转写，在最终视频合并完成后自动生成并压入成片字幕 - 重构背景音乐设置面板，新增从资源目录选择BGM、上传本地BGM文件的功能，新增BGM试听预览，优化交互流程 - 更新配置示例文件、数据Schema与多语言翻译文件，完善前后端参数传递逻辑	2026-06-06 01:08:35 +08:00
viccy	5b2487e879	feat(indextts2, webui): 完善 IndexTTS2 支持，新增参考音频选择与预览功能修改内容包括： - 修正缺失参考音频的错误提示文本 - 更新示例配置文件，新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎 - 更新语音服务模块的注释与文档字符串 - 新增多语言适配文案，支持新UI的所有提示内容 - 重构 IndexTTS2 设置页面：支持从资源目录选择音频、上传本地音频、预览音频效果 - 调整TTS引擎选项的排序与默认选中项	2026-06-05 23:52:31 +08:00
viccy	0bd001ce33	feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置 - 添加字幕校准服务，支持通过LLM校对SRT格式字幕文件，支持批量处理 - 为视频参数模型新增video_origin_paths字段，支持多视频上传与批量处理 - 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持 - 重构WebUI模型设置页面，将通用生成参数配置拆分到各模型的独立配置项中 - 更新示例配置文件与默认配置，新增对应参数的默认值 - 完善多语言国际化文案，添加批量操作与字幕校准相关翻译 - 添加相关单元测试以覆盖新功能与配置项	2026-06-05 23:15:11 +08:00
viccy	e6d15fe246	feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置 - 抽离通用生成参数设置组件，统一管理temperature等LLM生成参数 - 新增短剧字幕剧情分析功能，支持一键分析与手动编辑分析结果 - 重构短剧脚本生成逻辑，支持传入预先生成的剧情分析内容 - 新增可视化视频脚本表格编辑器，支持增删编辑行与原始JSON预览 - 优化多语言翻译、UI交互细节与字幕相关提示文案	2026-06-05 19:31:35 +08:00
viccy	e744960ac1	feat: 新增本地FunASR支持并优化网页端视频与字幕工作流 - 更新示例配置文件，添加本地FunASR后端配置项 - 重构fun_asr_subtitle服务，完整支持本地FunASR-Pack API调用 - 优化多语言翻译文件，更新界面相关译文 - 重写网页端视频选择组件，支持本地资源目录选择和直接上传 - 重构字幕转写UI，支持本地/在线百炼/直接上传三种模式 - 新增本地FunASR相关单元测试	2026-06-05 18:46:56 +08:00
viccy	89eebb8b41	feat(webui): 完善国际化多语言适配将webui所有页面的硬编码中文提示文本替换为多语言翻译调用，为相关函数添加兼容的tr参数，同时补充zh.json和en.json中的对应翻译词条。	2026-06-05 16:36:03 +08:00
linyq	474ebe46e2	feat: 新增基础设置项并提供中文翻译	2025-12-12 11:42:12 +08:00
linyq	d5f089c9a7	feat: 优化LLM服务配置与迁移适配，并更新相关UI设置及中文翻译	2025-12-12 11:42:12 +08:00
linyq	d7b1b51a36	fix: 使用 litellm 管理模型供应商	2025-12-12 11:40:44 +08:00
linyq	b5548b050d	dev0.7.1 预发布	2025-12-12 11:36:04 +08:00
linyq	bb7362809a	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-12-12 11:36:04 +08:00
linyq	a184662f8b	refactor: 移除视频字幕合并功能及相关代码清理不再使用的视频字幕合并功能，包括删除合并设置组件、合并工具函数和相关的国际化文本	2025-12-12 11:36:04 +08:00
linyq	e7db1668f8	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-12-12 11:36:04 +08:00
linyq	e389412dc2	feat(tts): 添加 SoulVoice TTS 引擎支持实现 SoulVoice TTS 引擎集成，包括配置管理、语音选择、API 调用和字幕处理新增 SoulVoice 配置项和示例配置修改音频设置面板以支持 SoulVoice 选项优化音频时长计算和异常处理更新多语言文案以反映 SoulVoice 支持	2025-12-12 11:36:04 +08:00
linyq	342a4ac1a8	refactor(webui): 修复合并视频与字幕功能 - 注释掉 merge_settings.py 中的一键转录功能 - 更新 base.py 中的 API URL - 在 merge_video.py 中添加 pysrt导入 - 更新 requirements.txt，添加 pysrt 依赖 - 修改 zh.json 中的缺失字幕文件提示信息	2025-05-12 10:55:17 +08:00
linyq	7b75f12524	feat(webui): 更新简体中文翻译 - 在 zh.json 文件中更新了短剧解说功能的描述 - 明确指出短剧解说功能目前仅支持 gemini-2.0-flash 模型	2025-05-11 00:16:15 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	2dc83bc18e	perf(vision): 优化视觉分析流程和批量处理逻辑 - 移除了 vision_analysis_prompt 配置项 - 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑 - 更新了文档生成脚本和 UI 组件以适应新的分析流程 - 调整了视频帧提取相关函数，移除了不必要的 skip_seconds 参数 - 更新了中文翻译文件，添加了新的批处理大小相关提示	2025-05-07 18:44:37 +08:00
linyq	82823297f2	feat(script): 添加帧间隔输入参数并更新相关逻辑 - 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数，默认为 5 - 更新 VideoProcessor 的 process_video_pipeline 方法，调整帧提取间隔逻辑 - 修改前端界面，增加帧间隔输入框并更新相关翻译文本 - 优化 generate_script_docu 函数，使用新的帧间隔参数进行视频处理	2025-05-07 16:43:00 +08:00
linyqh	074f1d103b	feat(webui): 更新文案生成模型设置支持 DeepSeek - 调整文本生成模型提供商顺序，将 DeepSeek 置顶 - 修改 DeepSeek API 基础 URL 和模型名称 - 移除短剧混剪功能中的模型限制描述	2025-03-06 01:52:26 +08:00
linyq	c065800072	feat(webui): 大改动标记1 -重构音频设置面板，增加语音音量、背景音乐等设置 - 添加背景音乐文件选择功能 - 优化字幕设置，支持自定义字体和样式 -调整视频生成流程，支持新音频设置 - 更新文档示例，反映新功能	2024-12-10 18:33:44 +08:00
linyq	65d5a681ac	feat(webui): 视频合并添加一键转录功能 -改进文件上传和预览逻辑，支持视频和字幕文件的独立上传 - 添加字幕预览功能，可显示已上传字幕文件的内容 - 实现一键转录功能，为没有字幕的视频生成字幕 -优化合并文件的流程，提高合并效率 - 增加合并结果预览，方便用户查看合并后的视频和字幕 -重构代码，提高可维护性和可扩展性	2024-12-06 18:01:14 +08:00
linyqh	4e590380f5	feat(webui): 添加系统设置功能 - 新增系统设置面板，包含清理缓存、关键帧、裁剪视频和任务目录的功能- 实现清理指定目录的通用函数 clear_directory - 更新中文翻译文件，添加相关提示信息	2024-12-05 22:36:17 +08:00
linyqh	f44d56110e	feat(vision): 添加 QwenVL 视觉分析支持 - 新增 QwenVL 视觉分析器类，实现对阿里云 Qwen 模型的支持 - 更新基础设置界面，增加代理配置和 QwenVL 模型可用性检测 - 修改脚本生成逻辑，支持 QwenVL 模型的图像分析 - 重构视觉分析器初始化和调用接口，提高代码复用性和可维护性	2024-12-05 21:43:26 +08:00
linyqh	52180d49c9	feat(merge): 合并视频字幕 - 新增 merge_settings 组件用于视频字幕合并设置 - 实现视频和字幕文件的上传、匹配和排序功能 - 添加合并视频和字幕的逻辑，支持多文件合并- 优化用户界面，增加预览和错误处理功能	2024-12-05 00:56:09 +08:00
linyqh	0021a868b6	feat(webui): 增加脚本上传功能并更新相关组件 - 在 script_settings.py 中添加脚本上传功能 - 更新 config.example.toml 中的项目版本号 - 在 zh.json 中添加新的国际化支持项	2024-12-04 21:07:51 +08:00
linyq	8dd4b27fc3	feat(app): 新增脚本生成 V2 接口并重构相关功能 - 新增 V2脚本生成接口和相关服务 - 重构脚本生成逻辑，提高可维护性和可扩展性 - 优化关键帧提取和处理流程 - 改进错误处理和日志记录	2024-11-27 23:26:43 +08:00
linyq	d67300cdd5	feat(webui): 增加文案生成模型设置和测试连接功能 - 在基本设置中添加新的视觉模型提供商选项 - 实现文本模型连接测试功能，支持 OpenAI、Moonshot、DeepSeek等提供商 - 更新多语言文案，增加新的提示信息	2024-11-27 21:52:39 +08:00
linyq	9c58102558	feat(review_settings): 添加视频剪辑模式选择功能优化默认提示词 - 在视频审查面板中添加剪辑模式选择选项 - 提供三种剪辑模式：仅保留音频、仅保留原声、保留原声和音频- 在 UI 中添加相应的提示信息	2024-11-22 15:39:10 +08:00
linyq	420f9392e3	feat(webui): 新增脚本设置功能并优化关键帧提取- 在 script_settings.py 中添加了三个新的输入框，用于设置 skip_seconds、threshold 和 vision_batch_size- 更新了关键帧提取过程，使用新设置的参数替代了配置文件中的固定值 - 在 i18n/zh.json 中添加了相关翻译，确保新功能支持中文	2024-11-18 12:19:48 +08:00
linyqh	072cfb9856	完成汉化和自定义提示词	2024-11-09 22:35:12 +08:00
linyqh	bb18a754fe	webui 代码重构；	2024-11-09 02:26:39 +08:00
linyq	e926e8676a	优化 TTS 新增 proxy 配置，新增语调配置	2024-11-05 18:33:46 +08:00
linyqh	56b027bd43	优化基础配置	2024-09-30 02:14:20 +08:00
linyq	decac3b11d	完成优化webui体验-剪辑逻辑进度90%；待优化点： 1. 优化脚本-解说质量	2024-09-29 18:34:36 +08:00
linyqh	d6663fde21	优化 webui.py; 脚本剪辑不稳定	2024-09-25 01:43:55 +08:00
linyq	6669b28361	优化 webui 代码逻辑	2024-09-24 18:25:02 +08:00
linyq	d67be7f98d	优化文档	2024-08-20 10:53:55 +08:00
linyq	49edc15c3c	优化中英文档；配置视频上传限制为2G	2024-08-13 18:08:39 +08:00
linyqh	f0dee9a8e2	新增上传视频功能；优化系统bug	2024-08-12 23:44:28 +08:00

1 2

51 Commits