viccy
|
ed4a5d07e5
|
feat(short_drama_editing): 添加强短剧混剪剪辑脚本生成完整功能
- 新增短剧混剪脚本生成专用提示词类并完成注册
- 优化merge_script工具函数,支持多视频路径输入、自动填充视频信息
- 扩展SDP处理流水线,新增直接基于剧情分析和字幕生成剪辑脚本的逻辑
- 更新WebUI相关组件与工具函数,适配新的短剧混剪脚本生成流程
- 添加字幕时间戳校验与路径规范化工具,确保生成脚本合法性
|
2026-06-15 01:16:30 +08:00 |
|
viccy
|
8b1fcbafa5
|
chore(app/utils): 移除两个废弃的Gemini视觉分析工具文件
|
2026-06-14 00:28:33 +08:00 |
|
viccy
|
9f28fcfa98
|
feat: 添加LLM驱动的字幕翻译功能
新增配置项以配置字幕翻译批次大小和最大并发数
补充中、英文国际化文案支持翻译相关界面
实现核心字幕翻译服务,支持批量处理与并发执行
添加WebUI界面用于触发和监控字幕翻译任务
新增完整单元测试覆盖翻译功能全流程
|
2026-06-11 10:09:58 +08:00 |
|
viccy
|
b9f07a6a10
|
Merge pull request #251 from linyqh/develop
feat(subtitle, ui): 新增字幕安全区预览,优化字体与字幕配置
v0.8.2
|
2026-06-10 12:16:37 +08:00 |
|
viccy
|
99fcd45704
|
feat(subtitle, ui): 新增字幕安全区预览,优化字体与字幕配置
- 新增竖屏/横屏字幕安全区预览背景图,支持切换预览比例
- 将项目版本从0.8.1升级至0.8.2
- 扩展字体搜索候选列表,新增SourceHanSerifSC-SemiBold.otf和LXGWWenKaiScreen.ttf两款字体
- 修改默认字幕字体为SourceHanSansCN-Regular.otf,替换原Microsoft YaHei默认值
- 新增内置字体检测逻辑,检测到resource/fonts目录有有效字体时跳过下载
- 更新中英文多语言文案,优化字幕位置提示文本
- 重构字幕设置面板,合并位置控制到预览区域并精简标签页
- 调整字体大小滑块范围从20-100扩展至20-160,新增数值边界校验
|
2026-06-10 12:05:05 +08:00 |
|
viccy
|
2fd397e05a
|
Merge pull request #250 from linyqh/develop
Release: NarratoAI v0.8.x
v0.8.1
|
2026-06-10 00:08:22 +08:00 |
|
viccy
|
25ae35484f
|
feat: 更新文档
|
2026-06-10 00:04:20 +08:00 |
|
viccy
|
f6bda521b2
|
feat(webui, jianying): 添加自动字幕匹配功能并修复webui状态问题
- 为剪映任务模块新增自动根据视频文件名匹配对应字幕文件的逻辑,当未传入原始字幕路径时自动查找并选择最新的匹配字幕
- 修复webui脚本设置页的selectbox状态同步问题,改用session_state作为唯一状态源,避免同时传递index和key导致的冲突
- 更新webui脚本路径的特殊路径判断列表,新增MODE_FILE的特殊情况处理
- 新增两个单元测试用例验证自动字幕匹配和原片字幕导入功能
|
2026-06-08 16:23:10 +08:00 |
|
viccy
|
7d4bd45f69
|
feat: 新增视频生成进度追踪与WebUI展示,优化剪映导出功能
- 添加FFmpeg视频合并进度回调支持,实现实时进度上报
- 为进度回调添加参数校验与异常捕获,避免回调失败影响主流程
- 重构任务状态更新逻辑,统一封装任务更新函数减少重复代码
- 重新划分视频生成的6个标准步骤,更新各阶段的状态上报逻辑
- 更新WebUI界面,支持展示当前生成步骤、总步骤与FFmpeg实时进度
- 优化剪映草稿导出功能,不再预先裁剪原视频,直接引用源素材时间戳
- 新增剪映草稿字幕生成功能,并补充对应的单元测试用例
|
2026-06-08 16:02:20 +08:00 |
|
viccy
|
7a5303aa20
|
feat(ffmpeg,webui): 新增 FFmpeg 引擎管理与检测功能
- 新增配置项 ffmpeg_path 及路径应用逻辑,自动配置 FFmpeg 环境变量
- 实现全量 FFmpeg 引擎自动发现、能力检测工具链,支持多来源识别
- 添加 WebUI 系统设置面板,支持选择、测试和保存 FFmpeg 引擎
- 优化视频合并模块的 FFmpeg 调用,新增进度日志与流式输出处理
- 新增 FFmpeg 检测器单元测试覆盖核心功能
|
2026-06-08 13:28:27 +08:00 |
|
viccy
|
dc12f390bb
|
feat: 新增原片字幕支持并优化视频合并流程
- 为VideoClipParams新增原字幕路径配置字段,支持单条/多条字幕路径
- 完善webui参数获取逻辑,处理字幕路径兼容性并对接前端选择
- 重构后端字幕处理流程,支持自动匹配视频对应原字幕,合并原声字幕
- 优化视频合并逻辑,新增ffmpeg无损copy合并判断,自动回退重编码提升效率
- 新增ffmpeg快速素材合并路径,支持自定义字幕样式与多音轨混合
- 新增多个单元测试覆盖字幕匹配、合并及视频合并场景
|
2026-06-08 13:05:30 +08:00 |
|
viccy
|
8e4271c2ce
|
perf(clip_video): 优化FFmpeg剪辑命令为快速搜索模式,添加单元测试
优化了视频剪辑的FFmpeg命令参数顺序,将原本后置`-ss`的慢搜索改为前置`-ss`的快速搜索模式,大幅减少长视频剪辑时的不必要解码开销。重构了时间处理逻辑,新增辅助函数统一转换时间格式与计算裁剪时长,更新了所有兼容降级的编码命令以适配新参数格式,同时新增单元测试验证命令参数的正确性。
|
2026-06-08 01:58:40 +08:00 |
|
viccy
|
d10c2ff7c5
|
feat(prompts, webui, llm): 新增影视解说功能及配套更新
- 新增影视解说专属提示词模块,覆盖剧情分析、文案生成、片段规划、脚本匹配与修复全流程
- 注册影视解说模块到全局提示词系统,更新初始化加载逻辑
- 重构Tavily搜索服务,拆分通用搜索函数适配短剧和影视两类作品
- 更新WebUI界面,新增影视解说配置项、多语言翻译与版本号展示
- 升级项目版本号从0.7.9到0.8.1
- 调整LLM服务与适配器逻辑,支持自定义prompt分类适配不同解说类型
- 完善相关工具类与单元测试,覆盖影视解说场景调用流程
|
2026-06-08 00:30:37 +08:00 |
|
viccy
|
ca4f2bf594
|
feat: 新增脚本自动字幕生成功能并优化网页视频展示
添加script_subtitle服务,支持基于脚本内容自动生成标准SRT字幕文件
修改任务处理流程,优先使用新的脚本字幕生成逻辑,失败时回退至原TTS字幕合并方案
优化最终视频自动转录逻辑,已生成脚本字幕时跳过重复的自动转录步骤
改进网页端弹窗视频的展示样式,根据宽高比调整预览宽度并添加黑色背景
新增完整的单元测试覆盖字幕生成相关功能
|
2026-06-07 19:05:49 +08:00 |
|
viccy
|
4ab29fd776
|
feat: 优化视频生成进度展示与UI细节
- 为视频生成任务的每个处理步骤添加详细的中文状态提示
- 重构WebUI的视频生成弹窗,使用Streamlit原生状态组件优化进度展示
- 清理多语言翻译文本中的冗余表情符号,统一UI文本风格
- 调整TTS设置面板的折叠面板默认展开状态为关闭,并移除标题中的表情前缀
|
2026-06-07 18:36:47 +08:00 |
|
viccy
|
34d5532119
|
feat(subtitle): 新增 FireRedASR2 本地 ASR 后端支持
添加 FireRedASR2 本地 ASR 转写后端的完整支持:
1. 新增配置参数与数据模型字段
2. 更新示例配置文件,添加默认本地服务地址
3. 完善任务服务中的转写逻辑,支持 FireRedASR 后端
4. 更新 WebUI 界面,新增对应配置选项
5. 补充中英文多语言翻译
6. 新增本地 FireRedASR 服务的单元测试
|
2026-06-07 17:58:02 +08:00 |
|
viccy
|
e6e39d2dcd
|
feat(short-drama): 完整实现短剧解说剪辑全流程并新增LLM流式生成支持
- 新增短剧解说全流程四类提示词模板:解说文案生成、片段规划、文案画面匹配、脚本修复
- 重构原有脚本生成提示词至v2.1,改为基于上游规划片段生成合规解说脚本
- 为LLM基础服务层新增流式文本生成接口,完善OpenAI兼容提供商的流式实现,支持流式回调与推理内容提取
- 重构OpenAI兼容文本提供商的生成逻辑,提取公共参数构建方法
- 新增多语言国际化文案,覆盖解说语言、短剧类型、原片占比等配置项与交互提示
- 新增多套单元测试,覆盖脚本校验、适配器流程、工具函数等模块
- 封装SubtitleAnalyzerAdapter,统一短剧解说脚本生成的整套业务接口
- 新增前端交互所需的解说文案审核相关提示文案
|
2026-06-07 17:10:48 +08:00 |
|
viccy
|
342fc15f3b
|
feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持
新增OmniVoice语音合成引擎全流程支持,包含配置项、WebUI界面与服务实现
集成Tavily联网搜索能力,支持短剧剧情分析前自动检索剧情背景信息
新增多视频源剪辑支持,完善脚本校验规则并重构剪辑逻辑适配多视频路径
重构LLM剧情分析Prompt,优化输出格式适配多场景与联网检索结果
调整streamlit版本至1.56.0修复兼容性问题
新增相关单元测试与多语言翻译,更新配置示例文件
|
2026-06-07 01:24:32 +08:00 |
|
viccy
|
d147fe66e4
|
feat(tts): 新增IndexTTS-2语音合成引擎支持
实现兼容IndexTTS2-Pack API的完整TTS调用流程,包含音频下载、错误重试等处理
重构原有IndexTTS-1.5代码,抽象通用逻辑以同时兼容indextts和indextts2两个引擎
新增IndexTTS-2的WebUI配置界面,支持情感控制与高级生成参数调整
更新配置示例文件与中英多语言文案,完善配置迁移逻辑兼容旧版配置
新增对应单元测试覆盖参数处理与配置迁移流程
|
2026-06-06 14:31:09 +08:00 |
|
viccy
|
a2645aebd3
|
feat(webui): 优化剪映草稿导出的用户体验
- 更新streamlit依赖至1.57.0以支持原生弹窗组件
- 重构剪映导出逻辑,使用原生弹窗替代旧的内联表单
- 新增带样式的导出确认面板并补充多语言翻译
- 简化导出状态渲染与会话状态管理逻辑
|
2026-06-06 12:43:57 +08:00 |
|
viccy
|
5a9775d62d
|
feat: 支持横竖屏自定义字幕位置,重构剪映导出逻辑
- 新增横竖屏分别的字幕垂直位置配置,默认值分别为85%和82%
- 更新WebUI字幕设置界面,新增独立的横屏/竖屏字幕位置标签页,在预览画面中添加蓝线标注当前字幕位置
- 重构剪映草稿导出逻辑,将相关代码抽离至独立模块,移除requirements.txt中的pyJianYingDraft直接依赖
- 优化媒体时长处理逻辑,新增时长缓存和自动裁剪处理,添加完整的单元测试覆盖
- 更新配置示例文件、数据Schema定义和中英多语言翻译文件
|
2026-06-06 12:01:36 +08:00 |
|
viccy
|
33c17c2636
|
feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能,优化背景音乐设置
- 新增字幕遮罩功能,可在烧录新字幕前遮盖原视频自带的字幕区域,支持横屏/竖屏自定义配置与预览调试
- 新增自动字幕转录功能,支持本地FunASR和阿里百炼在线转写,在最终视频合并完成后自动生成并压入成片字幕
- 重构背景音乐设置面板,新增从资源目录选择BGM、上传本地BGM文件的功能,新增BGM试听预览,优化交互流程
- 更新配置示例文件、数据Schema与多语言翻译文件,完善前后端参数传递逻辑
|
2026-06-06 01:08:35 +08:00 |
|
viccy
|
5b2487e879
|
feat(indextts2, webui): 完善 IndexTTS2 支持,新增参考音频选择与预览功能
修改内容包括:
- 修正缺失参考音频的错误提示文本
- 更新示例配置文件,新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎
- 更新语音服务模块的注释与文档字符串
- 新增多语言适配文案,支持新UI的所有提示内容
- 重构 IndexTTS2 设置页面:支持从资源目录选择音频、上传本地音频、预览音频效果
- 调整TTS引擎选项的排序与默认选中项
|
2026-06-05 23:52:31 +08:00 |
|
viccy
|
0bd001ce33
|
feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置
- 添加字幕校准服务,支持通过LLM校对SRT格式字幕文件,支持批量处理
- 为视频参数模型新增video_origin_paths字段,支持多视频上传与批量处理
- 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持
- 重构WebUI模型设置页面,将通用生成参数配置拆分到各模型的独立配置项中
- 更新示例配置文件与默认配置,新增对应参数的默认值
- 完善多语言国际化文案,添加批量操作与字幕校准相关翻译
- 添加相关单元测试以覆盖新功能与配置项
|
2026-06-05 23:15:11 +08:00 |
|
viccy
|
e6d15fe246
|
feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置
- 抽离通用生成参数设置组件,统一管理temperature等LLM生成参数
- 新增短剧字幕剧情分析功能,支持一键分析与手动编辑分析结果
- 重构短剧脚本生成逻辑,支持传入预先生成的剧情分析内容
- 新增可视化视频脚本表格编辑器,支持增删编辑行与原始JSON预览
- 优化多语言翻译、UI交互细节与字幕相关提示文案
|
2026-06-05 19:31:35 +08:00 |
|
viccy
|
e744960ac1
|
feat: 新增本地FunASR支持并优化网页端视频与字幕工作流
- 更新示例配置文件,添加本地FunASR后端配置项
- 重构fun_asr_subtitle服务,完整支持本地FunASR-Pack API调用
- 优化多语言翻译文件,更新界面相关译文
- 重写网页端视频选择组件,支持本地资源目录选择和直接上传
- 重构字幕转写UI,支持本地/在线百炼/直接上传三种模式
- 新增本地FunASR相关单元测试
|
2026-06-05 18:46:56 +08:00 |
|
viccy
|
89eebb8b41
|
feat(webui): 完善国际化多语言适配
将webui所有页面的硬编码中文提示文本替换为多语言翻译调用,为相关函数添加兼容的tr参数,同时补充zh.json和en.json中的对应翻译词条。
|
2026-06-05 16:36:03 +08:00 |
|
viccy
|
35477a933d
|
feat(edge-tts, webui): 新增动态获取音色列表功能,更新内置列表并简化UI
- 新增`get_all_edge_voices()`工具函数链,支持缓存与代理,拉取失败时回退到内置音色列表
- 更新内置音色文档与列表,修正部分命名并新增多语言神经音色及因纽特语相关音色
- 简化WebUI的Edge TTS设置界面,不再硬编码筛选音色,直接展示所有已加载的音色
|
2026-06-05 15:59:54 +08:00 |
|
viccy
|
a1b434fbda
|
refactor: 优化脚本设置与配置更新逻辑
重构 script_settings.py 中的脚本模式状态处理逻辑,完善会话状态 fallback 与默认值处理,新增 required 参数修复空选择问题。新增 update_app_config_if_changed 工具函数,仅在配置值实际变更时更新配置,替换基础设置中多处直接修改配置的代码,统一逻辑并减少不必要的状态更新。
|
2026-06-05 15:29:15 +08:00 |
|
viccy
|
283617deb0
|
feat(jianying, webui): 新增IndexTTS2支持,优化TTS处理并添加单元测试
- 重构WebUI的TTS语音名称获取逻辑,适配多种TTS引擎
- 为IndexTTS2添加参考音频校验与归一化处理
- 新增剪映任务工具函数的完整单元测试用例
- 修复音频时长取整逻辑以提升匹配精度
- 更新默认TTS引擎为配置值而非硬编码内容
|
2026-06-05 14:57:00 +08:00 |
|
viccy
|
c0b72ec603
|
chore: 更新项目版本至0.7.9并优化README内容
- 将项目版本从0.7.8更新至0.7.9
- 优化README.md的排版和结构,提升可读性
- 更新功能列表和最新资讯,新增对0.7.9版本的说明
- 移除过时的推广内容,更新赞助商标识
v0.7.9
|
2026-04-27 18:51:49 +08:00 |
|
viccy
|
99dd4193ae
|
feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能
- 在 WebUI 中增加 Fun-ASR 转录界面,支持上传多种音视频格式并生成 SRT 字幕
- 新增 `app/services/fun_asr_subtitle.py` 服务模块,实现完整的 REST API 调用流程,包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换
- 在配置文件中增加 `[fun_asr]` 配置段,支持保存 API Key
- 添加完整的单元测试,覆盖核心转换逻辑和服务流程
- 为兼容 Python 3.11 以下版本,将 `tomllib` 导入改为尝试导入并回退到 `tomli`
- 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解
|
2026-04-27 18:15:54 +08:00 |
|
viccy
|
8c129790c7
|
Merge pull request #237 from aw123456dew/feature/doubao-tts
add doubao tts
|
2026-04-08 15:14:10 +08:00 |
|
viccy
|
de33c6d0bd
|
Merge pull request #238 from aw123456dew/feature/export-jianying-draft
add export jianying draft feature
|
2026-04-08 15:13:02 +08:00 |
|
aw123456dew
|
852f5ae34c
|
fix: jianying draft export failure due to floating-point precision in audio duration
|
2026-04-07 17:13:43 +08:00 |
|
aw123456dew
|
d45c1858c9
|
add export jianying draft feature
|
2026-04-07 11:33:12 +08:00 |
|
aw123456dew
|
71dfc99839
|
add doubao tts
|
2026-04-07 09:10:50 +08:00 |
|
viccy
|
be653c5748
|
Merge pull request #236 from linyqh/codex/refactor-documentary-frame-analysis-pipeline
refactor(documentary): centralize frame analysis pipeline
v0.7.8
|
2026-04-03 13:16:02 +08:00 |
|
linyq
|
d5c63cf4b4
|
chore: bump version to 0.7.8
|
2026-04-03 13:09:26 +08:00 |
|
linyq
|
e53156f4f2
|
fix(documentary): normalize streamlit progress values
|
2026-04-03 12:57:24 +08:00 |
|
linyq
|
abc9db22e5
|
Fix documentary narration parsing and explicit vision overrides
|
2026-04-03 12:04:09 +08:00 |
|
linyq
|
4e2560651f
|
fix(documentary): restore narration repair and explicit vision overrides
|
2026-04-03 11:29:27 +08:00 |
|
linyq
|
a8b6a5bb6b
|
fix(documentary): fail on malformed narration payload
|
2026-04-03 02:45:33 +08:00 |
|
linyq
|
d678bf62b1
|
fix(documentary): centralize final script generation in shared service
|
2026-04-03 02:38:54 +08:00 |
|
linyq
|
ac63fea953
|
refactor(documentary): route adapters through shared analysis service
|
2026-04-03 02:24:30 +08:00 |
|
linyq
|
df034d104b
|
fix(documentary): keep frames when batch summary is missing
|
2026-04-03 02:09:02 +08:00 |
|
linyq
|
ad02059e5d
|
fix(documentary): validate batch response contract before success
|
2026-04-03 02:04:21 +08:00 |
|
linyq
|
4d21c43b89
|
feat(documentary): preserve failed batches and add vision concurrency
|
2026-04-03 01:54:47 +08:00 |
|
linyq
|
8201911b82
|
fix(documentary): harden fast-path fallback and cache key prefix
|
2026-04-03 01:42:43 +08:00 |
|
linyq
|
3d76bff442
|
perf(documentary): add fast frame extraction and cache keys
|
2026-04-03 01:30:51 +08:00 |
|