NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-06-17 12:52:15 +00:00

Author	SHA1	Message	Date
viccy	342fc15f3b	feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持新增OmniVoice语音合成引擎全流程支持，包含配置项、WebUI界面与服务实现集成Tavily联网搜索能力，支持短剧剧情分析前自动检索剧情背景信息新增多视频源剪辑支持，完善脚本校验规则并重构剪辑逻辑适配多视频路径重构LLM剧情分析Prompt，优化输出格式适配多场景与联网检索结果调整streamlit版本至1.56.0修复兼容性问题新增相关单元测试与多语言翻译，更新配置示例文件	2026-06-07 01:24:32 +08:00
viccy	d147fe66e4	feat(tts): 新增IndexTTS-2语音合成引擎支持实现兼容IndexTTS2-Pack API的完整TTS调用流程，包含音频下载、错误重试等处理重构原有IndexTTS-1.5代码，抽象通用逻辑以同时兼容indextts和indextts2两个引擎新增IndexTTS-2的WebUI配置界面，支持情感控制与高级生成参数调整更新配置示例文件与中英多语言文案，完善配置迁移逻辑兼容旧版配置新增对应单元测试覆盖参数处理与配置迁移流程	2026-06-06 14:31:09 +08:00
viccy	a2645aebd3	feat(webui): 优化剪映草稿导出的用户体验 - 更新streamlit依赖至1.57.0以支持原生弹窗组件 - 重构剪映导出逻辑，使用原生弹窗替代旧的内联表单 - 新增带样式的导出确认面板并补充多语言翻译 - 简化导出状态渲染与会话状态管理逻辑	2026-06-06 12:43:57 +08:00
viccy	5a9775d62d	feat: 支持横竖屏自定义字幕位置，重构剪映导出逻辑 - 新增横竖屏分别的字幕垂直位置配置，默认值分别为85%和82% - 更新WebUI字幕设置界面，新增独立的横屏/竖屏字幕位置标签页，在预览画面中添加蓝线标注当前字幕位置 - 重构剪映草稿导出逻辑，将相关代码抽离至独立模块，移除requirements.txt中的pyJianYingDraft直接依赖 - 优化媒体时长处理逻辑，新增时长缓存和自动裁剪处理，添加完整的单元测试覆盖 - 更新配置示例文件、数据Schema定义和中英多语言翻译文件	2026-06-06 12:01:36 +08:00
viccy	33c17c2636	feat(subtitle, asr, bgm): 添加字幕遮罩、自动转录功能，优化背景音乐设置 - 新增字幕遮罩功能，可在烧录新字幕前遮盖原视频自带的字幕区域，支持横屏/竖屏自定义配置与预览调试 - 新增自动字幕转录功能，支持本地FunASR和阿里百炼在线转写，在最终视频合并完成后自动生成并压入成片字幕 - 重构背景音乐设置面板，新增从资源目录选择BGM、上传本地BGM文件的功能，新增BGM试听预览，优化交互流程 - 更新配置示例文件、数据Schema与多语言翻译文件，完善前后端参数传递逻辑	2026-06-06 01:08:35 +08:00
viccy	5b2487e879	feat(indextts2, webui): 完善 IndexTTS2 支持，新增参考音频选择与预览功能修改内容包括： - 修正缺失参考音频的错误提示文本 - 更新示例配置文件，新增参考音频来源配置项并将 IndexTTS2 设为默认TTS引擎 - 更新语音服务模块的注释与文档字符串 - 新增多语言适配文案，支持新UI的所有提示内容 - 重构 IndexTTS2 设置页面：支持从资源目录选择音频、上传本地音频、预览音频效果 - 调整TTS引擎选项的排序与默认选中项	2026-06-05 23:52:31 +08:00
viccy	0bd001ce33	feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置 - 添加字幕校准服务，支持通过LLM校对SRT格式字幕文件，支持批量处理 - 为视频参数模型新增video_origin_paths字段，支持多视频上传与批量处理 - 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持 - 重构WebUI模型设置页面，将通用生成参数配置拆分到各模型的独立配置项中 - 更新示例配置文件与默认配置，新增对应参数的默认值 - 完善多语言国际化文案，添加批量操作与字幕校准相关翻译 - 添加相关单元测试以覆盖新功能与配置项	2026-06-05 23:15:11 +08:00
viccy	e6d15fe246	feat(webui): 新增短剧剧情分析、可视化脚本编辑器与通用生成参数设置 - 抽离通用生成参数设置组件，统一管理temperature等LLM生成参数 - 新增短剧字幕剧情分析功能，支持一键分析与手动编辑分析结果 - 重构短剧脚本生成逻辑，支持传入预先生成的剧情分析内容 - 新增可视化视频脚本表格编辑器，支持增删编辑行与原始JSON预览 - 优化多语言翻译、UI交互细节与字幕相关提示文案	2026-06-05 19:31:35 +08:00
viccy	e744960ac1	feat: 新增本地FunASR支持并优化网页端视频与字幕工作流 - 更新示例配置文件，添加本地FunASR后端配置项 - 重构fun_asr_subtitle服务，完整支持本地FunASR-Pack API调用 - 优化多语言翻译文件，更新界面相关译文 - 重写网页端视频选择组件，支持本地资源目录选择和直接上传 - 重构字幕转写UI，支持本地/在线百炼/直接上传三种模式 - 新增本地FunASR相关单元测试	2026-06-05 18:46:56 +08:00
viccy	89eebb8b41	feat(webui): 完善国际化多语言适配将webui所有页面的硬编码中文提示文本替换为多语言翻译调用，为相关函数添加兼容的tr参数，同时补充zh.json和en.json中的对应翻译词条。	2026-06-05 16:36:03 +08:00
viccy	35477a933d	feat(edge-tts, webui): 新增动态获取音色列表功能，更新内置列表并简化UI - 新增`get_all_edge_voices()`工具函数链，支持缓存与代理，拉取失败时回退到内置音色列表 - 更新内置音色文档与列表，修正部分命名并新增多语言神经音色及因纽特语相关音色 - 简化WebUI的Edge TTS设置界面，不再硬编码筛选音色，直接展示所有已加载的音色	2026-06-05 15:59:54 +08:00
viccy	a1b434fbda	refactor: 优化脚本设置与配置更新逻辑重构 script_settings.py 中的脚本模式状态处理逻辑，完善会话状态 fallback 与默认值处理，新增 required 参数修复空选择问题。新增 update_app_config_if_changed 工具函数，仅在配置值实际变更时更新配置，替换基础设置中多处直接修改配置的代码，统一逻辑并减少不必要的状态更新。	2026-06-05 15:29:15 +08:00
viccy	99dd4193ae	feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能 - 在 WebUI 中增加 Fun-ASR 转录界面，支持上传多种音视频格式并生成 SRT 字幕 - 新增 `app/services/fun_asr_subtitle.py` 服务模块，实现完整的 REST API 调用流程，包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换 - 在配置文件中增加 `[fun_asr]` 配置段，支持保存 API Key - 添加完整的单元测试，覆盖核心转换逻辑和服务流程 - 为兼容 Python 3.11 以下版本，将 `tomllib` 导入改为尝试导入并回退到 `tomli` - 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解	2026-04-27 18:15:54 +08:00
viccy	8c129790c7	Merge pull request #237 from aw123456dew/feature/doubao-tts add doubao tts	2026-04-08 15:14:10 +08:00
aw123456dew	d45c1858c9	add export jianying draft feature	2026-04-07 11:33:12 +08:00
aw123456dew	71dfc99839	add doubao tts	2026-04-07 09:10:50 +08:00
linyq	e53156f4f2	fix(documentary): normalize streamlit progress values	2026-04-03 12:57:24 +08:00
linyq	d678bf62b1	fix(documentary): centralize final script generation in shared service	2026-04-03 02:38:54 +08:00
linyq	ac63fea953	refactor(documentary): route adapters through shared analysis service	2026-04-03 02:24:30 +08:00
linyq	16dbbf3461	refactor(config): 重构配置系统以支持默认值和模型名称规范化 - 新增 defaults.py 提供共享默认配置和模型名称处理工具 - 重构 config.py 使用默认值填充缺失配置 - 修改 openai_compatible_provider.py 简化模型名称处理逻辑 - 更新 WebUI 组件使用新的默认值系统 - 添加测试用例验证配置引导和模型名称处理	2026-03-28 00:34:01 +08:00
linyq	3396644593	feat: 移除 LiteLLM 依赖并迁移至 OpenAI 兼容接口 - 移除 LiteLLM 相关代码和依赖，改用原生 OpenAI 兼容接口 - 重构 LLM 服务提供商注册逻辑，仅支持 OpenAI 兼容接口 - 更新配置文件和文档，移除 LiteLLM 相关说明 - 添加新的测试用例验证 OpenAI 兼容接口集成 - 更新 WebUI 组件以适配新的 OpenAI 兼容接口	2026-03-27 23:49:58 +08:00
linyq	7ca594a788	feat(voice): 添加代理支持和改进 edge-tts 字幕处理添加代理配置支持，包括代理开关和地址设置重构 edge-tts 字幕处理逻辑，兼容新旧 API 版本改进错误处理和日志记录，增加连接超时设置更新 edge-tts 依赖至最新版本	2026-03-10 21:46:03 +08:00
linyq	0706b00577	feat: 修复 windows 环境下短剧混剪报错 bug，添加字幕文本处理模块，优化字幕读取和规范化逻辑	2026-01-10 02:28:01 +08:00
linyq	08f682bb50	fix: 优化短剧混剪字幕上传逻辑，与短剧解说保持一致	2025-12-25 10:43:28 +08:00
linyq	26f0dfeab5	fix: 修复短剧混剪字幕在 windows 环境下加载失败	2025-12-25 01:16:00 +08:00
linyq	5f73c57313	fix: 优化短剧混剪使用体验	2025-12-24 13:18:52 +08:00
linyq	5fdf0b6a32	fix: 修复短剧混剪 AttributeError: 'NoneType' object has no attribute 'lower' 报错	2025-12-24 11:00:52 +08:00
linyq	4f964ad98d	fix: 修复开发调试代码残留。已在当前版本中修复。服务端日志已清空。已建议所有用户重置 Key	2025-12-12 12:20:32 +08:00
linyq	dfb96e9b0f	更新了示例配置文件，并移除了日文README (坚决拥护中国🇨🇳领土主权🔥)	2025-12-12 11:42:50 +08:00
linyq	97bb59220f	fix: 移除未使用的 logger 导入	2025-12-12 11:42:12 +08:00
linyq	169daac94d	fix: 移除未使用的 tkinter 导入	2025-12-12 11:42:12 +08:00
linyq	7b9ef2f244	feat: 新增 IndexTTS2 零样本语音克隆引擎支持添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。	2025-12-12 11:42:12 +08:00
linyq	854cfab460	feat: 显示字幕引擎支持提示	2025-12-12 11:42:12 +08:00
linyq	474ebe46e2	feat: 新增基础设置项并提供中文翻译	2025-12-12 11:42:12 +08:00
linyq	d5f089c9a7	feat: 优化LLM服务配置与迁移适配，并更新相关UI设置及中文翻译	2025-12-12 11:42:12 +08:00
linyq	77c0aa47f2	feat: 增强 LiteLLM 提供商配置并更新基本设置界面	2025-12-12 11:42:12 +08:00
linyq	d7b1b51a36	fix: 使用 litellm 管理模型供应商	2025-12-12 11:40:44 +08:00
harry	4423195313	Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function	2025-12-12 11:38:06 +08:00
harry	4b0f7c3bb9	新增qwen3 tts服务	2025-12-12 11:38:06 +08:00
linyq	a99d752069	移除 SoulVoice 引擎相关设置，优化 TTS 引擎选项	2025-12-12 11:38:06 +08:00
linyq	6b8082244c	修复试听 tts bug	2025-12-12 11:38:06 +08:00
linyq	52f96f9eae	优化腾讯tts引擎	2025-12-12 11:36:04 +08:00
Emily-LMH	2c5c7cbd77	新增腾讯云 TTS 服务	2025-12-12 11:36:04 +08:00
linyq	a26c07d3dc	更新 gemini 模型请求参数设置	2025-12-12 11:36:04 +08:00
linyq	b5548b050d	dev0.7.1 预发布	2025-12-12 11:36:04 +08:00
linyq	bb7362809a	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-12-12 11:36:04 +08:00
linyq	aebd169900	feat(tts): 添加多引擎TTS支持并重构语音设置界面 - 新增Azure Speech Services和Edge TTS引擎支持 - 重构语音设置界面，支持不同引擎的独立配置 - 添加引擎选择器和详细说明 - 更新requirements.txt添加azure-cognitiveservices-speech依赖 - 改进音色名称验证逻辑	2025-12-12 11:36:04 +08:00
linyq	a184662f8b	refactor: 移除视频字幕合并功能及相关代码清理不再使用的视频字幕合并功能，包括删除合并设置组件、合并工具函数和相关的国际化文本	2025-12-12 11:36:04 +08:00
linyq	787d17a1a9	feat(script): 合并脚本保存与格式验证功能重构脚本保存流程，将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能，包括字段类型、格式和必填项验证。	2025-12-12 11:36:04 +08:00
linyq	e7db1668f8	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-12-12 11:36:04 +08:00

1 2 3

135 Commits