NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-06-28 10:12:00 +00:00

Author	SHA1	Message	Date
viccy	7a5303aa20	feat(ffmpeg,webui): 新增 FFmpeg 引擎管理与检测功能 - 新增配置项 ffmpeg_path 及路径应用逻辑，自动配置 FFmpeg 环境变量 - 实现全量 FFmpeg 引擎自动发现、能力检测工具链，支持多来源识别 - 添加 WebUI 系统设置面板，支持选择、测试和保存 FFmpeg 引擎 - 优化视频合并模块的 FFmpeg 调用，新增进度日志与流式输出处理 - 新增 FFmpeg 检测器单元测试覆盖核心功能	2026-06-08 13:28:27 +08:00
viccy	342fc15f3b	feat(tts,search,video): 新增OmniVoice TTS、联网搜索与多视频剪辑支持新增OmniVoice语音合成引擎全流程支持，包含配置项、WebUI界面与服务实现集成Tavily联网搜索能力，支持短剧剧情分析前自动检索剧情背景信息新增多视频源剪辑支持，完善脚本校验规则并重构剪辑逻辑适配多视频路径重构LLM剧情分析Prompt，优化输出格式适配多场景与联网检索结果调整streamlit版本至1.56.0修复兼容性问题新增相关单元测试与多语言翻译，更新配置示例文件	2026-06-07 01:24:32 +08:00
viccy	d147fe66e4	feat(tts): 新增IndexTTS-2语音合成引擎支持实现兼容IndexTTS2-Pack API的完整TTS调用流程，包含音频下载、错误重试等处理重构原有IndexTTS-1.5代码，抽象通用逻辑以同时兼容indextts和indextts2两个引擎新增IndexTTS-2的WebUI配置界面，支持情感控制与高级生成参数调整更新配置示例文件与中英多语言文案，完善配置迁移逻辑兼容旧版配置新增对应单元测试覆盖参数处理与配置迁移流程	2026-06-06 14:31:09 +08:00
viccy	a2645aebd3	feat(webui): 优化剪映草稿导出的用户体验 - 更新streamlit依赖至1.57.0以支持原生弹窗组件 - 重构剪映导出逻辑，使用原生弹窗替代旧的内联表单 - 新增带样式的导出确认面板并补充多语言翻译 - 简化导出状态渲染与会话状态管理逻辑	2026-06-06 12:43:57 +08:00
viccy	0bd001ce33	feat(webui, llm, subtitle): 新增字幕校准、多视频支持与LLM生成参数配置 - 添加字幕校准服务，支持通过LLM校对SRT格式字幕文件，支持批量处理 - 为视频参数模型新增video_origin_paths字段，支持多视频上传与批量处理 - 为OpenAI兼容LLM提供商添加temperature、top_p、max_tokens和thinking_level参数配置支持 - 重构WebUI模型设置页面，将通用生成参数配置拆分到各模型的独立配置项中 - 更新示例配置文件与默认配置，新增对应参数的默认值 - 完善多语言国际化文案，添加批量操作与字幕校准相关翻译 - 添加相关单元测试以覆盖新功能与配置项	2026-06-05 23:15:11 +08:00
viccy	99dd4193ae	feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能 - 在 WebUI 中增加 Fun-ASR 转录界面，支持上传多种音视频格式并生成 SRT 字幕 - 新增 `app/services/fun_asr_subtitle.py` 服务模块，实现完整的 REST API 调用流程，包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换 - 在配置文件中增加 `[fun_asr]` 配置段，支持保存 API Key - 添加完整的单元测试，覆盖核心转换逻辑和服务流程 - 为兼容 Python 3.11 以下版本，将 `tomllib` 导入改为尝试导入并回退到 `tomli` - 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解	2026-04-27 18:15:54 +08:00
aw123456dew	71dfc99839	add doubao tts	2026-04-07 09:10:50 +08:00
linyq	16dbbf3461	refactor(config): 重构配置系统以支持默认值和模型名称规范化 - 新增 defaults.py 提供共享默认配置和模型名称处理工具 - 重构 config.py 使用默认值填充缺失配置 - 修改 openai_compatible_provider.py 简化模型名称处理逻辑 - 更新 WebUI 组件使用新的默认值系统 - 添加测试用例验证配置引导和模型名称处理	2026-03-28 00:34:01 +08:00
linyq	7ca594a788	feat(voice): 添加代理支持和改进 edge-tts 字幕处理添加代理配置支持，包括代理开关和地址设置重构 edge-tts 字幕处理逻辑，兼容新旧 API 版本改进错误处理和日志记录，增加连接超时设置更新 edge-tts 依赖至最新版本	2026-03-10 21:46:03 +08:00
linyq	7b9ef2f244	feat: 新增 IndexTTS2 零样本语音克隆引擎支持添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。	2025-12-12 11:42:12 +08:00
linyq	d7b1b51a36	fix: 使用 litellm 管理模型供应商	2025-12-12 11:40:44 +08:00
harry	4b0f7c3bb9	新增qwen3 tts服务	2025-12-12 11:38:06 +08:00
Emily-LMH	2c5c7cbd77	新增腾讯云 TTS 服务	2025-12-12 11:36:04 +08:00
linyq	e389412dc2	feat(tts): 添加 SoulVoice TTS 引擎支持实现 SoulVoice TTS 引擎集成，包括配置管理、语音选择、API 调用和字幕处理新增 SoulVoice 配置项和示例配置修改音频设置面板以支持 SoulVoice 选项优化音频时长计算和异常处理更新多语言文案以反映 SoulVoice 支持	2025-12-12 11:36:04 +08:00
linyq	1c8b526c3c	feat(video_processor): 优化视频帧提取功能，增强Windows系统兼容性在video_processor.py中，添加了对Windows N卡硬件加速的支持，优化了帧提取过程，改进了提取成功率的统计和错误处理。同时，在generate_script_docu.py中，增强了对硬件加速失败的处理逻辑，提供了详细的错误信息和解决建议，提升了用户体验。	2025-12-12 11:36:04 +08:00
linyq	706d73383e	feat: 更新作者信息并增强API配置验证功能在基础设置中新增API密钥、基础URL和模型名称的验证功能，确保用户输入的配置有效性，提升系统的稳定性和用户体验。	2025-12-12 11:36:03 +08:00
linyq	2e0c492778	feat(audio): 增强音量管理和智能音量调整功能更新AudioVolumeDefaults类，提升原声音量至1.2以平衡TTS音量，并允许最大音量达到2.0。新增智能音量调整功能，自动分析和调整音频轨道音量，确保音量在合理范围内。优化任务处理逻辑，结合用户设置和推荐音量配置，提升音频合成效果和用户体验。	2025-12-12 11:36:03 +08:00
linyq	c3d855c547	优化版本号获取逻辑，直接从文件读取版本号，并简化发布说明生成流程	2025-12-12 11:36:03 +08:00
linyq	cc44aab181	feat(video): 实现关键帧提取 V2 版本 - 新增 VideoProcessor 类，实现视频预处理、场景边界检测、关键帧提取等功能 - 在 config.example.toml 中添加 frames 配置项，用于控制关键帧提取参数- 修改 script_settings.py，支持使用新的 VideoProcessor 进行关键帧提取 - 优化关键帧提取流程，提高处理效率和准确性	2024-11-15 18:03:23 +08:00
linyqh	e874999bd1	first commit	2024-08-12 21:35:06 +08:00

20 Commits