NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-05-02 06:38:37 +00:00

Author	SHA1	Message	Date
viccy	99dd4193ae	feat(字幕): 新增阿里百炼 Fun-ASR 音视频字幕转录功能 - 在 WebUI 中增加 Fun-ASR 转录界面，支持上传多种音视频格式并生成 SRT 字幕 - 新增 `app/services/fun_asr_subtitle.py` 服务模块，实现完整的 REST API 调用流程，包括获取上传凭证、文件上传、提交任务、轮询结果和 SRT 格式转换 - 在配置文件中增加 `[fun_asr]` 配置段，支持保存 API Key - 添加完整的单元测试，覆盖核心转换逻辑和服务流程 - 为兼容 Python 3.11 以下版本，将 `tomllib` 导入改为尝试导入并回退到 `tomli` - 在 `defaults.py` 中添加 `from __future__ import annotations` 以支持类型注解	2026-04-27 18:15:54 +08:00
viccy	8c129790c7	Merge pull request #237 from aw123456dew/feature/doubao-tts add doubao tts	2026-04-08 15:14:10 +08:00
aw123456dew	d45c1858c9	add export jianying draft feature	2026-04-07 11:33:12 +08:00
aw123456dew	71dfc99839	add doubao tts	2026-04-07 09:10:50 +08:00
linyq	16dbbf3461	refactor(config): 重构配置系统以支持默认值和模型名称规范化 - 新增 defaults.py 提供共享默认配置和模型名称处理工具 - 重构 config.py 使用默认值填充缺失配置 - 修改 openai_compatible_provider.py 简化模型名称处理逻辑 - 更新 WebUI 组件使用新的默认值系统 - 添加测试用例验证配置引导和模型名称处理	2026-03-28 00:34:01 +08:00
linyq	3396644593	feat: 移除 LiteLLM 依赖并迁移至 OpenAI 兼容接口 - 移除 LiteLLM 相关代码和依赖，改用原生 OpenAI 兼容接口 - 重构 LLM 服务提供商注册逻辑，仅支持 OpenAI 兼容接口 - 更新配置文件和文档，移除 LiteLLM 相关说明 - 添加新的测试用例验证 OpenAI 兼容接口集成 - 更新 WebUI 组件以适配新的 OpenAI 兼容接口	2026-03-27 23:49:58 +08:00
linyq	7ca594a788	feat(voice): 添加代理支持和改进 edge-tts 字幕处理添加代理配置支持，包括代理开关和地址设置重构 edge-tts 字幕处理逻辑，兼容新旧 API 版本改进错误处理和日志记录，增加连接超时设置更新 edge-tts 依赖至最新版本	2026-03-10 21:46:03 +08:00
linyq	0706b00577	feat: 修复 windows 环境下短剧混剪报错 bug，添加字幕文本处理模块，优化字幕读取和规范化逻辑	2026-01-10 02:28:01 +08:00
linyq	26f0dfeab5	fix: 修复短剧混剪字幕在 windows 环境下加载失败	2025-12-25 01:16:00 +08:00
linyq	5f73c57313	fix: 优化短剧混剪使用体验	2025-12-24 13:18:52 +08:00
linyq	4f964ad98d	fix: 修复开发调试代码残留。已在当前版本中修复。服务端日志已清空。已建议所有用户重置 Key	2025-12-12 12:20:32 +08:00
linyq	97bb59220f	fix: 移除未使用的 logger 导入	2025-12-12 11:42:12 +08:00
linyq	169daac94d	fix: 移除未使用的 tkinter 导入	2025-12-12 11:42:12 +08:00
linyq	7b9ef2f244	feat: 新增 IndexTTS2 零样本语音克隆引擎支持添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。	2025-12-12 11:42:12 +08:00
linyq	854cfab460	feat: 显示字幕引擎支持提示	2025-12-12 11:42:12 +08:00
linyq	474ebe46e2	feat: 新增基础设置项并提供中文翻译	2025-12-12 11:42:12 +08:00
linyq	d5f089c9a7	feat: 优化LLM服务配置与迁移适配，并更新相关UI设置及中文翻译	2025-12-12 11:42:12 +08:00
linyq	77c0aa47f2	feat: 增强 LiteLLM 提供商配置并更新基本设置界面	2025-12-12 11:42:12 +08:00
linyq	d7b1b51a36	fix: 使用 litellm 管理模型供应商	2025-12-12 11:40:44 +08:00
harry	4423195313	Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function	2025-12-12 11:38:06 +08:00
harry	4b0f7c3bb9	新增qwen3 tts服务	2025-12-12 11:38:06 +08:00
linyq	a99d752069	移除 SoulVoice 引擎相关设置，优化 TTS 引擎选项	2025-12-12 11:38:06 +08:00
linyq	6b8082244c	修复试听 tts bug	2025-12-12 11:38:06 +08:00
linyq	52f96f9eae	优化腾讯tts引擎	2025-12-12 11:36:04 +08:00
Emily-LMH	2c5c7cbd77	新增腾讯云 TTS 服务	2025-12-12 11:36:04 +08:00
linyq	a26c07d3dc	更新 gemini 模型请求参数设置	2025-12-12 11:36:04 +08:00
linyq	bb7362809a	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-12-12 11:36:04 +08:00
linyq	aebd169900	feat(tts): 添加多引擎TTS支持并重构语音设置界面 - 新增Azure Speech Services和Edge TTS引擎支持 - 重构语音设置界面，支持不同引擎的独立配置 - 添加引擎选择器和详细说明 - 更新requirements.txt添加azure-cognitiveservices-speech依赖 - 改进音色名称验证逻辑	2025-12-12 11:36:04 +08:00
linyq	a184662f8b	refactor: 移除视频字幕合并功能及相关代码清理不再使用的视频字幕合并功能，包括删除合并设置组件、合并工具函数和相关的国际化文本	2025-12-12 11:36:04 +08:00
linyq	787d17a1a9	feat(script): 合并脚本保存与格式验证功能重构脚本保存流程，将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能，包括字段类型、格式和必填项验证。	2025-12-12 11:36:04 +08:00
linyq	e7db1668f8	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-12-12 11:36:04 +08:00
linyq	e389412dc2	feat(tts): 添加 SoulVoice TTS 引擎支持实现 SoulVoice TTS 引擎集成，包括配置管理、语音选择、API 调用和字幕处理新增 SoulVoice 配置项和示例配置修改音频设置面板以支持 SoulVoice 选项优化音频时长计算和异常处理更新多语言文案以反映 SoulVoice 支持	2025-12-12 11:36:04 +08:00
linyq	1c8b526c3c	feat(video_processor): 优化视频帧提取功能，增强Windows系统兼容性在video_processor.py中，添加了对Windows N卡硬件加速的支持，优化了帧提取过程，改进了提取成功率的统计和错误处理。同时，在generate_script_docu.py中，增强了对硬件加速失败的处理逻辑，提供了详细的错误信息和解决建议，提升了用户体验。	2025-12-12 11:36:04 +08:00
linyq	706d73383e	feat: 更新作者信息并增强API配置验证功能在基础设置中新增API密钥、基础URL和模型名称的验证功能，确保用户输入的配置有效性，提升系统的稳定性和用户体验。	2025-12-12 11:36:03 +08:00
linyq	70b8b49e41	feat(audio): 统一音量配置并修复原声音量默认值问题引入AudioVolumeDefaults类集中管理音量配置，确保全局一致性修复原声音量默认值为0.7以解决短剧解说模式问题添加音量验证和详细日志便于调试	2025-12-12 11:36:03 +08:00
linyq	342a4ac1a8	refactor(webui): 修复合并视频与字幕功能 - 注释掉 merge_settings.py 中的一键转录功能 - 更新 base.py 中的 API URL - 在 merge_video.py 中添加 pysrt导入 - 更新 requirements.txt，添加 pysrt 依赖 - 修改 zh.json 中的缺失字幕文件提示信息	2025-05-12 10:55:17 +08:00
linyq	2ef42fda46	feat(webui): 优化短剧解说功能 - 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数 - 修改 prompt 模板以包含短剧名称 - 调整组件渲染顺序，提高用户体验	2025-05-11 00:13:56 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	048b2ff39a	feat(webui): 新增短剧解说脚本生成功能 - 添加短剧解说模式，支持上传字幕文件 - 实现短剧解说脚本生成逻辑 -优化脚本设置界面布局，支持多种脚本类型 - 修复部分功能模块的引用错误	2025-05-10 22:57:05 +08:00
linyq	3fe8eb50c0	(webfeatui): 重构视觉分析功能并添加新模型支持 - 移除了对 QwenVL模型的特定逻辑，改为更通用的实现 - 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面，增加了新的模型选项 - 重构了测试连接和创建分析器的代码，提高了可维护性 - 调整了配置文件结构，简化了视觉模型的配置	2025-05-09 12:03:27 +08:00
linyq	fef3b3c8fd	feat(subtitle): 添加字幕自定义位置功能 - 在 generate_video.py 中实现自定义字幕位置的逻辑 - 在 schema.py 中添加 custom_position 字段 - 更新 webui 组件以支持自定义位置设置 - 调整任务处理逻辑，支持新的自定义位置参数	2025-05-08 20:45:14 +08:00
linyq	dac23c7c31	(webfeatui): 重构并优化视频解说文案生成功能 -优化了基本设置组件，增加了对 DeepSeek 和 Siliconflow 的支持- 重构了 generate_narration_script 模块，提高了代码可读性和可维护性 -改进了 generate_script_docu 工具，简化了文案生成流程- 添加了异常处理和日志记录，提高了系统稳定性	2025-05-08 17:02:02 +08:00
linyq	ce01c110be	refactor(app): 优化视频剪辑功能和相关日志输出- 注释掉部分日志输出，减少冗余信息 - 修改视频脚本 ID 获取方式 - 优化视频路径获取逻辑 - 移除未使用的导入 - 增加异常日志输出，提高错误排查效率	2025-05-08 00:13:19 +08:00
linyq	0ccb019f88	refactor(app): 重构视频剪辑功能并优化性能 - 移除了未使用的性能监控模块- 重新实现了硬件加速检测逻辑 - 优化了 FFmpeg命令生成和执行流程- 改进了视频文件命名规则 - 调整了错误处理和日志记录方式	2025-05-07 23:08:26 +08:00
linyq	2dc83bc18e	perf(vision): 优化视觉分析流程和批量处理逻辑 - 移除了 vision_analysis_prompt 配置项 - 优化了 Gemini 和 QwenVL 分析器的批量处理逻辑 - 更新了文档生成脚本和 UI 组件以适应新的分析流程 - 调整了视频帧提取相关函数，移除了不必要的 skip_seconds 参数 - 更新了中文翻译文件，添加了新的批处理大小相关提示	2025-05-07 18:44:37 +08:00
linyq	82823297f2	feat(script): 添加帧间隔输入参数并更新相关逻辑 - 在 GenerateScriptRequest 和 ScriptGenerator 中新增 frame_interval_input 参数，默认为 5 - 更新 VideoProcessor 的 process_video_pipeline 方法，调整帧提取间隔逻辑 - 修改前端界面，增加帧间隔输入框并更新相关翻译文本 - 优化 generate_script_docu 函数，使用新的帧间隔参数进行视频处理	2025-05-07 16:43:00 +08:00
linyq	f6c3f1640b	移除 opencv 和 sklearn 提取关键帧的代码	2025-05-07 15:41:01 +08:00
linyqh	bc236cd195	更新配置文件和Web界面，支持自定义短剧混剪片段 - 将项目版本更新至0.5.3 - 修改视觉大模型提供商为qwenvl，并更新相关API密钥和模型名称 - 新增DeepSeek API支持，更新文本生成模型设置 - 在Web界面中添加短视频生成模式的选项，调整脚本设置以支持自定义片段数量 - 修改代理设置的默认值为False	2025-04-13 14:07:35 +08:00
linyqh	074f1d103b	feat(webui): 更新文案生成模型设置支持 DeepSeek - 调整文本生成模型提供商顺序，将 DeepSeek 置顶 - 修改 DeepSeek API 基础 URL 和模型名称 - 移除短剧混剪功能中的模型限制描述	2025-03-06 01:52:26 +08:00
linyqh	fb8021c30e	新增 en-US TTS	2025-01-11 23:13:57 +08:00

1 2

83 Commits