NarratoAI

mirror of https://github.com/linyqh/NarratoAI.git synced 2026-01-26 05:48:14 +00:00

Author	SHA1	Message	Date
linyq	0706b00577	feat: 修复 windows 环境下短剧混剪报错 bug，添加字幕文本处理模块，优化字幕读取和规范化逻辑	2026-01-10 02:28:01 +08:00
linyq	08f682bb50	fix: 优化短剧混剪字幕上传逻辑，与短剧解说保持一致	2025-12-25 10:43:28 +08:00
linyq	26f0dfeab5	fix: 修复短剧混剪字幕在 windows 环境下加载失败	2025-12-25 01:16:00 +08:00
linyq	5f73c57313	fix: 优化短剧混剪使用体验	2025-12-24 13:18:52 +08:00
linyq	5fdf0b6a32	fix: 修复短剧混剪 AttributeError: 'NoneType' object has no attribute 'lower' 报错	2025-12-24 11:00:52 +08:00
linyq	4f964ad98d	fix: 修复开发调试代码残留。已在当前版本中修复。服务端日志已清空。已建议所有用户重置 Key	2025-12-12 12:20:32 +08:00
linyq	dfb96e9b0f	更新了示例配置文件，并移除了日文README (坚决拥护中国🇨🇳领土主权🔥)	2025-12-12 11:42:50 +08:00
linyq	97bb59220f	fix: 移除未使用的 logger 导入	2025-12-12 11:42:12 +08:00
linyq	169daac94d	fix: 移除未使用的 tkinter 导入	2025-12-12 11:42:12 +08:00
linyq	7b9ef2f244	feat: 新增 IndexTTS2 零样本语音克隆引擎支持添加 IndexTTS2 TTS 引擎配置和实现,支持零样本语音克隆功能。包括配置保存加载、API 调用、参考音频上传、高级参数设置(温度、top_p、top_k、束搜索、重复惩罚等),并在 WebUI 中提供完整的配置界面和使用说明。	2025-12-12 11:42:12 +08:00
linyq	854cfab460	feat: 显示字幕引擎支持提示	2025-12-12 11:42:12 +08:00
linyq	474ebe46e2	feat: 新增基础设置项并提供中文翻译	2025-12-12 11:42:12 +08:00
linyq	d5f089c9a7	feat: 优化LLM服务配置与迁移适配，并更新相关UI设置及中文翻译	2025-12-12 11:42:12 +08:00
linyq	77c0aa47f2	feat: 增强 LiteLLM 提供商配置并更新基本设置界面	2025-12-12 11:42:12 +08:00
linyq	d7b1b51a36	fix: 使用 litellm 管理模型供应商	2025-12-12 11:40:44 +08:00
harry	4423195313	Fix the problem that Tencent cloud tts sound setting is invalid in the generation video function	2025-12-12 11:38:06 +08:00
harry	4b0f7c3bb9	新增qwen3 tts服务	2025-12-12 11:38:06 +08:00
linyq	a99d752069	移除 SoulVoice 引擎相关设置，优化 TTS 引擎选项	2025-12-12 11:38:06 +08:00
linyq	6b8082244c	修复试听 tts bug	2025-12-12 11:38:06 +08:00
linyq	52f96f9eae	优化腾讯tts引擎	2025-12-12 11:36:04 +08:00
Emily-LMH	2c5c7cbd77	新增腾讯云 TTS 服务	2025-12-12 11:36:04 +08:00
linyq	a26c07d3dc	更新 gemini 模型请求参数设置	2025-12-12 11:36:04 +08:00
linyq	b5548b050d	dev0.7.1 预发布	2025-12-12 11:36:04 +08:00
linyq	bb7362809a	refactor: 移除视频审查功能及相关代码删除不再使用的视频审查功能，包括移除相关面板组件、i18n翻译条目和主程序中的调用	2025-12-12 11:36:04 +08:00
linyq	aebd169900	feat(tts): 添加多引擎TTS支持并重构语音设置界面 - 新增Azure Speech Services和Edge TTS引擎支持 - 重构语音设置界面，支持不同引擎的独立配置 - 添加引擎选择器和详细说明 - 更新requirements.txt添加azure-cognitiveservices-speech依赖 - 改进音色名称验证逻辑	2025-12-12 11:36:04 +08:00
linyq	a184662f8b	refactor: 移除视频字幕合并功能及相关代码清理不再使用的视频字幕合并功能，包括删除合并设置组件、合并工具函数和相关的国际化文本	2025-12-12 11:36:04 +08:00
linyq	787d17a1a9	feat(script): 合并脚本保存与格式验证功能重构脚本保存流程，将格式验证整合到保存操作中。新增详细的格式验证错误提示和正确格式示例展示。增强脚本格式检查功能，包括字段类型、格式和必填项验证。	2025-12-12 11:36:04 +08:00
linyq	e7db1668f8	feat(video): 实现统一视频裁剪策略并移除旧逻辑重构视频处理流程，引入基于OST类型的统一裁剪策略： - 新增 clip_video_unified 函数处理三种OST类型 - 移除预裁剪步骤和相关UI组件 - 优化任务处理流程，减少重复裁剪 - 添加详细的错误处理和日志记录	2025-12-12 11:36:04 +08:00
linyq	e389412dc2	feat(tts): 添加 SoulVoice TTS 引擎支持实现 SoulVoice TTS 引擎集成，包括配置管理、语音选择、API 调用和字幕处理新增 SoulVoice 配置项和示例配置修改音频设置面板以支持 SoulVoice 选项优化音频时长计算和异常处理更新多语言文案以反映 SoulVoice 支持	2025-12-12 11:36:04 +08:00
linyq	33fc3dab10	feat(subtitle_analysis): 更新解说文案生成逻辑，增强字幕内容支持在多个文件中重构了解说文案生成的实现，新增对原始字幕内容的支持，以提供准确的时间戳信息。更新了相关参数和提示词模板，优化了生成逻辑，提升了内容的准确性和用户体验。同时，注释部分进行了清理，去除了调试信息的输出。	2025-12-12 11:36:04 +08:00
linyqh	a15ab4c944	优化视频帧提取功能，新增超级兼容性方案以提高提取成功率，增强错误处理和用户反馈。在generate_script_docu.py中更新进度显示和错误提示，提升用户体验。	2025-12-12 11:36:04 +08:00
linyq	1c8b526c3c	feat(video_processor): 优化视频帧提取功能，增强Windows系统兼容性在video_processor.py中，添加了对Windows N卡硬件加速的支持，优化了帧提取过程，改进了提取成功率的统计和错误处理。同时，在generate_script_docu.py中，增强了对硬件加速失败的处理逻辑，提供了详细的错误信息和解决建议，提升了用户体验。	2025-12-12 11:36:04 +08:00
linyq	f70cfbab46	feat(llm): 增强解说文案生成和图片分析功能，优化JSON解析在migration_adapter.py和generate_script_docu.py文件中，集成了增强的JSON解析器以提高解说文案生成的稳定性和兼容性。更新了生成解说文案的提示词管理系统，确保返回的JSON格式有效，并在图片分析中保持向后兼容性，提升了系统的灵活性和用户体验。	2025-12-12 11:36:03 +08:00
linyq	5ef9f4a10c	feat(llm): 重构字幕分析和脚本生成流程，支持统一LLM服务删除了旧的提示词文件，并在多个文件中更新了字幕分析和脚本生成的实现，集成了统一的LLM服务架构。新增了对服务提供商的支持，优化了API调用和JSON响应解析，提升了系统的灵活性和稳定性，确保了对不同LLM的兼容性，增强了用户体验。	2025-12-12 11:36:03 +08:00
linyq	d55754c7fb	feat(prompts): 更新JSON格式输出以增强解析兼容性在多个文件中修正了JSON格式输出，确保使用标准格式 `{` 和 `}`，并移除双大括号 `{{` 和 `}}`。这些更改提升了系统对LLM生成内容的解析能力，确保输出的JSON格式有效且符合要求，增强了整体用户体验。	2025-12-12 11:36:03 +08:00
linyq	79b0d613e3	feat(llm): 重构解说文案生成和视觉分析器，支持新的LLM服务架构更新generate_narration_script.py、base.py和generate_short_summary.py文件，重构解说文案生成和视觉分析器的实现，优先使用新的LLM服务架构。添加回退机制以确保兼容性，增强系统的稳定性和用户体验。	2025-12-12 11:36:03 +08:00
linyq	706d73383e	feat: 更新作者信息并增强API配置验证功能在基础设置中新增API密钥、基础URL和模型名称的验证功能，确保用户输入的配置有效性，提升系统的稳定性和用户体验。	2025-12-12 11:36:03 +08:00
linyq	70b8b49e41	feat(audio): 统一音量配置并修复原声音量默认值问题引入AudioVolumeDefaults类集中管理音量配置，确保全局一致性修复原声音量默认值为0.7以解决短剧解说模式问题添加音量验证和详细日志便于调试	2025-12-12 11:36:03 +08:00
linyq	c3d855c547	优化版本号获取逻辑，直接从文件读取版本号，并简化发布说明生成流程	2025-12-12 11:36:03 +08:00
linyq	716b22ef9a	feat(SDE): 优化剧情分析提示词和解说文案生成 - 在 generate_short_summary.py 中添加 temperature 参数，用于控制生成文案的随机性- 修改 prompt.py 中的段落数要求，改为与字幕长度成正比 - 在 short_drama_explanation.py 中添加日志输出，记录使用的模型和温度	2025-12-12 11:35:44 +08:00
linyq	342a4ac1a8	refactor(webui): 修复合并视频与字幕功能 - 注释掉 merge_settings.py 中的一键转录功能 - 更新 base.py 中的 API URL - 在 merge_video.py 中添加 pysrt导入 - 更新 requirements.txt，添加 pysrt 依赖 - 修改 zh.json 中的缺失字幕文件提示信息	2025-05-12 10:55:17 +08:00
linyq	7b75f12524	feat(webui): 更新简体中文翻译 - 在 zh.json 文件中更新了短剧解说功能的描述 - 明确指出短剧解说功能目前仅支持 gemini-2.0-flash 模型	2025-05-11 00:16:15 +08:00
linyq	2ef42fda46	feat(webui): 优化短剧解说功能 - 添加短剧名称输入框和温度调节滑块- 更新 generate_script_short_sunmmary 函数以接收新参数 - 修改 prompt 模板以包含短剧名称 - 调整组件渲染顺序，提高用户体验	2025-05-11 00:13:56 +08:00
linyq	6cd1ff8b68	refactor(tools): 移除调试日志和未使用的参数- 在 base.py 中移除了调试日志，以减少日志噪音 - 在 generate_script_short.py 中移除了未使用的参数，简化了 API 调用	2025-05-10 23:57:15 +08:00
linyq	f5c4e93fcd	feat(webui): 添加短剧解说功能 - 新增短剧解说页面和相关功能 - 实现字幕文件上传和处理逻辑- 添加剧情分析和解说文案生成功能 - 优化用户交互和错误处理	2025-05-10 23:37:58 +08:00
linyq	048b2ff39a	feat(webui): 新增短剧解说脚本生成功能 - 添加短剧解说模式，支持上传字幕文件 - 实现短剧解说脚本生成逻辑 -优化脚本设置界面布局，支持多种脚本类型 - 修复部分功能模块的引用错误	2025-05-10 22:57:05 +08:00
linyq	e66a5969f0	actorref(tools): 重构工具模块并添加日志记录功能- 在 base.py 中添加了调试日志记录视频参数 - 修改了 generate_script_docu.py 和 generate_script_short.py 中的视觉和文本分析参数处理逻辑 - 优化了参数传递和视觉分析器实例创建过程 - 在 generate_script_docu.py 中添加了视频配置检查函数调用	2025-05-10 16:45:25 +08:00
linyq	3fe8eb50c0	(webfeatui): 重构视觉分析功能并添加新模型支持 - 移除了对 QwenVL模型的特定逻辑，改为更通用的实现 - 添加了对 OpenAI 视觉模型的支持- 更新了视觉模型设置界面，增加了新的模型选项 - 重构了测试连接和创建分析器的代码，提高了可维护性 - 调整了配置文件结构，简化了视觉模型的配置	2025-05-09 12:03:27 +08:00
linyq	fef3b3c8fd	feat(subtitle): 添加字幕自定义位置功能 - 在 generate_video.py 中实现自定义字幕位置的逻辑 - 在 schema.py 中添加 custom_position 字段 - 更新 webui 组件以支持自定义位置设置 - 调整任务处理逻辑，支持新的自定义位置参数	2025-05-08 20:45:14 +08:00
linyq	b762bf8d93	refactor(app): 重构生成解说文案功能并支持 deepseek-reasoner 模型 - 引入 loguru 库用于日志记录 - 优化 API 请求流程，支持非 JSON 输出的模型- 更新 API 密钥和基础 URL - 修改系统提示语以更符合短视频解说文案的需求 - 优化日志输出，使用 debug 级别记录 token 消耗 - 清理生成的解说文案中的多余字符 - 更新文档生成工具中的日志级别	2025-05-08 17:37:07 +08:00

1 2 3

113 Commits