Linly Talker:数字人对话系统,Linly开源社区推出的一个开源数字人框架

Linly Talker:数字人对话系统,Linly开源社区推出的一个开源数字人框架

Linly Talker是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Microsoft Speech Services 和 SadTalker 生成系统,旨在提供逼真的数字人对话体验。Linly-Talker 支持用户上传图像进行对话,并通过多轮对话系统增强互动性和现实感。该项目由 Kedreamix 开发,并在 GitHub 上开源,供开发者和研究人员使用和改进。

Linly Talker功能

  1. 多模型集成:Linly-Talker整合了Linly、GeminiPro、Qwen等大模型,以及Whisper、SadTalker等视觉模型,实现了高质量的对话和视觉生成。
  2. 多轮对话能力:通过GPT模型的多轮对话系统,Linly-Talker能够理解并维持上下文相关的连贯对话,极大地提升了交互的真实感。
  3. 语音克隆:利用GPT-SoVITS等技术,用户可以上传一分钟的语音样本进行微调,系统将克隆用户的声音,使得数字人能够以用户的声音进行对话。
  4. 实时互动:系统支持实时语音识别和视频字幕,使得用户可以通过语音与数字人进行自然的交流。
  5. 视觉增强:通过数字人生成等技术,Linly-Talker能够生成逼真的数字人形象,提供更加沉浸式的体验。

官网链接:https://github.com/Kedreamix/Linly-Talker

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
产品其他视频

EchoMimic:一张照片生成说话视频,阿里巴巴推出的一个开源数字人项目

2025-5-11 9:33:08

产品其他视频

LiveTalking:开源的数字人制作平台,可媲美商业软件的实时交互流式数字人项目

2025-5-12 9:02:45

搜索