全部标签

开源项目

免费语音转文本/字幕，7款免费的语音转文字工具推荐

现在我们工作会议时，都会用到录音转文字工具，今天就给大家分享几款不一样的语音转文字工具，都是免费、开源项目！ 1.Voice-Pro AI：多媒体处理全能王主要功能：集成转录、翻译、文字转语音三大核心功能，支持实时处理与批量操作。附带YouTube视频下载、语音分离、多语言翻译等黑科技功能。使用场景：适合内容创作者、开发者处理多媒体内容，如视频制作、播客剪辑等。推荐理由：可视化操作界面简洁直…
百科
- 5.1k
25年10月14日
DeOldify： AI 照片色彩还原工具，可为黑白、褪色老照片自动上色

DeOldify 是一款在线 AI照片色彩还原工具，自 2018 年推出，为开源项目。DeOldify 基于数百万张真实照片进行训练，可以为色调单一的照片及视频自动添加颜色，它能准确把握图片每一部分的真实颜色，并同时优化照片细节提升整体清晰度，不仅可以快速为黑白图像添加自然、逼真的色彩，也能让泛黄、褪色的旧照片恢复往日原彩。用户只需上传图像就可以迅速获取自动上色后的图片，无需任何额外的手动操作，简…
产品
- 5.8k
25年9月14日
股票AI量化分析工具有那些？分享3个AI股票量化开源神器

写一篇介绍 AI股票量化交易的开源项目，本篇文章将 GitHub 上量化交易相关的开源项目进行搜罗整理，分享给大家。它们是： 1. 股票 AI 操盘手 2. 本地量化交易解决方案 3. 支持实时交易的量化回测框架股票 AI 操盘手 GitHub 斩获 Star 数：2,900 这个叫做 AI 量化交易操盘手的开源项目，目前在 GitHub 上获得了 3K 的 Star。可以把他理解成用 AI …
百科
- 20.1k
25年5月23日
Awesome Digital Human Live2D：基于Dify的开源AI数字人工具，2G显卡就能跑的数字人系统

Awesome Digital Human Live2D是一个基于Dify的开源AI数字人工具，具有Docker 快速部署、超轻量级和低配置要求（低于 2 核 2G）。该工具支持接入 Dify/FastGPT 等编排框架服务，并支持 ASR、LLM、TTS 和 Agent 的模块化扩展，还支持 Live2D 人物模型的扩展与控制，可通过 PC 端和移动端的 Web 访问。拥抱Dify生态，打造一个…
产品
- 16.3k
25年5月12日
Linly Talker：数字人对话系统，Linly开源社区推出的一个开源数字人框架

Linly Talker是一个创新的数字人对话系统，结合了大语言模型（LLMs）与视觉模型，创造出一种新颖的人机互动方式。该系统集成了多种技术，如 Whisper、Linly、Microsoft Speech Services 和 SadTalker 生成系统，旨在提供逼真的数字人对话体验。Linly-Talker 支持用户上传图像进行对话，并通过多轮对话系统增强互动性和现实感。该项目由 Kedr…
产品
- 10.3k
25年5月11日
LatentSync：开源视频对口型AI模型，字节跳动开源的数字人项目

LatentSync是一款由字节跳动与北京交通大学联合推出的端到端唇形同步框架。它基于音频驱动的潜在扩散模型（audio-driven latent diffusion models），旨在实现无缝的时间一致性，并生成高质量的、逼真的说话视频。该框架适用于配音、虚拟头像、游戏开发等多种应用场景。 LatentSync功能端到端唇形同步：Latent Sync 无需任何中间运动表示，直接在潜在空间…
产品
- 11k
25年5月10日
开源AI笔记神器，推荐这4款AI视频转文字工具

平时刷B站、 Youtube 学习课程或技能教程，总想记点笔记方便复习？但暂停、打字、截图一通操作下来，手忙脚乱还容易遗漏重点。有没有一个工具：丢个视频链接，就自动帮你总结成笔记，而且还贴上视频里面关键截屏？有的，逛逛今天就推荐这4款AI视频转笔记神器，还开源了。 1.一键 B 站视频转笔记第一个是学生党、自媒体人都在夸的开源神器—BiliNote，让 AI 帮你自动搞定视频笔记，B 站学习…
百科
- 31.9k
25年5月3日
AMD 推出开源项目“GAIA”实现本地大模型高效运行：针对锐龙 AI 300 系列处理器优化，目前仅适用于 Windows

3 月 22 日消息，当地时间周四，AMD 宣布推出专为本地运行大语言模型（LLM）设计的应用 GAIA（发音为/ˈɡaɪ.ə/）并在 Github 开源，目前仅限于 Windows 平台。 GAIA 是一款生成式 AI 应用，能够在 Windows PC 上实现本地化私密运行 LLM，并针对锐龙 AI 300 系列处理器进行了优化，标志着 AMD 在边缘计算领域的又一重要布局。在 NPU 上运…
资讯
- 8.7k
25年3月22日
Flowise：低代码AI工具，帮助开发者快速构建和部署定制化的LLM应用

Flowise是一款开源的低代码工具，旨在帮助开发者快速构建和部署定制化的 LLM 应用。它通过可视化的拖拽界面和强大的集成能力，使用LangchainJS编写，用于构建定制化的LLM流程。它支持快速构建LLM应用程序，并提供可扩展的组件集成。Flowise可以用于构建LLM链、问答检索链、语言翻译链等多种应用场景。它是一个免费的开源项目，适用于商业和个人使用。 Flowise功能多种集成方式：…
产品
- 7.8k
25年3月21日
几个免费AI数字人开源项目，制作专属于我们自己的虚拟数字人形象

AI数字人的应用场景广泛：直播带货、虚拟人广告、虚拟教师、新闻播报员、虚拟医生等等。提供数字人服务的知名平台还有剪映、商汤如影、百度曦灵等，不过平台上的功能有使用限制，一般要充钱解锁。现推荐一些免费数字人开源项目，功能和质量并不逊色于上述平台。 1.硅基智能HeyGem 注：南京硅基智能科技集团股份有限公司是国内数字人技术领先企业 🔗https://github.com/GuijiAI/Hey…
百科
- 29.6k
25年3月15日
DeepSeek 发布开源项目 FlashMLA

2 月 24 日，DeepSeek 开源周第一个项目 FlashMLA 正式发布。据官方介绍，FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。具体来说，FlashMLA 是一个针对 Hopper GPU 优化的高效 MLA（Multi-Head Latent Attention）解码内核，支持变长序列处理，现在已经投入生产使用。 FlashM…
资讯
- 5.7k
25年2月25日
能换脸型的AI换脸开源工具，5 个开源项目而且还是免费的

如果你喜欢在社交媒体上搞笑恶搞，或者想在视频会议中神奇变身，AI换脸技术可能会成为你最得力的助手！随着深度学习的不断进步，换脸技术不再是科幻电影中的奇幻工具，而是已变得触手可及。而且，今天我们要聊的 5 个开源项目，绝对能让你玩得更爽——而且还是免费的！ 1. DeepFaceLive 想象一下在视频会议中，突然把自己“换”成喜欢的明星，或者直播时秒变超酷角色！是不是超有趣？ •特点：专注实时换脸…
百科
- 30.8k
24年11月29日
实时AI换脸ReHiFace-S，又一个超强AI换脸免费开源了

大家好，在这个AI技术飞速发展的时代，人脸替换技术早已不再是什么新鲜事儿。无论是在虚拟主播、短视频创作还是影视制作等领域，人脸识别和替换的需求日益增长。但传统的人脸替换模型往往需要大量的数据训练，这不仅耗时耗力，还有一定的技术门槛。今天，小编我要给大家介绍一个简单易用、支持一键实时AI换脸的开源项目—ReHiFace-S，它让换脸技术变得触手可及。 ReHiFace-S：一键换脸的魔法 ReHi…
百科
- 66.3k
24年9月6日
ToonCrafter：图片生成动画的工具，用AI将照片转化为卡通图像

ToonCrafter 是由香港中文大学、香港城市大学和腾讯AI实验室的研究人员开发，一个生成性的卡通插值工具，利用预训练的图像到视频扩散先验来插值两张卡通图片。它主要用于生成流畅的卡通动画，适用于卡通草图插值和基于参考的草图上色等应用。通过上传起始和结束的卡通图片，ToonCrafter 可以自动生成平滑的动画过渡，大大提高动画制作的效率和质量。 ToonCrafter功能卡通插值：能够在两张…
产品
- 13.2k
24年8月28日
HuggingFace发布AI机器人开源指南”LeRobot” 降低入门门槛

HuggingFace开源项目"LeRobot"发布了一份详细的指南，全面介绍了如何组装、配置和训练控制AI机器人的整个过程。该项目旨在降低AI在机器人领域的准入门槛，支持机器人领域的开源生态系统。 LeRobot的联合创始人Remi Cadene表示，这份循序渐进的指南面向更广泛的受众，希望能够普及AI驱动机器人技术，并鼓励该领域的创新。该指南基于开源机器人套件Koch v1…
资讯
- 19.5k
24年8月21日
复旦开源项目Hallo已适配ComfyUI插件

复旦开源的项目Hallo，一个根据音频和图片生成说话视频的项目，已经适配了ComfyUI插件。虽然安装过程中需要的依赖较多，门槛相对较高，但这一开源生态的出现，为后续的转绘和其他流程提供了更多的可能性和乐趣。 Hallo项目通过输入音频，可以让面部照片开始说话，并且伴随着相应的表情，效果看起来非常自然。这个项目采用了端到端的扩散范式，引入了分层的音频驱动视觉合成模块，以提高音频输入与视觉输出之间的…
资讯
- 7.2k
24年6月22日
GitHub Accelerator 2024扶持11个开源 AI 项目推动技术创新

GitHub 最新宣布了其2024年加速器计划，将支持11个前沿的开源人工智能项目。这些入选项目涵盖了机器学习框架、生物医学研究、AI模型测试平台等多个领域，旨在推动 AI 技术的创新和应用。根据计划，每个入选项目将获得高达40，000美元的赞助资金，以及多达350，000美元的技术支持。这些资源来自 GitHub 及其合作伙伴，包括 Microsoft Azure。 GitHub 表示，这次支…
资讯
- 23.1k
24年5月24日
免费生成不限时长的AI数字人，腾讯开源项目MuseV本地部署详解

腾讯旗下的天琴实验室刚刚开源了AI数字人MuseV项目，项目全称是：基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成（MuseV: Infinite-length and High Fidelity Virtual Human Video Generation with Visual Conditioned Parallel Denoising）。MuseV和其稍后发布的MuseTalk视频唇…
教程
- 127.4k
24年4月18日