-
免费语音转文本/字幕,7款免费的语音转文字工具推荐
现在我们工作会议时,都会用到录音转文字工具,今天就给大家分享几款不一样的语音转文字工具,都是免费、开源项目! 1.Voice-Pro AI:多媒体处理全能王 主要功能:集成转录、翻译、文字转语音三大核心功能,支持实时处理与批量操作。附带YouTube视频下载、语音分离、多语言翻译等黑科技功能。 使用场景:适合内容创作者、开发者处理多媒体内容,如视频制作、播客剪辑等。 推荐理由:可视化操作界面简洁直…- 2.2k
-
DeOldify: AI 照片色彩还原工具,可为黑白、褪色老照片自动上色
DeOldify 是一款在线 AI照片色彩还原工具,自 2018 年推出,为开源项目。DeOldify 基于数百万张真实照片进行训练,可以为色调单一的照片及视频自动添加颜色,它能准确把握图片每一部分的真实颜色,并同时优化照片细节提升整体清晰度,不仅可以快速为黑白图像添加自然、逼真的色彩,也能让泛黄、褪色的旧照片恢复往日原彩。用户只需上传图像就可以迅速获取自动上色后的图片,无需任何额外的手动操作,简…- 2.2k
-
股票AI量化分析工具有那些?分享3个AI股票量化开源神器
写一篇介绍 AI股票量化交易的开源项目,本篇文章将 GitHub 上量化交易相关的开源项目进行搜罗整理,分享给大家。它们是: 1. 股票 AI 操盘手 2. 本地量化交易解决方案 3. 支持实时交易的量化回测框架 股票 AI 操盘手 GitHub 斩获 Star 数:2,900 这个叫做 AI 量化交易操盘手的开源项目,目前在 GitHub 上获得了 3K 的 Star。 可以把他理解成用 AI …- 6.2k
-
Awesome Digital Human Live2D:基于Dify的开源AI数字人工具,2G显卡就能跑的数字人系统
Awesome Digital Human Live2D是一个基于Dify的开源AI数字人工具,具有Docker 快速部署、超轻量级和低配置要求(低于 2 核 2G)。该工具支持接入 Dify/FastGPT 等编排框架服务,并支持 ASR、LLM、TTS 和 Agent 的模块化扩展,还支持 Live2D 人物模型的扩展与控制,可通过 PC 端和移动端的 Web 访问。拥抱Dify生态,打造一个…- 8.5k
-
Linly Talker:数字人对话系统,Linly开源社区推出的一个开源数字人框架
Linly Talker是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Microsoft Speech Services 和 SadTalker 生成系统,旨在提供逼真的数字人对话体验。Linly-Talker 支持用户上传图像进行对话,并通过多轮对话系统增强互动性和现实感。该项目由 Kedr…- 4.4k
-
LatentSync:开源视频对口型AI模型,字节跳动开源的数字人项目
LatentSync是一款由字节跳动与北京交通大学联合推出的端到端唇形同步框架。它基于音频驱动的潜在扩散模型(audio-driven latent diffusion models),旨在实现无缝的时间一致性,并生成高质量的、逼真的说话视频。该框架适用于配音、虚拟头像、游戏开发等多种应用场景。 LatentSync功能 端到端唇形同步:Latent Sync 无需任何中间运动表示,直接在潜在空间…- 5.5k
-
开源AI笔记神器,推荐这4款AI视频转文字工具
平时刷B站、 Youtube 学习课程或技能教程,总想记点笔记方便复习?但暂停、打字、截图一通操作下来,手忙脚乱还容易遗漏重点。 有没有一个工具:丢个视频链接,就自动帮你总结成笔记,而且还贴上视频里面关键截屏? 有的,逛逛今天就推荐这4款AI视频转笔记神器,还开源了。 1.一键 B 站视频转笔记 第一个是学生党、自媒体人都在夸的开源神器—BiliNote,让 AI 帮你自动搞定视频笔记,B 站学习…- 16.7k
-
AMD 推出开源项目“GAIA”实现本地大模型高效运行:针对锐龙 AI 300 系列处理器优化,目前仅适用于 Windows
3 月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行大语言模型(LLM)设计的应用 GAIA(发音为/ˈɡaɪ.ə/)并在 Github 开源,目前仅限于 Windows 平台。 GAIA 是一款生成式 AI 应用,能够在 Windows PC 上实现本地化私密运行 LLM,并针对锐龙 AI 300 系列处理器进行了优化,标志着 AMD 在边缘计算领域的又一重要布局。 在 NPU 上运…- 3.1k
-
Flowise:低代码AI工具,帮助开发者快速构建和部署定制化的LLM应用
Flowise是一款开源的低代码工具,旨在帮助开发者快速构建和部署定制化的 LLM 应用。它通过可视化的拖拽界面和强大的集成能力,使用LangchainJS编写,用于构建定制化的LLM流程。它支持快速构建LLM应用程序,并提供可扩展的组件集成。Flowise可以用于构建LLM链、问答检索链、语言翻译链等多种应用场景。它是一个免费的开源项目,适用于商业和个人使用。 Flowise功能 多种集成方式:…- 3.9k
-
几个免费AI数字人开源项目,制作专属于我们自己的虚拟数字人形象
AI数字人的应用场景广泛:直播带货、虚拟人广告、虚拟教师、新闻播报员、虚拟医生等等。 提供数字人服务的知名平台还有剪映、商汤如影、百度曦灵等,不过平台上的功能有使用限制,一般要充钱解锁。 现推荐一些免费数字人开源项目,功能和质量并不逊色于上述平台。 1.硅基智能HeyGem 注:南京硅基智能科技集团股份有限公司是国内数字人技术领先企业 🔗https://github.com/GuijiAI/Hey…- 12.9k
-
DeepSeek 发布开源项目 FlashMLA
2 月 24 日,DeepSeek 开源周第一个项目 FlashMLA 正式发布。 据官方介绍,FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。具体来说,FlashMLA 是一个针对 Hopper GPU 优化的高效 MLA(Multi-Head Latent Attention)解码内核,支持变长序列处理,现在已经投入生产使用。 FlashM…- 3.2k
-
能换脸型的AI换脸开源工具,5 个开源项目而且还是免费的
如果你喜欢在社交媒体上搞笑恶搞,或者想在视频会议中神奇变身,AI换脸技术可能会成为你最得力的助手!随着深度学习的不断进步,换脸技术不再是科幻电影中的奇幻工具,而是已变得触手可及。而且,今天我们要聊的 5 个开源项目,绝对能让你玩得更爽——而且还是免费的! 1. DeepFaceLive 想象一下在视频会议中,突然把自己“换”成喜欢的明星,或者直播时秒变超酷角色!是不是超有趣? •特点:专注实时换脸…- 23.5k
-
实时AI换脸ReHiFace-S,又一个超强AI换脸免费开源了
大家好,在这个AI技术飞速发展的时代,人脸替换技术早已不再是什么新鲜事儿。无论是在虚拟主播、短视频创作还是影视制作等领域,人脸识别和替换的需求日益增长。但传统的人脸替换模型往往需要大量的数据训练,这不仅耗时耗力,还有一定的技术门槛。 今天,小编我要给大家介绍一个简单易用、支持一键实时AI换脸的开源项目—ReHiFace-S,它让换脸技术变得触手可及。 ReHiFace-S:一键换脸的魔法 ReHi…- 56.8k
-
ToonCrafter:图片生成动画的工具,用AI将照片转化为卡通图像
ToonCrafter 是由香港中文大学、香港城市大学和腾讯AI实验室的研究人员开发,一个生成性的卡通插值工具,利用预训练的图像到视频扩散先验来插值两张卡通图片。它主要用于生成流畅的卡通动画,适用于卡通草图插值和基于参考的草图上色等应用。通过上传起始和结束的卡通图片,ToonCrafter 可以自动生成平滑的动画过渡,大大提高动画制作的效率和质量。 ToonCrafter功能 卡通插值:能够在两张…- 7k
-
HuggingFace发布AI机器人开源指南”LeRobot” 降低入门门槛
HuggingFace开源项目"LeRobot"发布了一份详细的指南,全面介绍了如何组装、配置和训练控制AI机器人的整个过程。该项目旨在降低AI在机器人领域的准入门槛,支持机器人领域的开源生态系统。 LeRobot的联合创始人Remi Cadene表示,这份循序渐进的指南面向更广泛的受众,希望能够普及AI驱动机器人技术,并鼓励该领域的创新。该指南基于开源机器人套件Koch v1…- 16.8k
-
复旦开源项目Hallo已适配ComfyUI插件
复旦开源的项目Hallo,一个根据音频和图片生成说话视频的项目,已经适配了ComfyUI插件。虽然安装过程中需要的依赖较多,门槛相对较高,但这一开源生态的出现,为后续的转绘和其他流程提供了更多的可能性和乐趣。 Hallo项目通过输入音频,可以让面部照片开始说话,并且伴随着相应的表情,效果看起来非常自然。这个项目采用了端到端的扩散范式,引入了分层的音频驱动视觉合成模块,以提高音频输入与视觉输出之间的…- 4.8k
-
GitHub Accelerator 2024扶持11个开源 AI 项目 推动技术创新
GitHub 最新宣布了其2024年加速器计划,将支持11个前沿的开源人工智能项目。这些入选项目涵盖了机器学习框架、生物医学研究、AI模型测试平台等多个领域,旨在推动 AI 技术的创新和应用。 根据计划,每个入选项目将获得高达40,000美元的赞助资金,以及多达350,000美元的技术支持。这些资源来自 GitHub 及其合作伙伴,包括 Microsoft Azure。 GitHub 表示,这次支…- 18.9k
-
免费生成不限时长的AI数字人,腾讯开源项目MuseV本地部署详解
腾讯旗下的天琴实验室刚刚开源了AI数字人MuseV项目,项目全称是:基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成(MuseV: Infinite-length and High Fidelity Virtual Human Video Generation with Visual Conditioned Parallel Denoising)。MuseV和其稍后发布的MuseTalk视频唇…- 114.9k
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!

















