智源:发布通用向量模型BGE-M3

智源发布了BGE家族的新成员——通用语义向量模型BGE-M3。该模型支持超过100种语言,具备领先的多语言、跨语言检索能力,能够处理“句子”、“段落”、“篇章”、“文档”等不同粒度的输入文本,最大输入长度为8192。此外,该模型一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能,在多个评测基准中达到最优水平。BGE-M3是首个集多语言、多粒度、多功能三大技术特征于一体的语义向量模型。目前,该模型已向社区全面开源并支持免费商用许可。

开源仓库及技术报告:
https://github.com/FlagOpen/FlagEmbedding
模型链接:
https://huggingface.co/BAAI/bge-m3

搜索