Jina AI 发布全球首个开源 8K 文本嵌入模型

人工智能公司Jina AI宣布推出第二代文本嵌入模型jina-embeddings-v2,是唯一支持8192个token的开源产品。该模型在分类平均值、重排平均值、检索平均值和摘要平均值方面超越了OpenAI的text-embedding-ada-002。在过去三个月里,Jina AI的团队进行了密集的研发、数据收集和调整,从零开始构建了这个模型。jina-embeddings-v2的8K上下文长度为法律文件分析、医学研究、文学分析、财务预测和会话式AI等新的行业应用开启了大门。基准测试显示,这种8K上下文长度的扩展使得jina-embeddings-v2超越了其他领先的嵌入模型。Jina正在开发类似OpenAI的嵌入式API平台的产品,并计划进入多语种嵌入领域。

搜索