微软宣布开源多功能视觉模型Florence-2,分割、识别一切图片!

微软开源了多功能视觉模型Florence-2,支持图像描述、目标检测、视觉定位和图像分割等功能;Florence-2使用了大规模数据集FLD-5B进行训练,提高了模型的泛化能力和性能;模型基于Transformer架构,采用序列到序列学习方法,增强了处理各种视觉任务的灵活性和效率。

搜索