近日,IDEA研究院创院理事长、美国国家工程院外籍院士沈向洋在IDEA年度大会上展示了最新的研究成果——基于视觉提示模型T-Rex。该模型可以利用视觉示例指定检测目标,克服了一些物体难以用文字充分表达的问题,以提高提示效率。除此之外,该模型还支持多轮正例模式、正例+负例模式和跨图模式等三种进阶模式,并可以通过与用户交互的方式进行纠错等。T-Rex主要由图像编码器、提示编码器以及框解码器三个组件组成。该研究成果来自IDEA研究院计算机视觉与机器人研究中心。
地址:https://trex-counting.github.io/