北京智源揭秘新一代超级AI模型SegGPT，引爆深度学习领域巨浪

2023-05-31 20:05 爆米花 0

编辑有话说：北京智源推出的通用视觉AI模型SegGPT表现出色。该模型在图像理解方面具有强大的能力，能够识别和分割图像中的不同物体和场景。其准确性和稳定性让人印象深刻，为各种应用场景提供了更多可能性。SegGPT的发布让智能视觉领域迈出了重要一步，希望未来能继续看到更多创新的发展。

5 月 31 日消息，在 2023 年中关村论坛人工智能大模型发展论坛中，北京智源人工智能研究院推出了旗下通用分割模型 SegGPT（Segment Everything In Contex）。

北京智源推出通用视觉AI模型SegGPT

据称，SegGPT 模型是智源通用视觉模型 Painter 的衍生模型，具备上下文推理能力，在训练完成后只需要提供示例即可推理并完成对应分割任务，包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等，都可以利用视觉提示词（Prompt）完成分割任务。

SegGPT 也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割，并且可以用掩码的颜色作为物体的 ID，进行自动追踪。

经过查询知悉，此前 Meta 也发布了其基于 AI 的 Segment Anything Model （SAM）模型，具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出 SEEM 模型，通过不同的视觉提示和语言提示，一键分割图像、视频。

免责声明：本文转载互联网，不代表本网站的观点和立场。如果你觉得好欢迎分享此网址给你的朋友。

文章标签

北京智源

本文统计

发表

暂无评论，期待你的妙语连珠