【资料图】
就在人们震惊于ChatGPT处理文本能力的时候,计算机视觉领域的AI又带给人们新的惊喜。硅谷的Meta公司近期发布的Dinov2,是类似于ChatGPT的一个大模型。当你给它一张火车的照片,然后让它找到所有跟火车相关的图片,它不仅找出了火车的图片,还找到了人在火车站的图片,这意味着它真正理解了火车的含义。
与此同时,Dino2解决了计算机视觉领域的两大难题,第一个是图像分割,第二个是看出物体的远近。这二者结合,将会给人工智能领域带来新的飞跃。
这期视频,聊聊计算机视觉领域的ChatGPT有多牛。
标签: