“跨次元”目标检测模型hold住各种画风还能识别漫画中物品_城市科技网

目标检测种类多达20000+种的AI，你见过吗？不仅准确“揪出”每个物体所在的位置，分类效果非常准确：

插画版赛博恐龙也没问题：

甚至还能检测杂志封面甚至漫画中的物体！

这也是把目标检测给玩出花来了，据作者表示模型在长尾问题等细节上的处理非常好，像狮子和狐狸这种少样本也能准确识别：

这项研究来自Meta AI和德克萨斯大学奥斯汀分校，一作是著名目标检测框架CenterNet的作者、复旦校友Xingyi Zhou。

一起来看看。

可识别“跨次元”物体

这篇论文提出了一种新的名为Detic的方法，用来解决目标检测无法用到图像级标签（给一整张图打标签，标注里面有什么物体）的问题。

此前的目标检测方法，通常是一个检测框里一个物体：

这种方法有一个问题，就是没办法利用整个图像级标签，只能用单个物体的图片进行训练。

也有一些研究想出了一种新方法，搞个弱监督学习，试图让AI自己学会将图像级的标签，去对应锚定框里面有什么物体，但实际上这种方法的效果也不太好。

Detic的方法是采用目标检测数据（a）和图像标签数据（b）对Detic进行混合训练。

其中，在用目标检测数据训练Detic时，同时对图像分类模块W和目标检测模块B进行训练，但只用标签数据对图像分类模块W进行训练。

训练的数据集采用的是ImageNet，事实证明模型在训练后无需微调，就能很好地适应到LVIS等数据集，相对之前的一些模型都达到了不错的效果：

论文表示，Detic能分类的图片类型也是多种多样，从真实照片到赛博恐龙插画这样的“跨次元”作品都能识别：

这立刻吸引了不少网友来玩。

在线Demo可玩

有网友用梵高的世界名画试了试。

放大一点来看，艺术加工后的椅子、人和桌子也能被识别：

还有用二次元的龙猫进行识别的，除了龙猫本身被错认成猫头鹰以外，其他的雨伞和靴子都认得不错：

我们也随便用一个钟表柜的照片试了试，在线Demo的检测时间稍微有点久，大约需要6分钟左右，但效果还不错：

细看的话还是能发现一些瑕疵，例如把部分手表误认成转速计、以及怀表和时钟，以及也有一两块手表没有被检测出来。

不过，即使在二次元和插画中，这个AI能识别的物体，至少也需要在真实世界出现过。

例如，超出20000个分类的物体，如喷火龙和皮卡丘，就不在AI的监测范围内了，全部被认成了猴子（狗头）：

将这些二次元角色也加入AI训练数据集中，不知能否取得同样的检测效果。

标签：

责任编辑： jkl2

“表演服”用完就退？不能放任后悔权被滥用世界短讯
“七天无理由退货”本是为了保护消费者合法权益，但有人利用...
周大生：去年电商业务收入同比增35%，今年目标超去年增速_全球看点
周大生在机构调研时表示，2022年电商业务收入同比增长34 65%...
视频号运费险正式上线，首次投保根据经营类目有5档选择环球播报
据亿邦动力消息，腾讯发布“视频号小店运费险”服务指南，视...
淘宝发布中小商家造星计划，推出最高2000元广告补贴券
淘宝宣布启动中小商家的造星计划，推出包含最高2000元广告补...
OpenAI CEO：OpenAI还没有开始训练GPT-5大模型天天播报
据外媒报道，OpenAI首席执行官SamAltman在印度经济时报主办的一场会议
亚马逊与Hexa达成协作，支持卖家创建3D图像
据亿邦动力消息，亚马逊和3D可视化公司Hexa达成一项新举措，...
属于王亚伟的时代一去不返
近日屡有传闻称，昔日“公募一哥”王亚伟已被监管部门带走调...
今头条！渤海化学：全资子公司渤海石化拟投建丙烯酸酯和高吸水性树脂新材料项目
渤海化学公告，全资子公司渤海石化拟投资建设丙烯酸酯和高吸...
上常从容与信言诸将能不文言文翻译通假字_上常从容与信言诸将能不,各有差翻译
想必现在有很多小伙伴对于上常从容与信言诸将能不,各有差翻译...
环球快看：信濠光电：公司暂未涉及上述VR、MR领域
同花顺金融研究中心6月7日讯，有投资者向信濠光电提问，请问...

智能

智联世界，元生无界！快手虚拟人IP亮相2022人工智能大会

2022-09-07 10:47:54
机器人界“奥林匹克”！2022世界机器人大会8月18日举行

2022-08-10 09:58:58
2025年全球人口将达到90亿！机器人将在农业领域大显身手

2022-07-14 09:41:10
中科院院士蒋华良：AI+分子模拟与药物研发将大有可为

2022-07-14 09:37:00
“千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕

2022-07-07 09:28:34

消费