全世界最快、更高精准度的物件侦测系统 YOLOv4 !由中研院与俄罗斯学者配合研发

admin 5个月前 (10-31) 科技 184 1
全世界最快、最高精准度的物件侦测系统 YOLOv4 !由中研院与俄罗斯学者配合研发 第1张

ADVERTISEMENT



YOLOv4 创生故事

「只要让我看一眼,我就知道这是什么!(You Only Look Once, YOLO)」YOLO,是现在当红的 AI 物件侦测演算法。中研院资讯科学研究所所长廖弘源及博士后研究员王建尧,与俄罗斯学者博科夫斯基(Alexey Bochkovskiy)配合研发最新的 YOLO 第四版(简称为 YOLO v4),一举成为当前全天下最快、更高精准度的物件侦测系统,引爆全球 AI 手艺社群,已然改写物件侦测演算法的生长。事实,他们在演算法里动了哪些手脚?又是什么样的契机,开启了这项研究?



产业出难题,学界来解题

故事,是从一项产学互助更先。前几年,科技部提出了「产学共创」机制:产业出题、学界解题,中研院互助工具义隆电子,出了一个考题给资讯所:若何增进十字路口的交通剖析?也就是即时侦测车流量、车速等等。那时义隆电子已经在十字路口架设了监视器,包罗全景摄影机及单一偏向的枪型摄影机,接下来最需要的,就是辨识车辆的物件侦测手艺。



「但我们需要的不只是辨识车辆而已。」王建尧说。在马路上运行中的车速率很快,物件辨识必须异常即时,在短时间内就能辨识出车辆,并能连续追踪,盘算车速。换句话说,这个手艺对物件的侦测必须「快、狠、准」。此外,由于影像资料不停发生,若是把资料都上传云端运算,不只对照耗时,也会给云端电脑带来太大的肩负,因此这个侦测手艺还得做到一件事──盘算量必须够小,小到可装在十字路口监视器上的小型盘算器, 即可完成物件侦测的义务。



要做到交通路况的即时剖析,必须有一种速率快、仍能精准辨识,但又可应用在生活中小型盘算器的物件侦测手艺。

YOLOv4 演算法到达这个不可能的义务!它是现在天下最快、最精准的物件侦测演算法,却又能小到放在十字路口的监视器内,已现实应用于如「智慧城市交通车流解决方案计画」,即时侦测车辆、停等车列、车速等等 。





物件辨识的阿基里斯腱:梯度消逝问题

廖弘源团队怎么办到这项不可能的义务?首先,王建尧着手研究著名物件侦测系统 YOLOv3 ,「我们想找出在确立一个物件侦测系统时,哪一个步骤是最要害的?若是改善了,效率和准确度会提升最多?」廖弘源强调:「虽然是工程问题,但我们要把科学思索带进来。」



先来熟悉物件侦测手艺!它是个卷积神经网路(Convolutional Neural Network, 简称CNN),具有许多网路层,每一层卖力抽取某些图像特征。一个输入的影像通过层层层层层层……剖析,最后找出最可能的谜底。理论上,层数越多、判断效果应该越准确。



全世界最快、最高精准度的物件侦测系统 YOLOv4 !由中研院与俄罗斯学者配合研发 第2张先教电脑界说每个影像的值,再透过神经网路的层层非线性函数运算,判断这个影像最可能为哪个数字,信心水准比值更高者为谜底。
图:研之有物
资料泉源:李宏毅 训练这个卷积神经网路的方式是:先倒入大量已符号准确谜底的学习材料 (如符号好种种车辆的图片),让机械学习若何判断。每次机械判断效果与准确谜底不符,就将这个资讯反馈到前面的网路层,调整每一层的参数,以期下次到达更准确的判断。



那么,哪一步改善后可以大幅提升显示呢?王建尧找到的要害是:学习的反馈历程。当卷积神经网路的网路层数愈多,在训练阶段,由于反馈盘算方式,每回传一层就会损失一些资讯,越前面的网路层学习到的器械越少,称为「梯度消逝问题」(vanishing gradient problem)。



为了解决梯度消逝问题,前人曾经提出 ResNet、DenseNet 等等卷积神经网路,简朴来说,即是将后面资料备份后往前「跳级」通报!以 ResNet 为例,我们可以想像成「含水传话」,从最后一个人往前传,愈前面的人资讯愈缺失。但若是最后一层更先,每一层都备份录音,再把录音跳过一层直接往前传,那么前面的所有层都可接收到资讯,前面网路层就不会学不到器械。



上图为原始的卷积神经网路 (CNN) ,假设只有三层,在资料回传的历程中会逐层递减,称为梯度消逝问题。下图为改良版 ResNet ,从最后一层更先,每一层都备份,再把备份越过一层「跳级」通报,前面网路层就能接收到后面的资讯。
图:研之有物
资料泉源:王建尧然而,ResNet 具有太多重复的拷贝,不只虚耗盘算量,而且差别层的参数用来学习重复、但多余的资讯,换句话说,每一层能学到的器械都差不多。「是否有一种更好的方式,在不改参数目,让机械运算变快,省下来的资源 (参数) 还能让机械多学一点,提高准确度?」廖弘源说。

,

欧博allbet客户端

欢迎进入欧博allbet客户端(Allbet Game):www.aLLbetgame.us,欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe *** 、Allbet电脑客户端、Allbet手机版下载等业务。

,

不只最快,还要最精准!

2019 年年头,廖弘源与王建尧团队首先研发出局部残差网路 PRNet(partial residual networks, PRNet),将资讯「分流」,削减无谓的盘算量,使运算速率增添两倍。「一更先做出 PRNet,我照样以为效果不够好。虽然削减盘算量,大幅加速了盘算的速率,然则准确率和原本相比并没有什么提升。」廖弘源自信的说:「我以为这样没什么意思,由于我们的目的,是做出全天下更好的物件侦测手艺!」



2019 年 11 月,他们在 PRNet 的基础上,紧接着研发出跨阶段局部网路 CSPNet(cross stage partial network, CSPNet),行使支解–分流–合并的路径,乐成到达了大幅削减盘算量、却能增添学习多元性的目的。



从 PRNet 与 CSPNet,我们一步步把物件侦测的盘算量减低,然则学习却能更多元,因此也获得更好的准确度。

以上为 CSPNet 简化结构的一部门,三色箭头代表机械学习历程中,后面的资料若何反馈往前传。这个设计的重点在于资讯的分流与多了过渡层 (Transtion),让反馈的学习资讯在分流后发生差异,提高每一网路层参数的行使率,目的是让机械学到更多样的器械,提高判断的准确度。另一方面,由于资料分流的关系,有部门直接往后传,不经过剖析盘算,使整个盘算量变少,运算速率也因此加速。
图:研之有物
资料泉源:王建尧「我们揭晓 CSPNet 之后,吸引 YOLO 手艺的维护者博科夫斯基(Alexey Bochkovskiy)的注重。」廖弘源说。他们很快与博科夫斯基(Alexey Bochkovskiy)睁开互助,将 CSPNet 用于开发新一代的 YOLO,并于今年 4 月揭晓了 YOLOv4 ,成为当前全天下最快、最准的物件侦测手艺,引爆全球的 AI 社群。廖弘源笑说:「我们 4 月揭晓的论文,短短不到三个月,阅读次数就超过了 1400 次,比我以往揭晓的任何论文都还多。」其中的要害手艺正是 CSPNet。



此外,由于 YOLOv4 的手艺是开放的,林林总总的应用也如雨后春笋般快速泛起。举例来说,YOLOv4 可即时侦测人们的社交距离,或是快速判断路上的行人有没有戴口罩。





 ▲盘算社交距离

YOLOv4 甚至能辨识并捕捉滑雪运动中的人,廖弘源进一步注释:「滑雪的人姿势以及运动轨迹都不停变换,甚至可能抛物线飞起,侦测难度相当高,但 YOLOv4 都能追踪得异常精准。」





▲捕捉滑雪运动的人

带学生的第一要求:把科学带进来!

中研院资讯所所长廖弘源历久研究多媒体视讯处置,从鸡尾酒浮水印到人脸资料库、数位化影片修补等,再到这次的 YOLOv4 物件侦测手艺,研究功效卓越。而每一项功效的后面,都是廖弘源率领资讯所前后届学生一起起劲的功效。



想在廖弘源的实验室事情,可不是件轻松的事。他说:「做研究,不应只想着工程问题,应该本着科学家的精神,从中找出更具科学价值的要害下手。」许多学生一到廖弘源的实验室,必须将过去狭隘、僵化的工程解题模式打掉重练,重新以科学看待问题。例如:本次 YOLOv4 的乐成要害,即在于一更先问了个好问题,找到最值得改善的环节。



岂论面临的是何种问题,我的第一个要求,就是把科学带进来。

只管治学甚严,个性海派的廖弘源和学生也有着亦师亦友的关系。他喜欢和学生一起找出好的研究议题后,一起埋首投入研究事情的热血感,也喜欢在研究遭遇瓶颈时,与学生一起「大吃一顿解忧闷」。现在,他的学生遍布国际级着名公司与研究单元,连续施展「廖式思索」的深刻影响力,开发更多如 YOLOv4 般顶尖的科研功效。



虽然团队频频缔造具商机的研究功效,但廖弘源对于奖项或是申请专利等,却是看得很淡。「我的目的原本就不是赚钱,」廖弘源说:「我只希望我们对天下的好奇与探索,能真正转化为对人类的孝敬。」



中研院记者会合影。由左到右,义隆电子叶仪皓董事长、中研院周美吟副院长、中研院资讯所廖弘源特聘研究员、中研院资讯所王建尧博士后研究员、科技部前瞻司杨琇雅司长、台大人工智慧研究中心陈信希主任、杜维洲执行长。
图:研之有物
中研院秘书处

皇冠体育声明:该文看法仅代表作者自己,与本平台无关。转载请注明:全世界最快、更高精准度的物件侦测系统 YOLOv4 !由中研院与俄罗斯学者配合研发

标签列表

    文章归档

    站点信息

    • 文章总数:1337
    • 页面总数:0
    • 分类总数:8
    • 标签总数:1604
    • 评论总数:835
    • 浏览总数:124463