慧眼科技CEO单霆:低成本自动驾驶系统解决方案

极客网6月24日消息,今天,由汽车创新港、NewCar牛喀网主办的“预见未来:人工智能和自动驾驶技术论坛”在上海盛大举行,论坛围绕人工智能在自动驾驶汽车领域的应用实践这一话题,深入探讨驾驶辅助、自动驾驶、高精度地图、环境感知、语音识别、软件系统等技术难点和重点。极客网作为合作支持媒体,将为您带来全程报道。

论坛邀请了沃尔沃汽车智能驾驶事业部高级经理张立存博士、地平线机器人智能驾驶业务总监李星宇,亚太机电智能网联事业部 技术总监梁涛年博士,QNX大中华区总经理张人杰,吉利汽车主动安全科经理李博博士,阅面科技创始人(前阿里巴巴算法总监)赵京雷博士,慧眼科技 CEO(Imprezzeo创始人)单霆博士,上海傲硕信息科技总经理郑天堂先生,中科慧眼创始人副总经理孟然先生做主题分享。

第五位出场演讲的是慧眼科技 CEO(Imprezzeo创始人)单霆博士 ,他演讲的标题目是

《低成本无人驾驶解决方案》。

以下是演讲速记整理内容:

下面有请来自慧眼科技的单霆总给大家介绍“低成本的无人驾驶解决方案”,单博士作为一个非常资深的深度学习方面的专家,他对这方面会提出一些新的观点和看法,有请他跟我们分享。

单霆:很高兴有机会在这里跟大家分享一下我们慧眼科技之前所做的,包括在自动驾驶、汽车领域做的一些工作。

我们慧眼科技是一家创新公司,2014年切入到辅助驾驶和智能驾驶领域,我们致力于通过世界级的计算机视觉、机器学习和人工智能技术、给汽车装上智慧的、能看懂这个世界的眼睛。公司汽车前装和后装市场提供包括智能驾驶辅助系统ADAS,防疲劳驾驶检测,半自动、自动化驾驶方案等全系列汽车智能化产品。

我们其他的团队主要来自于澳大利亚国家信息通信公司、华为、英特尔、TI、中国电信、盛大等等,所以是有很雄厚技术基础的团队。

今年NVIDIA在此次CES展会发布首个车载超级计算机Drive PX2。此前的自动驾驶技术多数是基于自适应巡航系统,而这套系统运行的深度学习算法,可以通过摄像头实时采集信息,扫描周围道路街景、车辆、行人、路标等分析处理后自行学习,形成一套完整的图像,且受天气影响较小。这代表了未来智能驾驶、图象识别与技术发展的这样一个方向。

我简单介绍一下,这两条路线往自动驾驶方向走,第一条是一步到位型,由于不计成本一次性做好自动驾驶这个事,这就是以谷歌为代表的这样公司,他们主要是运用激光雷达、传感器等等,当然大家也知道激光雷达传感器的价格在100万人民币及以上。第二条路线主要是运用低成本传感器、如光学摄像头、超声波雷达、毫米波雷达等,主要依靠人工智能算法,我们慧眼科技主要是靠第二条路径。

简单说一下自动合半自动驾驶三大主要的模块,第一个模块就是感知模块,感知模块包括各种各样的传感器,包括像毫米波雷达、智能摄像头、超声波雷达,包括激光等等。第二个就是信号融合模块,就是怎么把多传感器传过来的信号做一个最终的决策,就是通过信号融合模块。第三个模块就是车身控制模块,就是我们在得到了这样信号之后,然后我们怎么来操控这部车。我们慧眼科技主要做的是第一和第二模块,就是感知和信号融合两个模块,主要是偏软件和算法。

下面说一下视觉感知技术在自动、半自动驾驶里面的重要性。汽车需要实时感知、识别自己所处的环境,起到汽车的眼睛作用,我们司机在开车的时候为什么能够做出正确的判断?是因为我们时时刻刻知道所处的位置,知道前面有什么东西。我们这个视觉的模块起到的作用就是代替人的眼睛,知道我的前方、后方有什么东西,这个东西离我有多远。第二个优势就是视觉传感器视觉的方案它的成本非常低,普通摄像头人民币一两百块钱,主要靠算法,没有硬件的制造难度和硬件的成本,这不会成为一个障碍。

像在这样一个复杂的街景,包括黄色的框就是车辆,粉色框是行人,蓝色的框是交通标识牌,白色的框是各种各样的一些文字标识等等,这是我们在街上看到很多的这样一些不同的标识物体。

智能驾驶不同发展阶段对应不同的视觉感知技术。第一个阶段就是高级驾车辅助阶段,比如我们经常说ADAS阶段。第二个阶段就是半自动驾驶阶段。第三个阶段就是全自动驾驶阶段。十年之前我在读博士的时候,我的导师有两个学生是在做ADAS,通过单目摄像头去识别。在过去的20年过程当中,这个视觉技术是否还停留在二十年前呢?其实完全不一样了。给大家看一下,在ADAS阶段我们对应车道线进行检测,前方车尾检测,这样的技术。我们现在经常讲的FCW讲的是前方的车屁股检测。在半自动驾驶阶段我们讲的叫Semantic Bounding Box,包括车道线检测,各个方向、各角度、被遮挡车辆检测、各角度的被遮挡的行人检测,骑自行车人、骑摩托车人检测、交通标识牌检测、识别等等,不仅仅只是一个车道线检测或者是完整的行人检测。对应的下一步,阶段三就是要做全自动驾驶,我们对应的是Pixel Labelling就是象素识别,是属于建筑物,是街道,还是马路崖我们全部要识别出来,这是智能驾驶三个不同发展阶段所对应的三个不同的视觉感知技术。像九几年Mobileye做的车道线检测,他们还在用,其实不是的,他们融合了很多后面这样的技术。

下面说一下慧眼科技的基于深度学习的视觉感知技术,分两步,左边,针对不同的客户我们提供不同的解决方案。对于要求高性能、专业级解决方案,专门针对自动、半自动驾驶这样的客户,我们提供高性能这样一套图象识别的基础方案。针对于低功耗、成本价格相对比较敏感一点的话我们会提供基于单目摄像头专门提供ADAS功能的这样一套解决方案。

慧眼科技ADAS产品,我们产品从去年开始销售,主要是两套,一套是面对于汽车前装市场我们提供软件整套的解决方案,对于汽车后装市场我们提供纯软件的解决方案。

系统架构,这是我们的一套针对于前装的系统架构,结构比较简单,我们对硬件依赖不是很高,主要是依靠背后的一套算法。

下面我演示一套ADAS的视频Demo,这个是晴天的。这个是针对与单目市场的,这是我们的一套系统解决方案,蓝色箭头向右的业绩方案。

下面可以放一套雨天的,我们从14年切入ADAS市场开始,在各种环境、各种场景下做了大量的测试,我们每天有几十台车全国各地在给我们采集大量的数据,包括做训练包括做测试,这是在雨天的场景下。

下面看一下在闹市的场景,前面看到的两个视频是针对于箭头向右的专门针对ADAS市场的解决方案,我们下面看一下闹市的解决方案,这里面大家可以看到我们对于不同角度的车辆,包括遮挡的,包括行人,骑自行车、摩托车的行人和车辆我们全部都可以做到非常好的检测,真正可以起到汽车大脑的作用。比较晃,这是在车上做的实拍,包括骑自行车的人半身的都可以做到很好的检测和识别。所以其实大家可以讲到是觉得感知技术,在发展了这么多年以后,Mobileye从九几年开始做,做到现在视觉感知技术有了非常大的发展,完全不再是车道线检测识别和车屁股检测识别,我们能够做的事非常多。

回到PPT,我们认为未来真正要实现自动驾驶的感知技术我们要做像素识别,这是左边一张车上的单目摄像头随机拍下的街景,这里面有车、有人、有建筑物,我们需要把每个像素清楚知道它属于哪一类物体。在右侧蓝色的就是汽车,紫色的是目录,对应的后面的绿色是这样的一些树木,然后灰色的是建筑物,红色的是行人,只有做到这样的话我们才认为真正的可以说视觉技术真正模拟了人的眼睛,真正才做到这样一个人工智能。世界上很多大的车厂都在做这样的事情,包括丰田、戴姆勒都在做,这是跑我们的程序跑出来的一个结果。下面也是同理,完全依靠单目摄像头和我们的算法。蓝色的车同样是车辆,紫色的是路面,我们可以做到很好的分割和识别。

除此之外我们还提供全系列智能驾驶领域里面的产品,因为其实智能驾驶领域除了ADAS还有非常多,因为其实我最早做APP是08、09年,现在再做APP非常难火,并不是现在做得比之前差,而是成熟了。我切入到ADAS有一点感觉像08、09年进入APP的感觉,13到16年三年下来,有点像功能车往智慧车升级换代的过程。

接下来放一个疲劳驾驶检测的Demo。我们通过跟踪人脸的一些关键点,包括他的眼睛、嘴巴,我们判断出他是否有闭眼、打瞌睡、点头等等,这是我们的产品经理在测试我们的产品,包括在摇晃摄像头,制造一些难度。大家可以注意的点就是眼睛,包括嘴巴,我们可以做到非常好的跟踪。我们可以跟踪到司机是否在打瞌睡,是否在闭眼睛等等,包括摘眼镜,我们可以做到很好的识别。墨镜我们测过,看是多墨,其实这个需求非常大。很多时候我们讲,我觉得有的时候我们陷入一种误区,实际上做得最好的Mobileye是其中一家,但是不是唯一的一家,在智能驾驶领域除了ADAS可做的事情非常多。

我的演讲就到这里,谢谢大家。

(该演讲内容全部由现场速记内容整理,若有错误之处敬请谅解)

 

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。