作者:许小岩 来源:AI脑力波 授权 产业智能官 转载。
近两年,国内外掀起了一场空前的无人驾驶热潮。特斯拉、谷歌、福特、奔驰、丰田、百度、滴滴等众多企业开始研发无人驾驶汽车,甚至不少企业已经计划量产无人车。而在推动无人驾驶技术取得更多进展的过程中,要想无人驾驶汽车大量普及,还有许多艰巨的技术挑战有待克服。
因此,笔者这次选择从无人驾驶技术的角度,尽可能全面地来与大家聊一下如何入门无人驾驶行业。
无人驾驶有哪些好处?
无人驾驶实现普及会带来哪些好处呢?
首先,能提高人类社会的效率。当无人驾驶成为现实时,人们就可以在路上办公、生活,时间都浪费在路上的这种说法将不复存在。另外,每辆传统车每年平均排放5吨的二氧化碳,而如果使用中央调度的无人新能源车,总排放量可以降低到0.6亿吨,效果惊人。
其次,比人类驾驶更为安全。人类驾驶员每驾驶100万英里的里程,平均会发生4.2次意外,全球每年会产生大约1300万次事故。如果我们能把无人驾驶每100万英里的事故率控制在1次以内,那么总事故数会被控制在300万左右。现在每年全球车祸死亡人数超过百万,所以无人驾驶的普及可以每年在全球挽救几十万甚至上百万的生命。
无人驾驶技术
无人驾驶并不是单点的技术,而是多个技术的整合。自动驾驶的关键技术依次可以分为环境感知、行为决策、路径规划和运动控制四大部分。
环境感知
去年5月,特斯拉撞卡车交通事故的宣判结果是:特斯拉Autopilot的功能限制是导致2016年5月交通致死事故的主要原因,这里的功能缺陷实际上就是传感器感知的缺陷。
无人驾驶汽车行驶过程中有必要知道自己的位置信息,只有这样才知道要怎么去往目的地。因此,无人驾驶汽车如何进行定位呢?这里我们要讲到三个方面。
技术1:感知传感器
感知传感器分为很多种,包括视觉传感器、激光传感器、雷达传感器等。
1视觉传感器 视觉传感器就是摄像头,可分为单目视觉和双目视觉。比较知名的视觉传感器提供商有一色类的Mobileye、加拿大的PointGrey、德国的Pike等。要想完成高速公路的自动驾驶,这一类的传感器就够用了。2激光传感器激光传感器分为单线和多线,其中多线一直到64线。每多一线,成本上升1万元,当然相应的检测效果也更好。在城市道路中,仅靠视觉传感器是很困难的,这时就需要用到激光传感器提供极高的精度和极其丰富的感知信息。3雷达传感器雷达传感器目前已经在汽车上得到了广泛使用。
成本问题:
在短期内,激光雷达的成本仍然很高,而且是转动的形式,容易磨损,耐用性很差,这也是限制自动驾驶汽车普及的重要原因之一,有待无人驾驶领域工作者来解决。
技术2:GPS
GPS是一个比较好的定位导航工具,但是其更新率低是最大的问题。有的是1帧/秒的更新,有的是10帧/秒的更新,车辆高速行驶的状况下,这显然不够用。所以,一般情况下,我们会把GPS和IMU惯导系统结合起来。惯导系统能提供快速更新——1000帧/秒,这弥补了GPS的更新率低的问题;而惯性导航所存在的“累计误差”问题,也可以通过GPS来弥补。
技术3:高精地图(HD Map)
激光雷达的好处是有一定的射程,能触及100-200米的距离,能很精准的得到空间中的点(3D点云)。将激光雷达的数据和高精地图的数据做一个匹配,可以将车辆定位上升到厘米级别。
具体到高精地图的制作上。在高精地图的最底层,是一个网格地图,网格地图是使用激光雷达扫描回来的,精度可达5厘米;网格地图之上,我们会做道路的标签,也就是最底层的reference line;再加一些语义信息,精确到车道,标示出lanes;在车道之上,再做一些语义标签,比如限速、红绿灯这样的标志物。高精地图制作起来费用高昂,因为需要激光雷达设备不断去扫描外部环境,从而得到相关的数据来支撑其制作。刚入门的同学可以使用商业地图平台,比如百度地图,去了解现有地图的精度。然后通过深入学习高精地图 。
技术4:轮速计
这个就相对简单了,因为轮子周长固定,可以通过圈速来进行距离的测算,但是这个方式的累计误差会比较大,所以也存在很大的问题。
行为决策
这个部分其实是无人驾驶中最难的部分。感知、决策、规划、控制这四层并不是独立存在,各个层级之间都需要编写代码,去实现信息的转化,设计到行为决策可细化为:
步骤1. 采集
最上方的感知系统可以感知行人的位置、速度及态势,然后将这些信息传送给预测模块,预测行人是往前还是往后,速度多快。而下方的定位数据流进来之后,全局的路径规划模块就会将这些路径传入到最核心的控制决策模块——其中包括行为决策、动作决策和反馈控制。最后,这些信号会传送给CAN-BUS,由车辆来执行。
步骤2. 预处理
传感器的信息拿到后会发现不是所有信息都是有用的。
传感器层将数据以一帧一帧、固定频率发送给下游,但下游是无法拿每一帧的数据去进行决策或者融合的。这是因为传感器的状态不是100%有效的,如果仅根据某一帧的信号去判定前方是否有障碍物,对下游决策来说是极不负责任的。因此上游需要对信息做预处理,以保证车辆前方的障碍物在时间维度上是一直存在的,而不是一闪而过。
这里就会使用到智能驾驶领域经常使用到的一个算法——卡尔曼滤波。卡尔曼滤波(Kalman filtering)一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。
步骤3. 决策
这里其实可以分成两个问题:一个是分类问题,另一个是回归的问题。分类问题要了解的是行人到底是过马路还是不过马路,回归问题就更复杂一些,如果行人是过马路,那么针对其过马路的速度是多少,需要做一个预测。 路径规划也是比较有趣的,因为这对无人车来说是一个比较特殊的问题,因为对于普通的车辆来说,只要知道这是哪条路就行了,而不需要知道这是哪一条车道。
有了全局的路径规划以后,我们就需要进行行为决策。因为道路场景非常复杂,可以分成几十个不同的场景——左右车道、丁字路口等等,需要做场景组合决策。
路径规划
智能车辆有了行驶任务,智能车辆的路径规划就是在进行环境信息感知并确定车辆在环境中位置的基础上,按照一定的搜索算法,找出一条可通行的路径,进而实现智能车辆的自主导航。
路径规划的方法根据智能车辆工作环境信息的完整程度,可分为两大类:
一是,基于完整环境信息的全局路径规划方法。例如,从上海到北京有很多条路,规划处一条作为行驶路线即为全局规划。如栅格法、可视图法、拓扑法、自由空间法、神经网络法等静态路径规划算法。
二是基于传感器实时获取环境信息的局部路径规划方法。例如,在全局规划好的上海到北京的那条路线上会有其他车辆或者障碍物,想要避过这些障碍物或者车辆,需要转向调整车道,这就是局部路径规划。局部路径规划的方法包括:人工势场法、矢量域直方图法、虚拟力场法、遗传算法等动态路径规划算法等。
另外,在车道保持、车道偏离预警、车距保持,障碍物警告等系统中,也需要预测本车与其他车辆、车道、行人等在未来一段时间内的状态,这里需要了解和学习的决策理论包括:模糊推理、强化学习、神经网络和贝叶斯网络技术等。
运动控制
规划好了行驶路径,接下来就是运动控制部分需要完成的内容。
运动控制,包括加速、减速、转向等等,速度控制主要使用了ST-graph工具来做,路径控制主要是动态编程来实现。
现在研究比较多的是路径控制,所运用的方法主要包括滑膜控制、模糊控制、神经网络控制、最优控制、自适应控制和纯跟踪控制等。
通俗地讲就是,速度控制为给定一个速度,通过控制转向达到车辆沿着预定轨迹行驶的目的;而路径控制目的是为了满足车辆行驶过程中的速度要求,有时候还需要配合速度达到满足车辆在轨迹跟踪的同时,还需要满足安全性、稳定性和舒适性的目的。因为车辆是一个特别复杂的系统,速度、路径和垂向都有耦合关系的存在,因此就需要对智能车辆进行两方面的协同控制。由于其耦合关系的复杂性,所以说智能车辆运动控制的协同控制技术,也是该部分的技术难点。
无人驾驶入门方法
许多技术方向的同学对人工智能是又爱又畏惧,一方面觉得这是未来,另一方面觉得很难而不敢触碰。下面,我们探讨一下如何为投身无人驾驶行业做好准备。
兴趣与勇气
当前的人工智能热潮是一次大的技术革命,对广大技术人员来说是个特别好的机会,但是如果只掌握一个技术点是不足够的。在技术行业,隔行如隔山,比如做算法的对软件设计未必熟悉,专注做软件的很少懂系统,而懂系统的了解硬件的也不多。反过来也一样。所以如果你有好奇心有兴趣,也有勇气去尝试新的东西,那么就一定能克服困难,入门无人驾驶领域。
入门知识学习
无人驾驶是一个复杂的系统,涉及的技术点种类多且跨度大,入门者常常不知从何入手。本文宏观地呈现了无人驾驶的整体技术架构,概述了无人驾驶中涉及的部分技术点。当你对无人驾驶技术有了宏观认识后,再开始进一步学习无人驾驶定位导航、感知、决策与控制等算法,深度学习在无人驾驶中的应用,无人驾驶系统软件和硬件平台,无人驾驶安全及无人驾驶云平台等多个主要技术点。
书籍和课程
美国出版的《Creating Autonomous Vehicle Systems》这本书被IEEE推荐为无人驾驶教材,已经被美国多个大学的图书馆收录,如果大家感兴趣可以拿来读一读。另外,如果你对某个技术点特别感兴趣,网上也有足够的文献值得你去深入研究。
另外,优达学城的《无人驾驶入门》这门课的要求相对较低,也适合有了一定自学基础的无人驾驶爱好者进行学习。教授这门课的正是Thrun大神,他曾是Google无人车项目负责人,被称为无人车之父。
本文为大家呈现了无人驾驶涉及到的各细分领域技术,如果你对无人驾驶感兴趣,如果你想成为一名无人驾驶工程师,小编希望本文能让你有所收获。
人工智能赛博物理操作系统
AI-CPS OS
“人工智能赛博物理操作系统”(新一代技术+商业操作系统“AI-CPS OS”:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。
AI-CPSOS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:
重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?
AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:
精细:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。
高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。