纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

挑战相机、人物同时移动,谷歌实现高质量3D深度信息重建,避免

3月15日 浅时光投稿
  人类视觉系统非常强大,它能够根据二维投影理解我们的三维世界。即使是在具有多个移动对象的复杂环境中,人类都能够解释对象的几何形状和深度排序。长期以来,计算机视觉一直在研究如何通过从二维图像数据来计算重建场景几何,从而复刻人类的这项独特能力。但在大多数情况下,计算机视觉系统都难以实现稳定的重建。
  当摄像头和场景对象都能自由移动时,这将变得特别具有挑战性。因为它会混淆基于三角测量的传统三维重建算法:它假设可以同时从至少两个不同的视点感知相同的对象。满足这个假设需要一个多摄像头阵列(如谷歌Jump);或者需要场景保持静止,并且只有单个摄像头移动。因此,大多数现有方法要么是过滤掉移动对象(将它们指定为“零”深度值),要么忽略它们(导致不正确的深度值)。
  在《LearningtheDepthsofMovingPeoplebyWatchingFrozenPeople》这篇论文中,谷歌的研究团队应用了基于深度学习的解决方案。所述方法可以根据摄像头和对象都能自由移动的普通视频生成深度图,并且通过关于人体姿势与形状的机器学习来避免直接的3D三角测量。尽管业界近来已经开始利用机器学习进行深度预测,但谷歌表示,他们的研究是首个为摄像头和对象自由移动的情况而开发的深度学习方案。对于这项研究,谷歌主要专注于人类,因为它们适用于增强现实和3D视频效果。
  1。获取训练数据
  谷歌采用了监督式深度预测模型训练方案,这需要通过移动摄像头来捕获自然场景视频,以及精确的深度图。关键的问题是,从哪里获取这类数据。合成数据需要对各种场景和自然人类行为进行逼真的建模和渲染,这非常具有挑战性。另外,基于这种数据进行训练的模型可能难以推广到真实场景。另一种潜在的方法是利用RGBD传感器(如微软Kinect)来记录真实场景,但深度传感器通常仅限于室内环境,而且它们存在自己的三维重建挑战。
  谷歌选择了利用现有的数据源:YouTube视频。YouTube存在大量的假人挑战:每个人摆出特定的造型,然后不眨眼、不出声、一动不动,就像玻璃橱窗里的假人模特。因为整个场景都是静止(只有摄像头在移动,所以基于三角测量的方法行之有效,而我们可以获取包含真人在内的整个场景的精确深度图。我们采集了大约2000的视频,它们涵盖了各种逼真的场景,而且人们自然地以不同的群体配置摆造型。
  2。推断移动对象的深度
  假人挑战视频为移动摄像头和“假人”提供了深度监督,但我们的目标是处理包含移动摄像头和移动对象的视频。为了跨越这一障碍,我们需要构建网络输入。
  一种可能的方法是,分别为视频的每个帧推断深度(即,对模型的输入仅是单个帧)。尽管这种模型已经优化了用于深度预测的单图像方法,但我们可以通过考虑来自多个帧的信息来进一步改善结果。比方说运动视差,即两个不同视点之间的静态对象的相对明显运动,这可以提供强烈的深度线索。为了利用这些信息,谷歌计算视频中每个输入帧和另一帧之间的2D光流,后者表示两帧之间的像素位移。所述流场取决于场景的深度和摄像头的相对位置。但由于摄像头位置已知,谷歌可以从流场中移除它们的依赖关系,这能够产生初始深度图。所述的初始深度仅对静态场景区域有效。为了在测试时处理移动的人类对象,谷歌应用人工分割网络来掩模初始深度图中的人类区域。然后,所述网络的完整输入包括RGB图像,人类掩模,以及来自视差的掩模深度映射。
  这个网络的工作是“修复”包含人类对象的区域的深度值,并且优化其他位置的深度。由于人类具有一致的形状和物理尺寸,网络可以通过大量的训练样本进行学习。经过训练,谷歌的模型可以处理包含任意摄像头和人类运动的自然视频。
  下面是基于视频的深度预测模型结果示例,以及其他基于最新深度学习的方法:
  3。利用深度映射的3D视频效果
  对于谷歌的解决方案,预测的深度映射可用于产生一系列的3D感知视频效果。一种这样的效果是合成散焦。下面是一个利用普通视频和谷歌深度映射制作的示例。
  谷歌指出,所述深度映射的其他亲在应用包括,根据单眼视频生成立体视频,以及将合成CG对象插入至场景之中。深度映射同时能够用其他帧中的内容来填充空白和遮挡区域。在下面的例子中,谷歌在几张帧中用人工方式摆动摄像头,并通过其他帧的像素填充了演员背后的区域。
  原文链接:https:yivian。comnews61612。html
  来源:新浪VR
投诉 评论 转载

30多年前,日本是如何输掉芯片战争的?仅仅30余年,已经少有人记得那场在日美之间爆发的芯片战争。这一战,日本人输得干干净净,从高峰时占据全球近80的DRAM(俗称电脑内存)份额,跌到现在的零。这场芯片战争完美……人的长寿秘诀是什么?研究发现健步如飞或能多活15年长生的秘诀是什么?因为每个人都有自己长寿的特点,导致多年来各种说法不一。近期英国研究团队的一项新的研究结果,为长寿秘诀又添加了一种可能。他们的研究表明,一个人如果走路速度快,或……我国系留浮空器创纪录突破海拔7000米高空我国系留浮空器创纪录!记者刚才从中科院空天信息研究院获知,此前在纳木错进行的第二次青藏高原综合性科学考察研究中,由该院研发的系留浮空器创新技术正式运用,于5月23日凌晨超过海拔……乐高玩具真的能培养孩子的注意力吗?文周兴斌(微信公众号ID:bangmangtuan)随着现代家长越来越重视孩子的教育,愿意为孩子的智力发展买单,市面上各种各样的益智玩具也如雨后春笋一般层出不穷。虽然大部……首批5g手机有哪些?首批5g手机名单首批5g手机有哪些?价格分别是多少?还不清楚的小伙伴看过来,百战网琦玉接下来为大家带来首批5g手机名单的详细介绍!感兴趣的朋友们不要错过喔!首批5g手机有哪些?首批5g手……我国新一代磁浮试验样车下线时速高达600公里我国新一代磁浮列车试验样车下线。大家都知道,现阶段,通常民航飞机的飞行速度为800~900千米小時,而在我国高铁动车最高运作速度为350千米小時,飞机和高铁动车相互之间就空出5……华为鸿蒙系统和安卓系统有什么区别?鸿蒙系统和安卓系统哪个好?华为鸿蒙系统和安卓系统有什么区别?鸿蒙系统和安卓系统哪个好?手机制造商来说是免费的。然而,从系统设计的角度来看,Android系统有很多缺点。基于开源设计,系统每天会产生大量的……大数据智能是什么?智能大数据介绍大数据智能是什么意思?互联网时代已然在快速发展,21世纪初,我们已经渐渐步入大数据智能时代,估计现在走到哪里,大家都能听到大数据这几个字,那么大数据智能是什么呢?来看看智能大数……科技晚报:阿里、蚂蚁金服附属公司收购阿里健康股份苹果6月4日国内新闻阿里、蚂蚁金服附属公司将购阿里健康22。7亿港元股份5月23日消息,阿里健康发布公告称,阿里巴巴全资附属公司AliJK与蚂蚁金服间接全资附属公司Antfin……索尼独占游戏《BTruth》登陆PSVR,带由索尼伦敦工作室(《PlaystationVRWorlds》)开发的《BTruth》是一款PSVR独占内容,并旨在为玩家带来一种仿如电影主角的感觉。《Blood……挑战相机、人物同时移动,谷歌实现高质量3D深度信息重建,避免人类视觉系统非常强大,它能够根据二维投影理解我们的三维世界。即使是在具有多个移动对象的复杂环境中,人类都能够解释对象的几何形状和深度排序。长期以来,计算机视觉一直在研究如何通过……索尼正在开发新一代VR手套旨在为手指提供触觉反馈索尼正在开发VR手套旨在为手指提供触觉反馈,该新专利指出VR手套可检测到用户的手指并根据触觉响应处理模块进行检测,这意味着您触摸虚拟对象时VR手套将会提供实时反馈。这对v……
十位最佳美国总统四无强邻澳大利亚正在控制太平洋?Booker。。。美军研发新一代战略核潜艇将耗资近千亿美元中国自研水下超音速火箭有多难?专家到这国受。。。俄一核潜艇曾是本国支柱,却因一笔小钱被拆造出氢弹拢共分几步?人类又一小步!SpaceX首次成功实现海上回收。。。以色列始终支持中国的原因是什么王卫星:透视外军联合作战指挥体制改革}几张图告诉你辽宁舰训练强度有多大中国控制南沙岛礁最新数目:未来将会用有大。。。你见过“立”着的船吗?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形