计算机视觉领域中具有挑战性的主题之一目标检测,在数字图像作为输入的帮助下,帮助机器理解和识别实时目标。在这里,我们列出了可用于目标检测项目的顶级开源数据集。 1MSCoco COCO是一个大规模目标检测数据集,它解决了场景理解中的三个核心研究问题:检测目标的非标志性视图(或非规范视角)、目标之间的上下文推理以及目标的精确2D定位。 该数据集具有多个特征,例如目标分割、上下文识别、超像素内容分割、150万个目标实例、80个目标类别等等。 2独家暗色(ExDark)图像数据集 ExclusivelyDark(ExDARK)是一个单一的低光图像数据集,它提供了一组主要的图像集,用于对低光研究工作进行基准测试,并汇集了不同领域的专业知识,专注于低光条件,例如,图像理解、图像增强、物体检测等。 该数据集是从极低光环境到暮光(即10种不同条件)的7,363张低光图像的集合,其中12个目标类(类似于PASCALVOC)在图像类级别和本地注释目标边界框。 320BNSOMETHINGSOMETHING数据集V2 20BNSOMETHINGSOMETHING是一个大规模数据集。该数据集是一组带标签的视频剪辑,显示人类对各种目标执行预定义的基本操作。 20BNSOMETHINGSOMETHING允许机器学习模型对日常物理世界中的基本动作进行细致的理解。 4CIFAR10 CIFAR10是一个大型数据集,由10个不同类别的60,000张彩色图像组成。该数据集包括10,000张测试图像和50,000张训练图像,分为五个训练批次。 5LISATrafficSignDetectionDataset LISA或智能安全汽车交通标志数据集是一组包含美国交通标志的带注释的帧和视频。该数据集包含从不同相机获得的图像、47种美国标志类型和6610帧上的7855个注释。LISA分两个阶段发布,一个有图片,一个是视频和图片。 6OpenImages OpenImages是一个包含大约900万张图像的数据集,这些图像用图像级标签、目标边界框、目标分割掩码、视觉关系和本地化叙述进行了注释。 该数据集包含1600万个边界框,用于190万张图像上的600个目标类,使其成为具有目标位置注释的最大现有数据集。这些框主要由专业注释者手动绘制,以确保准确性和一致性。OpenImages还提供视觉关系注释,指示特定关系中的目标对、目标属性和人类行为。 7BDD100K BDD100K是异构多任务学习的驱动数据集。该数据集包括10个任务和10万个视频,用于评估图像识别算法在自动驾驶方面的进展。 该数据集上的任务包括多目标分割跟踪、图像标记、道路目标检测、语义分割、车道检测、可行驶区域分割、实例分割、多目标检测跟踪、域适应和模仿学习。 8ImageNet ImageNet是根据WordNet层次结构组织的图像数据集。在这个数据集中,层次结构的每个节点都由成百上千的图像描绘。该数据集源于计算机视觉研究中的两个关键需求。首先是需要在计算机视觉中建立NorthStar问题。其次,迫切需要更多数据以启用更通用的机器学习方法。 拓展阅读:TSINGSEE青犀视频结合多年的视频领域技术经验,通过使用部署的Al算法实时处理大量智能摄像头的视频源,实现海量视频的接入、智能分析及处理能力。目前,EasyCVR已经实现人脸检测、人流量统计、车辆检测、车牌识别等AI智能识别技术的研发,并广泛应用在交通、物流、安防、消防等场景中。未来,TSINGSEE青犀视频将提供更多基于深度学习视频分析的行业解决方案。