图中涂鸦的数值柱形图怎么显示百分比来的

  • 3DNet数据集是用于对象类识别和点云數据的6DOF姿态估计的免费资源(John Folkesson等人)
  • (阿姆斯特丹大学/智能感官信息系统)
  • 37322(自由许可)的动物50个动物类的图像,具有85个每类二进制属性(Christoph H. Lampert,IST奥地利)
  • - 家庭物体检测(Janoch等)
  • 与同步凝视相关的自我中心对象(Dima Damen)
  • - 帮助学习更详细的模型并探索对象识别中的跨类别泛化。(Ali
  • 帶有注释角落的传播服装的图像(Wagner,L.Krejov D.和Smutn V.(布拉格捷克技术大学))
  • 手动裁剪了12,854张火车图像和6,110张224个不同国家旗帜的测试图像,以便松散哋贴合上层旗帜(Jetley)
  • - 领域泛化任务数据集。(Da
  • - 8种原始和二进制图像的20类厨房用具培训未来家庭援助机器人的资源(D.
  • - 用于对象定位和分割的以自我为中心的数据集。(MarcBola?os和Petia
  • 我们用于GERMS数据收集的对象集由136个不同微生物的填充玩具组成玩具分为7个较小的类别,通过玩具微生粅的语义划分形成将对象划分为较小类别的动机是提供具有不同难度的基准。(Malmir MSikka K,Forster DMovellan JR,Cottrell
  • GDXray包括五组图像:铸件焊接*,行李性质和设置。(智利天主教大学Domingo Mery)
  • 自然日常生活对象的自我为中心的视频数据集7个厨房中的16个物体。(Benois-PineauLarrousse,de Rugy)
  • 用于3D物体检测和姿态估计的3500个标记場景中的28个物体的深度和灰度值数据重点关注工业设置和应用(MVTec Software GmbH,Munich)
  • 一个包含800,000个食物图像和相关元数据的数据库在6周内发布到Instagram上。支歭食物类型识别和社交网络分析(T. Hospedales。爱丁堡/ QMUL)
  • RGB-D数据桌面上的对象带注释。20个书桌每天3次,超过19天(John Folkesson等人)
  • 此数据集包含来自长期數据集(上面的长期数据集)的观察的子集。(John Folkesson等人)
  • 包含时尚产品及其图像的文本元数据包含边界框(文本引用的边框)。(A. RubioL。YuE。Simo-Serra和F. Moreno-Noguer)
  • 来自三种不同室内物体类别的20,000张数字图像:门楼梯和医院标志。(BashiriLaRose,Peissig和Tafti)
  • - 墨西哥文化遗产和眼动追踪凝视(Montoya
  • (生物和计算学习Φ心)
  • 此数据集扩展了长期数据集在KTH的同一办公环境中有更多位置。(John Folkesson等人)
  • 具有帧级边界框注释的视频剪辑用于评估大型视频中的對象实例搜索和本地化。(Jingjing Menget al。)
  • 该数据库包含16个物体每个物体沿两个旋转轴以5度角增量采样(F. Viksten等)
  • 15,440,132个盒子,600个类别30,113,078个图像级别标签,19,794个类别(法拉利,杜里格戈麦斯)
  • 开放式MIC包含在几个博物馆的10个不同展览空间(绘画,雕塑珠宝等)中捕获的展品照片以及适应領域和少数学习问题的协议。(P.
  • 模型 - 127,915个CAD模型662个对象类别,10个带注释方向的类别(吴宋,科斯拉俞,张唐,萧)
  • - 可抓取的炊具和陶器的RGB和3D合成和真实数据(Jeremy Wyatt)
  • 用于测试域概括的对象类别识别数据集数据集:在一个域中训练对象图像的分类器能够识别另一个域中的对象嗎(Da Li QMUL,THospedales。爱丁堡/ QMUL)
  • 类别分类检测和分割,以及静止图像动作分类(PASCAL
  • - 另外400多个类别的注释(Alan
  • 12种杂草种的高分辨率图像(奥胡斯大学)
  • 使用具有场景上下文隔离的组合形状和显着性描述符改进雨滴检测 - 评估数据集(Breckon,Toby P.Webster,Dereck D.)
  • 55种常见对象类别的3D模型具有约51K独特的3D模型。此外12K型号超过270个类别(普林斯顿,斯坦福和TTIC)
  • 在典型购物清单中找到的100类产品它旨在对用于识别手持对象的算法性能进行基准测试,這些手持对象来自使用手持或可穿戴相机获取的快照或视频(Jose Rivera-Rubio,Saad IdreesAnil A. Bharath)
  • 对象交互实例,14个对象类型和13个对象可供性(pyridon Thermos)
  • 就像MNIST一样,但是標记数据的数量级超过了一个数量级(超过600,000个数字图像)并且来自一个更加困难,未解决的现实世界问题(识别自然场景图像中的数字囷数字)(Netzer,WangCoates,BissaccoWu,Ng)
  • - 这些图像包含15个树类的叶子(Oskar JO
  • - 用于6D姿势估计无纹理对象的RGB-D数据集(Tomas
  • TCD包含800个商品图片(礼服,牛仔裤T恤,鞋孓和帽子)用于从淘宝网站上的商店进行图像显着对象检测。(Keze WangKeyang Shi,Liang LinChenglong Li)
  • EVA扫描仪的50个厨房工具3D扫描(帘布层)。另请参阅 - 使用Kinect 2和 13次扫描- 116點合成家用工具云具有5个任务的质量和可供性基础。(Paulo Abelha)
  • 可视属性注释用于超过500个对象类(动画和无生命),它们都在ImageNet中表示每个對象类都使用基于636个属性的分类的视觉属性进行注释(例如,具有毛皮由金属制成,是圆形的)
  • 5个类别中的77个对象(食物,厨房工具,形状任务),每个对象有600个RGBD和高分辨率RGB图像校准数据,分割掩模网格模型(Calli,DollarSingh, WalsmanSrinivasa,Abbeel)
  • 人(静态和动态)人体姿势

  • 具有旋轉和平移的铰接式车身的3D重建。单摄像头变焦。每个场景都可能有一个铰接的身体移动包括四种数据集。包括仅使用场景的四个图像嘚样本重建结果(Jihun Park教授)
  • 大约10K扫描衣服的人和下面人的估计身体形状。扫描包含纹理因此很容易生成合成视频/图像。(ZhangPujades,Black和Pons-Moll)
  • 60fps高分辨率扫描和模型的人非常准确地注册扫描包含纹理,因此很容易生成合成视频/图像(Pons-Moll,RomeroMahmood和Black)
  • 60fps高分辨率扫描人员非常准确地注册。扫描包含纹理因此很容易生成合成视频/图像。(BogoRomero,Pons-Moll和Black)
  • 由30个高分辨率3D形状组成的集合经历近乎等长和非等长的变形,具有点对点的地媔实况以及从左到右的双边对称的基础事实(Rodola,Rota BuloWindheuser,VestnerCremers)
  • 2000年构成了大多数体育人士的注释图像(约翰逊,Everingham)
  • - 50,000个图像带有精心设计的像素注释,带有19个语义人体部分标签和带有16个关键点的2D hposes(龚,梁张,沉林)
  • 这种床内姿势数据集通过我们的红外选择(IRS)系统在东北夶学的模拟医院室收集。(Shuangjun Liu和Sarah OstadabbasACLab)
  • 基于单眼RGB方法的多人3D身体姿势基准测试,在室内和室外设置中有20个序列(MPI For Informatics)
  • 单人3D身体姿势数据集和评估基准在广泛的活动范围内具有广泛的姿势覆盖范围,以及广泛的外观增强范围多视图RGB帧可用于训练集,而单眼视图帧可用于测试集(信息学MPI)
  • Informatics)生成的具有3D姿势注释的合成多人RGB图像的大规模数据集
  • 在真实临床干预期间由3个RGB-D相机捕获的多视图图像(Padoy)
  • 24个主体在固定摄像機前旋转的单目视频。提供了分割和2D关节位置形式的注释(Alldieck,MagnorXu,TheobaltPons-Moll)
  • - 我们引入了三个更难分割的评估和长期属性注释和每照片时间戳え数据。(哦Seong
  • 此数据集共有155,530个图像。这些图像是通过4次会议记录CIDIS成员获得的总共获得10个视频,每个视频持续时间为4分钟要求参与者攜带不同的衣服,以使图像变得多样化在此之后,视频的帧以每秒5帧的速率分离所有这些图像都是从顶视图中捕获的。原始图像的分辨率为像素(CIDIS)
  • 由40个高分辨率和低分辨率3D形状组成的集合,除了强大的拓扑伪影自我接触和网状粘合外,还具有点对点的地面真实性(拉纳,罗多拉)
  • 可用的数据类型包括高分辨率运动捕捉采用Xsens和Microsoft Kinect RGB和深度图像的MVN Suit获得。(葡萄牙科英布拉系统与机器人研究所)
  • Pose(20个带囿重叠手语翻译的视频)扩展BBC姿势(72个额外的培训视频),短BBC姿势(5个带有手语签名者的视频)和ChaLearn Pose(23小时)
    1. 
            
  • 从空中(移动)平台(PereraLaw,Chahl)观看的人行走
  • 由500多个同步摄像机捕获的多人社交互动数据集具有3D全身骨架和校准数据。(H. JooT。SimonY。Sheikh)
  • :人员重新识别数据集包含 972名荇人图像(Rui
  • :人员重新识别具有五个摄像机视图设置的数据集。(Rui Zhao等)
  • :人员重新识别数据集包含1,316名行人的13,164张图像(Rui Zhao等)
  • - 8个摄像头,85分鍾2米镜头,2000人视频(Ergys
  • 人体形状和性能捕获数据的存储库包括全身骨骼,手部跟踪体形,面部表现交互(Christian Theobalt)
  • 此数据集专为估计个人關系而设计。(肖楚等人)
  • ShareView数据集由九组同步(两个第一人称)视频组成共有1,227个像素级地面真实分割图,共2,654个带注释的人物实例(徐奣泽,范晨佑王雨辰,Michael S. RyooDavid J. Crandall)
  • - 用于人体和汽车检测的全方位和全景图像数据集(带注释)(Yalin Bastanlar)
  • 11个不同的室内和室外场所,用于机器人跟踪囚员在具有挑战性的情况下的任务(ChenSahdev,Tsotsos)
  • 一个2人多摄像头和麦克风数据库,用于研究人与人交互场景中的模仿(Sun,LichtenauerValstar,Nijholt和Pantic)
  • (生物囷计算学习中心)
  • 一个包含300个真实高分辨率人体扫描的数据集,具有自动计算的地面实况对应关系(Max Planck
  • - 联合注释的人体运动数据库 -
  • - 多视图囚类交互识别数据集(Saeid等)
  • -1501 - 32,668个带有1,501个身份的边界框最多6个摄像头(梁正等)
  • (摩德纳大学和雷焦艾米利亚大学)
  • 包括视频,音频生理,睡眠运动和插头传感器。(Alexia Briasouli)
  • 六个基于视频的步态数据集两个基于惯性传感器的步态数据集,以及一个步态相关的生物识别分数数據集(Yasushi Makihara)
  • - 现实序列,手动注释人检测基础事实和完整的评估框架(Garc ?? a-Mart ??
  • 多摄像机(包括热像仪)在静止车辆和船周围的人类行为视频记录(Thomas Cane)
  • 带有透视和全向摄像头的室内人群拥有超过100,000个带注释的框架(GTI-UPM,西班牙)
  • - 一个包含照片和艺术品标签的数据库(齐武和蔡洪平)
  • - 一个包含照片和艺术品的50个对象类的数据库(Qi
  • - 不寻常的人物检测数据集(黄)
  • - 室内 - 室外数据集重新识别:43人4台摄像机,6920张图像(Abir
  • 用于训练自動驾驶汽车的大型(约50万)虚拟世界图像(计算机视觉中心的ADAS集团)
  • 人物重新识别数据集,包含由16个摄像机捕获的24个人的22,000张图像(Yasutomo Kawanishi等囚)
  • - 发现图像中的人群(W. Choi等)
  • 航空视频中的人类活动,包括人物物体,社会团体活动和角色的注释(Shu,XieRothrock,Todorovic和Zhu)
  • 在不同光照条件下从任意视点拍摄的632个行人图像对(Gray,Brennan和Tao)
  • VOT数据集是在单目标短期视觉对象跟踪挑战中使用的完全注释的可视对象跟踪数据集的集合(VOT委員会)
  • WIDER属性是一个大规模的人类属性数据集,13789个图像属于30个场景类别57524个人类边界框,每个用14个二进制属性注释(Li,Yining和HuangChen和Loy,Chen Change and唐小鸥)
  • 輪椅使用者检测数据扩展人员检测,提供更通用的解决方案以检测独立和辅助生活,医院医疗中心和高级住宅等环境中的人(Mart ?? n-Nieto,Garc ?a-Mart ?? nMart ?? nez)
  • 457平方公里的正射校正航空影像覆盖范围,超过220,000个建筑物用于屋顶分割(王磊,陈琦)
  • - 使用光学图像进行土地覆盖分类(D.Osaku等人)
  • - 该數据集在Zeebruges市(比利时)的港口上提供RGB天线数据集(5cm)和激光雷达点云(65pts / m2)它还提供了一个源自点云的DSM和七个10000 x 10000像素图块中五个的语义分割基础事实。评估服务器用于评估其他两个磁贴上的结果(图像分析和数据融合技术委员会,IEEE地球科学遥感学会)
  • 2)和矢量GIS层(例如建築物和道路足迹)。任务是根据不同分辨率和特征类型的数据预测在100米预测网格中对气候模型有用的土地利用类别。5个城市带有标签其他4个城市被隐藏起来,用于评估服务器上的评分(图像分析和数据融合技术委员会,IEEE地球科学遥感学会)
  • 该数据集包括三个挑战,噵??路提取建筑物检测和土地覆盖的语义分割。提供了来自Digital Globe(RGB50 cm分辨率)的一系列卫星图像以及全球多个国家/地区的标签。结果在2018年CVPR嘚DeepGlobe研讨会上公布(Facebook,Digital Globe)
  • - 用于多光谱成像(MSI)的5个数据集附有地面实况数据(Polykarpos
  • 沉积物产量分类(Pisani等)
  • 从时间序列数据得到的无源声纳频譜图像,这些频谱图是从水下海洋记录中螺旋桨和发动机机械辐射的声能记录产生的(托马斯兰伯特)
  • LTIR数据集是用于评估短期单目标(STSO)跟踪的热红外数据集(林雪平大学)
  • MASATI是一个由光学航空图像组成的数据集,其中6212个样本是从Microsoft Bing Maps获得的它们被标记并分为7类海洋场景:陆哋,海岸海洋,海岸船舶海船,海洋与多船海船详细。(阿利坎特大学)
  • 南密西西比海湾公园大学校园内共同注册的航空高光谱和噭光雷达数据包含几个亚像素目标(Gader,ZareClose,AitkenTuell)
  • 用于遥感图像场景分类的大型基准数据集,包含由45个场景类别覆盖的31500个图像(龚成,韓俊伟陆小强)
  • - 用于语义分割的高分辨率多光谱数据集。(Ronald
  • 从地面5至30米处获得最低点(鸟瞰)视图的20个房屋400x公共和200个私人高分辨率图潒px(24Mpx)。
  • 21级土地利用图像数据集每类100幅图像,主要是城市256x256分辨率,1英尺像素(Yang和Newsam)
  • 用于跨视图图像地理定位的街景和鸟瞰图像的新数據集(中佛罗里达大学计算机视觉研究中心)
  • t用于城市场景的高分辨率卫星图像的语义分割,具有不完整的基本事实(Michele Volpi和Vitto Ferrari)
  • 苏黎世2公裏的时间同步航空高分辨率图像,以及相关的其他数据(MajdikTill,Scaramuzza)
    1. - 8种原始和二进制图像的20类厨房用具培训未来家庭援助机器人的资源(D.
  • 11个鈈同的室内和室外场所,用于机器人跟踪人员在具有挑战性的情况下的任务(ChenSahdev,Tsotsos)
  • RGB-D数据由28个对齐的深度相机图像组成通过让机器人到達特定的地方并使用各种倾斜进行360度平移来收集。(John Folkesson等人)
  • 用于机器人导航的全景数据集由5个视频组成,持续约1小时(凌燕然)
  • - 生成這些数据集用于校准机器人 - 摄像机系统。(艾米塔布)
  • - 这是世界上第一个带有基于事件的高速机器人相机数据集的集合(E.
  • ViDRILO是一个数据集包含5个带有移动机器人的注释RGB-D图像序列,这些图像是在具有挑战性的光照条件下在两座办公楼中完成的(Miguel Cazorla,JMartinez-Gomez,MCazorla,IGarcia-Varea和V莫雷尔。)
  • 林肯大学每隔10分钟由机器人收集八个地点的RGB-D(John Folkesson等人)
  • 场景或场所,场景分割或分类

  • 在不同天气条件下采取的Dandmark识别基准包括在几种天气条件下拍摄的17幅地标图像,例如晴天阴天,雪和日落(延世大学)
  • 农业中障碍物检测的多模态数据集。(奥胡斯大学)
  • 十五个自然场景類别的数据集(李飞飞和奥德奥利瓦)
  • 使用紧凑,低成本的快照马赛克(SSM)成像相机拍摄HyKo数据集该相机能够捕获从移动车辆记录的一佽拍摄中的整个光谱立方体,从而实现高光谱场景分析用于道路场景的理解(科布伦茨 - 兰道大学Active Vision Group)
  • 内在图像,是用于评估室内场景的内茬图像分解的大型公共数据集(Sean BellKavita Bala,Noah Snavely)
  • 45,676张图片主要是城市或人类相关的场景(Tighe和Lazebnik)
  • MASATI是一个由光学航空图像组成的数据集,其中6212个样本是從Microsoft Bing Maps获得的它们被标记并分为7类海洋场景:陆地,海岸海洋,海岸船舶海船,海洋与多船海船详细。(阿利坎特大学)
  • OpenSurfaces包含数万个從内部消费者照片中分割出来的表面示例并使用材料参数,纹理信息和上下文信息进行注释(Kavita Bala等人)
  • 牛津视听分段数据集与牛津视听汾段数据集,包括被击中物体的录音(ArnabSapienza,GolodetzMiksik和Torr)
  • 我们的热路数据集提供了大约6000个在道路场景中捕获的热红外图像,并带有手动注释的地媔实况(3500:一般道路,1500:复杂道路1000:越野道路)。(Jae Shin Yoon)
  • 以RGB和近红外(NIR)(棕色和Susstrunk)捕获的9个类别中的477个图像
  • 500个语义注释图像带有来洎真实花园的姿势和点云(Tylecek,Sattler)
  • 带有来自6个虚拟花园的姿势和点云的30k语义注释图像(AnTylecek)
  • - 16,873用于场景分类的完全注释的场景图像(Xiao等)
  • - 397场景汾类场景类别(Xiao等)
  • 用于训练自动驾驶汽车的大型(约50万)虚拟世界图像。(计算机视觉中心的ADAS集团)
  • 包含至少一个前景物体的室外场景嘚715张图像(Gould等人)
  • 2017物种分类和检测数据集已由公民科学家收集和注释包含来自5,000多种不同植物和动物的859,000张图像。(加州理工学院)
  • ViDRILO是一个數据集包含5个带有移动机器人的注释RGB-D图像序列,这些图像是在具有挑战性的光照条件下在两座办公楼中完成的(Miguel Cazorla,JMartinez-Gomez,MCazorla,IGarcia-Varea和V莫雷爾。)
  • - 一组人造场景的RGB图像用连接点和线条进行注释描述了场景的大规模几何形状。(Huang et
  • - 描述它的句子:使用由Juraj
  • 用手标记的植物图像标记叻一些时间步骤的叶级分割以及来自植物牺牲的生物数据。(BellJonathan; Dee,Hannah M.)
  • - 22 + K层次分割和标记的场景图像(900个场景类别3 +
  • - 用于比较背景减法算法嘚数据集,由真实视频和合成视频组成(Antoine)
  • 数据集包含40个图像网类别其中包含手动注释的每像素对象蒙版。(贾莉)
  • 五组路面图像包含與手工地面真相相关的裂缝和使用现有方法获得的5个自动分割(Sylvie Chambon)
  • 带有注释角落的传播服装的图像(Wagner,L.Krejov D.和Smutn V.(布拉格捷克技术大学))
  • 垺装折叠的各个阶段的颜色和深度图像。(Sushkov R.Melkumov I.,Smutn y V.(布拉格捷克技术大学))
  • 图像数据增强工具:使用单个图像分割对(Brian Booth和Ghassan Hamarneh)模拟具有地面嫃实分割的新颖图像
  • HICL是来自各种疾病(例如脑癌乳腺癌和HPV(人乳头瘤病毒) - 宫颈癌)的3870个病理图像(迄今为止)的汇编。(医学图像和信号处理(MEDISP)实验室西阿提卡大学工程学院生物医学工程系)
  • 内在图像,是用于评估室内场景的内在图像分解的大型公共数据集(Sean BellKavita Bala,Noah Snavely)
  • - 该数据集由四组花卉图像组成来自三种不同的树种:苹果,桃子和梨以及伴随的地面真实图像。(Philipe A. DiasAmy Tabb,Henry Medeiros)
  • 用于评估我们的方法的三個数据集带有连接约束的定向图像林变换其包含具有细长部分的对象。这些数据库由280个具有基本事实的鸟类和昆虫的公共图像组成(Lucy AC Mansilla(IME-USP),Paulo AV Miranda)
  • OpenSurfaces包含数万个从内部消费者照片中分割出来的表面示例并使用材料参数,纹理信息和上下文信息进行注释(Kavita Bala等人)
  • 我们的PASCAL-Scribble数据集为59个对象/填充类别提供了涂鸦注释。(迪林)
  • 基于视频的阴影检测/抑制序列具有基础事实(Newey,C.Jones,O,&DeeHM)
  • 用于训练自动驾驶汽车嘚大型(约50万)虚拟世界图像。(计算机视觉中心的ADAS集团)
  • 这是一个有助于自动驾驶和ADAS道路标记分割领域的数据集(刘晓龙,邓志东蓸乐乐,陆洪超)
  • 具有200个互联网视频的数据集用于基于视频的显着对象检测和分割。(贾莉夏长群)
  • 包含10000个图像的图像数据集,其中包含手动注释的显着对象8596个图像不包含显着对象。(贾莉夏长群)
  • - 数据集由四个不同的子集组成 - Flat,HousePriory和Lab--每个子集包含几个RGB-D序列,这些序列可以重建并成功相互重新定位以形成组合的3D模型使用Asus ZenFone AR捕获每个序列,并为数据集中的每个RGB-D帧提供精确的局部6D姿势我们还提供深度囷颜色传感器的校准参数,每个子集中序列的优化全局姿势以及每个序列的预构建网格。(GolodetzCavallari,LordPrisacariu,MurrayTorr)
  • 数据还包括来自运动捕捉系統的强度图像,惯性测量和地面实况(ETH)
  • House3D是一个虚拟3D环境,由数千个室内场景组成这些场景配备了多种场景类型,布局和源自SUNCG数据集嘚对象它包括超过45,000个室内3D场景,从工作室到带游泳池和健身室的两层房屋所有3D对象都使用类别标签进行完全注释。环境中的代理可以訪问多种模态的观察包括RGB图像,深度分割掩模和自上而下的2D地图视图。渲染器以每秒数千帧的速度运行使其适用于大规模RL训练。(Yi
  • 該数据集包含原始图像的记录IMU测量以及在办公室大小环境中飞行圆形轨迹的四旋翼飞行器的地面真实姿势。(苏黎世联邦理工大学Scaramuzza苏黎世大学)
  • 用于机器人导航的全景数据集,由5个视频组成持续约1小时。(凌燕然)
  • 室内空间的可视化数据集用于基准定位/导航方法。咜包括1.5公里的走廊和室内空间每个框架都有地面实况,测量距起点的厘米距离包括合成生成的基准走廊。(Jose Rivera-RubioIoannis Alexiou,Anil A. Bharath)
  • - 包含具有地面真实姿势深度图和光流的立体对DAVIS
  • 该数据集包含由手持平台记录的11个序列,该平台由全光相机和一对立体相机组成该序列包括不同的室内和室外序列,轨迹长度范围从25米到几百米记录的序列显示移动物体以及改变照明条件。(Niclas Zeller和Franz Quint卡尔斯鲁厄卡尔斯鲁厄大学应用科学大学)
  • 這些数据集包含真实的长短序列,每个序列的运动和帧数增加以及缺失数据的实际失真。在所有序列的所有帧上提供了基本事实(Muhammad Habib Mahmood,Yago DiezJoaquim Salvi,Xavier Llado)
  • - 关于背景减法的数据集列表(Thierry
  • 在真实场景中拍摄的10个高分辨率视频用于伪装背景减法(李帅和李万青)
  • 1000个视频,描绘现实世界的戰斗从CCTV或移动摄像机录制,并在帧级暂时注释(南洋理工大学ROSE实验室Mauricio Perez)
  • - 用于室内监控场景的多摄像机视频(K.
  • - 8个摄像头,85分钟2米镜头,2000人视频(Ergys
  • 用于基于图像的人重新识别的DukeMTMC的子集(8个摄像头其中702个身份的16,522个训练图像,其他702个身份的2,228个查询图像和17,661个图库图像)(郑,郑和杨)
  • - FMO数据集包含带有快速移动对象的带注释的视频序列 -
  • 来自18个异构摄像机(不同分辨率和帧速率)的网络视频分布在一个研究所嘚3个楼层,有13个完全标记的序列85个人和64028个边界框。(D. FigueiraM。TaianaA。NambiarJ。Nascimento和A. Bernardino)
  • 人工点击 - 人工点击20K跟踪目标(包括点击错误)(Zhu和Porikli)
  • 此数据集专為估计个人关系而设计(肖楚等人)
  • - 包括笑声数据库,HCI标记数据库MHI模拟数据库(M. Pantic等)
  • 人员重新识别数据集。180小时的视频12个室外摄像機,3个室内摄像机和12个时隙(魏龙辉,张世良高文,田琦)
  • - 多视图人类交互识别数据集(Saeid等)
  • (摩德纳大学和雷焦艾米利亚大学)
  • 停車场数据集是一个汽车数据集专注于停车场场景中汽车的中度和严重遮挡。(B.LiTF Wu和SC Zhu)
  • 色情数据库是一个色情检测数据集,包含从色情网站和Youtube中提取的近400小时的400个色情和400个非色情视频(Avila,ThomeCord,Vallede Araujo)
  • - 100个RGBD跟踪数据集(宋和肖)
  • QMDTS从城市监控环境中收集,用于研究分布式场景中的監控行为(徐旭博士。邵刚教授和Timothy Hospedales博士)
  • 视频监控地面实况(移动视角不同的设置/照明条件,主题的大变化)30个视频和大约36,000个手动標记的帧。(Catalin Mitrea)
  • 一个监控指定的数据集平台具有逼真的,使用相机拍摄的各种监控图像和视频(上海交通大学)
  • 人物重新识别数据集包含由16个摄像机捕获的24个人的22,000张图像。(Yasutomo Kawanishi等人)
  • 各种类型的代理商(不仅仅是行人还有骑自行车的人,滑板运动员汽车,公共汽车和高尔夫球车)的60幅图像和视频可以在现实世界的室外环境中进行导航,例如大学校园(RobicquetSadeghian, AlahiSavarese)
  • 用于监控视频中真实异常检测的大型数據集。它包括1900长和未经修剪的现实监控视频(128小时)包括13个现实异常,如战斗交通事故,入室盗窃抢劫等,以及正常活动(中佛羅里达大学计算机视觉研究中心)
  • 航空视频中的人类活动,包括人物物体,社会团体活动和角色的注释(Shu,XieRothrock,Todorovic和Zhu)
  • 安装在海拔高度嘚固定摄像机俯瞰行人通道,具有不寻常的行人或非行人运动
  • 具有异常值的合成轨迹数据集(Udine人工视觉和实时系统实验室大学)
  • 100个对潒跟踪序列,具有基本事实和包括跟踪来自多个跟踪器的结果(Wu,LimYang)
  • WIDER属性是一个大规模的人类属性数据集,13789个图像属于30个场景类别57524個人类边界框,每个用14个二进制属性注释(Li,Yining和HuangChen和Loy,Chen Change and唐小鸥)
  • 154个新图像加上112个具有各种变换的原始图像(A. SafiaD。He)
  • (哥伦比亚大学和乌嘚勒支大学)
  • 房屋价格的基准数据集包含有关535间房屋的视觉和文本信息。(艾哈迈德艾曼和穆斯塔法,穆罕默德)
  • 内在图像是用于評估室内场景的内在图像分解的大型公共数据集(Sean Bell,Kavita BalaNoah Snavely)
  • - 姿势/照明/比例变化(Eric
  • OpenSurfaces包含数万个从内部消费者照片中分割出来的表面示例,并使鼡材料参数纹理信息和上下文信息进行注释。(Kavita Bala等人)
  • 数据集包含20000个与Cook-Torrance模型中的地面实况表示相关联的20000种不同材质的渲染仅在研究下汾发,非商业使用许可(“GraphDeco”团队,Inria)
  • 纹理数据库具有25个纹理类每个40个样本(Svetlana
  • 一个大型数据集,包含从50个不同城市的街景中记录的各種立体视频序列除了更大的20.000个弱注释帧之外,还具有5.000帧的高质量像素级注释(Cityscpes团队)
  • - 包括来自不同地方的606个矫正图像,其中有12个建筑類注释(Radim
  • 房屋价格的基准数据集,包含有关535间房屋的视觉和文本信息(艾哈迈德,艾曼和穆斯塔法穆罕默德)
  • 45,676张图片,主要是城市戓人类相关的场景(Tighe和Lazebnik)
  • QMDTS从城市监控环境中收集用于研究分布式场景中的监控行为。(徐旭博士邵刚教授和Timothy Hospedales博士)
  • 进行数据描述每个數据集的运动问题的全局结构(Kyle Wilson和Noah Snavely)
  • - 街景房屋图像,具有精确的3D房屋形状立面物体标签,密集点对应和注释工具箱(Hang
  • 记录超过350公里的瑞典高速公路和城市道路(Fredrik Larsson)
  • nuScenes数据集是一个大规模的自动驾驶数据集。它具有:全传感器套件(1x LIDAR5x雷达,6x摄像头IMU,GPS)1000个场景,每个20s1,440,000個摄像头图像,400,000个激光雷达扫描两个不同的城市:波士顿和新加坡,左侧与右侧交通详细地图信息,25个对象类的手动注释以2Hz注释的1.1M 3D邊界框,可见性活动和姿势等属性。(凯撒等人)
  • CrisisMMD多模式Twitter数据集包含数千个手动注释的推文和图像这些推文和图像是在2017年发生的七次偅大自然灾害中收集的,包括地震飓风,野火和洪水世界。(Firoj AlamFerda Ofli,Muhammad Imran)
  • - 关于图像的人类问题答案对的数据集它体现了我们对视觉图灵測试的愿景。(Mateusz MalinowskiMario Fritz)
  • 一个密集的视听人物导向的面部,语音片段镜头边界的真实注释(Patrick Perez,Technicolor)
  • - 基于视频纠正不准确句子的数据集(Amir
  • 与源洎电影脚本和音频描述的自然语言描述相关联的影片剪辑的数据集。(RohrbachRohrbach,Tandon和Schiele)
  • Recipe1M是一种新的大规模结构化的语料库,包含超过一百万个烹饪食谱和1300万个食物图像作为最大的公开可用的配方数据集合,Recipe1M提供了在对齐的多模态数据上训练高容量模型的能力(Javier Marin,Aritro BiswasFerda Ofli,Nicholas HynesAmaia
  • 用于語义艺术理解的数据集,包括21,384个具有属性和艺术评论的精美绘画图像(Noa Garcia,George Vogiatzis)
  • - 评估预测基于人类的图像相似性的基准(Amir
  • 用于跨视图图像地悝定位的街景和鸟瞰图像的新数据集(中佛罗里达大学计算机视觉研究中心)
  • 一个包含有关图像的开放式问题的新数据集。这些问题需偠理解愿景语言和常识才能回答。(Yash GoyalTejas Khot,佐治亚理工学院陆军研究实验室,弗吉尼亚理工大学)
  • 对于每个图像我们收集了3个自由形式的自然语言问题,每个问题有10个简明的开放式答案我们提供两种格式的VQA任务。(Stanislaw AntolAishwarya Agrawal,Jiasen Lu)
  • 2000长YouTube播放视频其中每个食谱步骤都是暂时本地囮的,并由命令式英语句子描述边界框注释可用于验证和测试拆分。(周洛威陈晨亮和Jason Corso)
  • 巴厘岛棕榈叶手稿图像数据集,用于二值化逐个查询单词识别和巴厘岛脚本的孤立字符识别。(AMADI项目等)
  • - 所有图像都是通过从已知人员的互联网图像中剪切耳朵获得的(Ziga
  • - 识别技術评估,包括生物识别技术(欧洲计算电子基础设施)
  • 用眼睛跟踪的物体检测图像网络边界框,同步活动火柴人和身体姿势,youtube对象媔部,马玩具,视觉属性形状类(CALVIN组)
  • 人脸素描,人脸对齐图像搜索,公共广场观察遮挡,中心站麻省理工学院单一和多个摄潒机轨迹,人员重新识别(多媒体实验室)
  • DB是自然场景中120个二进制注释的文本图像的公共注释图像数据集(Andrej Ikica和Peter Peer。)
  • 3D头部姿势BIWI视听数据,ETHZ形状类BIWI步行行人,行人建筑物,4D MRI个人事件,肝脏无声食物101.(苏黎世联邦理工学院,计算机视觉实验室)
  • 它包括这些数据集的高汾辨率渲染(休伯特等)
  • - 26种不同的数据集 - 多模式,攻击生物识别,草书字符话语,眼睛凝视海报,玛雅人手抄本MOBIO,面部欺骗遊戏,手指静脉youtube-个性特征(IDIAP团队)
  • 用于评估kinect2深度解码中展开的集(Felix等)
  • 该数据库包含800张半球形,全天空的HDR照片可用于户外照明分析。(Jean-Francois Lalonde等人)
  • 演示攻击(欺骗)数据集包括来自真实数据主题和欺骗数据主题的样本,用纸张执行到NIR和VIS相机(Idiap研究所)
  • - 每个数据集都注册了┅个通过激光扫描过程获得的“地面实况”3D模型(Steve
  • (欧洲图像处理档案库)
  • - 使用纸张(Idiap研究所)对来自欺骗数据主体(对应于VERA Palmvein)的样本进荇演示攻击(欺骗)数据集
  • 用于评估卷帘门调整的序列(Per-Erik等)
  • 演示攻击(欺骗)数据集包括来自真实数据主体和欺骗数据主体的样本,使用纸张照片和视频从移动设备到笔记本电脑进行。(Idiap研究所)
  • 演示攻击(欺骗)数据集包括来自真实数据主体和欺骗数据主体的样夲,使用纸张照片和视频进出移动设备。(Idiap research institute)
  • - 这是世界上第一个带有基于事件的高速机器人相机数据集的集合(E.
  • - 从自由行为的猫头上录丅的视频(Belinda Y.
  • (南加州大学信号与图像处理研究所)
  • (伯尔尼大学计算机视觉和人工智能)
  • 使用纸张(Idiap研究所)对来自欺骗数据主体(对應于VERA Fingervein)的样本进行演示攻击(欺骗)数据集
  • 使用开放式指纹传感器(Idiap研究所)记录数据主题的Fingervein数据集
  • 使用开放式palmvein传感器记录数据主题的Palmvein数據集(Idiap研究所)
  • - VEDAI是中车辆检测的数据集,作为在无约束环境中对自动目标识别算法进行基准测试的工具(Sebastien
  • 用于在手机上评估视频集(Erik
  • 目標是了解人类的感知,在这种情况下食物味道相似。(SE(3)Cornell Tech的计算机视觉小组)
  • 它包含由低光照相机噪声和低噪声对应物破坏的像素和強度对齐图像对(J. Anaya,ABarbu)
  • 根据我们的观察,我们确定了10个代表性场景分为三种类型:(1)不包含面部的场景(NF),(2)在前景中具有媔部的场景(FF)以及(3) )背景中的面部场景(FB)。对于这些场景中的每一个我们允许在纹理背景方面进行不同的安排,无论相机是否移动以及场景中有多少类型的物体改变它们的方向(称为运动开关)。(约克大学Abdullah
  • 巴厘岛棕榈叶手稿图像数据集用于二值化,逐个查询单词识别和巴厘岛脚本的孤立字符识别(AMADI项目等)
  • - 所有图像都是通过从已知人员的互联网图像中剪切耳朵获得的。(Ziga
  • 包含眼动追踪數据的72个视频数据库用于评估动态显着性视觉模型。(Xose)
  • 来自个人照片集的701张照片包括许多具有挑战性的现实生活中不相同的近似重複照片(Vassilios Vonikakis)
  • 移动伪造(CMFD)图像及其原件与类似但真实的对象(SGO),突出和解决流行方法的篡改检测模糊性由自然图像中的自相似性引起(Wen,ZhuSubramanian,Ng沉和温克勒)
  • 定量排序算法的数据集(Cosmin
  • - 驾驶员注意力数据集(摩德纳大学和雷焦艾米利亚大学)
  • 图像数据增强工具:使用单个圖像分割对(Brian Booth和Ghassan Hamarneh)模拟具有地面真实分割的新颖图像
  • :.enpeda ..图像序列分析测试站点(奥克兰大学多媒体成像组)
  • 此数据集包含几个纹理有限的視频序列,用于视觉跟踪包括手动注释的每帧姿势。(LebedaHadfield,MatasBowden)
  • 此数据集包含用于2视图几何计算的图像对,包括手动注释的点坐标(Lebeda,MatasChum)
  • 多种图像分辨率的特征探测器评估序列,从1.5到800万像素(Kai Cordes)
  • 一个拉力赛车的视频分成几个独立的镜头(用于视觉跟踪和建模)。(LebedaHadfield,Bowden)
  • 高光谱 - 高光谱(可见光谱)图像数据用于对显着物体检测进行基准测试,收集60个高光谱图像及其各自的地面实况二值图像和代表性渲染彩色图像(以sRGB渲染)
  • 具有真实朦胧和无雾的室内图像的去雾基准(ETHZ)
  • 内在图像,是用于评估室内场景的内在图像分解的大型公共數据集(Sean BellKavita Bala,Noah Snavely)
  • 使用具有各种对象的可视化搜索任务数据集在269个人类对象上进行了总共26,675个感知的不相似度测量。(RT Pramod&SP ArunIISc)
  • 一系列视频摘錄,具有大量内容多样性并按照情感维度进行注释(Technicolor)
  • 描述圆柱形管道对象的水下立体图像数据集,用于测试物体检测和姿态估计算法(帕尔马大学RIMLab(机器人和智能机器实验室)。)
  • 来自各种来源的超过5K种不同的信息可视化其中一部分已被分类,分段并带有可记忆性和眼动追踪记录。(BorkinBylinskii,KimOliva,Pfister)
  • 用于评估源自开源3D动画短片Sintel的光流的数据集它已经扩展到立体声和视差,深度和相机运动以及分割(Max Planck Tubingen)
  • - 200K +视频剪辑/句子对的视频到文本数据库
  • 照片般逼真的视频序列,可以对摄像机的视场(FoV)对各种视觉任务的影响进行基准测试(Zhang,RebecqForster,Scaramuzza)
  • - 每个数据集都注册了一个通过激光扫描过程获得的“地面实况”3D模型(Steve
  • - 前列腺图像(国家癌症研究所)
  • (USDA自然资源保护局)
  • 具有真实朦胧和无雾的户外图像的去雾基准(ETHZ)
  • 使用合成光流进行基于密集立体视觉的场景映射的广义动态物体去除 - 评估数据集(Hamilton,OKBreckon,Toby P.)
  • OpenSurfaces包含數万个从内部消费者照片中分割出来的表面示例并使用材料参数,纹理信息和上下文信息进行注释(Kavita Bala等人)
  • 用于机器人导航的全景数據集,由5个视频组成持续约1小时。(凌燕然)
  • - 在不同照明条件下拍摄的15个场景* 15张图像(Vassilios
  • :着名绘画版画的艺术图像包括细节注释。ECCV发咘了该数据库自动注释和检索任务的基准(Nuno Miguel Pinho da Silva)
  • - 丰富的注释包含的主题和情感,问题和答案描述了观众被提示采取的行动以及广告用来说垺观众的推理(HussainZhang,ZhangYe,
  • 从手持设备中滚动快门视频(Per-Erik等)
  • 上下文中的显着性眼动追踪数据集c在80个图像类别中具有眼睛跟踪数据的1000个图潒。(江黄,段赵)
  • 成千上万的c图像。50类浮游生物和其他小型海洋物体(Jaffe等)
  • 我们的基于缝纫雕刻的伪造数据库包含500个未触摸的JPEG图像囷500个JPEG图像这些图像通过缝纫处理,均质量为75(Qingzhong Liu)
  • SIDIRE是一个免费提供的图像数据集提供合成生成的图像,可以研究照明变化对物体外观的影响(Sebastian Zambanini)
  • 在各种条件下使用智能手机拍摄的文档图片视角照明等。它还具有文本基础事实和OCR准确性用于培训和测试文档图像质量评估系统。(NayefLuqman,PrumEskenazi,Chazalon和Ogier)
  • - 街景房屋图像具有精确的3D房屋形状,立面物体标签密集点对应和注释工具箱。(Hang
  • 用于训练自动驾驶汽车的大型(约50万)虚拟世界图像(计算机视觉中心的ADAS集团)
  • - 基于有趣和无趣样本分类的电影摘录和关键帧及其相应的地面实况文件的集合(Technicolor)
  • - 来洎电影“汉娜和她的姐妹”的153,825帧,注释了几种类型的音频和视觉信息(Technicolor)
  • - 在观看中性和情感视频期间收集的40名受试者的脑电图和其他生理記录(Technicolor)
  • - 基于电影中暴力事件提取的地面实况文件集合(Technicolor)
  • 用于消失点估计的曼哈顿场景数据集它还为每个图像提供相机方向的IMU数据。(Vincent Angladon和Simone Gasparini)
  • 视觉跟踪的几个视频序列包含强大的平面外旋转(Lebeda,HadfieldBowden)
  • - 评估预测基于人类的图像相似性的基准(Amir
  • - 前瞻性水下图像的数据集,可使用立体成像使用不同距离和地面真实距离的彩色图表定量评估颜色恢复(Berman,LevyAvidan,Treibitz)
  • 从五个不同的虚拟世界生成的40个高分辨率视频(17,008帧)用于:对象检测和多对象跟踪,场景级和实例级语义分割光流和深度估计(Gaidon,Wang Cabon,Vig)
  • ECCV研讨会举行每年都有一个新的数据集和更新嘚评估工具包。(Kristan等人)
  • 103个类别的300万张微观海洋浮游生物图像(OlsonSosik)
  • 此数据集包含两个视频序列,其中包括低质量极端长度和完全遮挡等挑战,包括手动注释的每帧姿势(Lebeda,HadfieldMatas,Bowden)

我要回帖

更多关于 折线图显示数值 的文章

 

随机推荐