|
在主動駕驶范畴,現有基於深度進修的模子重要依靠於大量的人工標注数据。但是,昂扬的標注本錢使得今朝带預防癌症水果,標注的主動駕驶数据集的图片数目只能保持在一個较小的量级。比年来,半监視及自监視進修的长足成长開导業界從海量無监視数据中举行進修,但現阶段主動駕驶范畴仍缺少一個基於大量無標签数据與少许有標签数据组成的可用於同時评价分歧半/自监視法子的基准数据集。
是以,华為诺亚方舟實行室结合中山大學公布了新一代半/自监視的2D基准数据集SODA10M,其重要包括從32個都會收集的一万万张多样性丰硕的無標签門路場景图片和两万张带標签图片。SODA10M 将同時被用於举行 ICCV 2021 SSLAD Challenge。该数据集的公布旨在晋升主動駕驶范畴鑽研职員對付半监視、自监視相干標的目的上的鑽研,配合促成主動駕驶生态的搭建。
SODA10M是經由過程眾包分發模式收集的高質量(1080P+)行車場景数据集,此中相干隐私信息(車牌及人脸)均已依照相治療椎間盤突出,干尺度举行模胡化處置。SODA10M重要分為两個部門,别離包括一万万张無標签图片和两万张有標签图片(標注了6種重要的人車場景種别,PedestrianTDS水質檢測儀,/Cyclist/Car/Truck/Tram/Tricycle)。起首,万万级無標签图片的数据特征阐發去狐臭噴霧,如图一所示。 |
|