Glint360K | 使用指南

news/2024/12/2 23:02:07/

首先恭喜格林深瞳3月18日在科创板成功上市

一、介绍

        Glint360K数据集包含36万类别的1800万张图像,不论是类别数还是图像数,相比MS1MV2数据集都有大幅提升。

这是一个号称全球最大最干净的人脸数据集,

下载地址(我自己上传的):链接:https://pan.baidu.com/s/1K3UDER9u352oNIyph-FI1w?pwd=3o3i 
提取码:3o3i 
--来自百度网盘超级会员V5的分享

二、解压和解码

下载好了之后先解压

cat glint360k_* | tar -xzvf -

然后它是.rec格式数据,下面我们将它解码成图片

先简单配置一个小环境:

conda create -n glint
source activate glint
pip install mxnet -i https://pypi.douban.com/simple
pip install opencv-python -i https://pypi.douban.com/simple

编写处理代码:

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
import argparse
import os
import cv2
import mxnet as mx
def main(args):include_datasets = args.include.split(',')rec_list = []for ds in include_datasets:path_imgrec = os.path.join(ds, 'train.rec')path_imgidx = os.path.join(ds, 'train.idx')imgrec = mx.recordio.MXIndexedRecordIO(path_imgidx, path_imgrec, 'r')  # pylint: disable=redefined-variable-typerec_list.append(imgrec)if not os.path.exists(args.output):os.makedirs(args.output)imgid = 0for ds_id in range(len(rec_list)):imgrec = rec_list[ds_id]s = imgrec.read_idx(0)header, _ = mx.recordio.unpack(s)assert header.flag > 0seq_identity = range(int(header.label[0]), int(header.label[1]))for identity in seq_identity:s = imgrec.read_idx(identity)header, _ = mx.recordio.unpack(s)for _idx in range(int(header.label[0]), int(header.label[1])):s = imgrec.read_idx(_idx)_header, _img = mx.recordio.unpack(s)label = int(_header.label[0])class_path = os.path.join(args.output, "id_%d" % label)if not os.path.exists(class_path):os.makedirs(class_path)_img = mx.image.imdecode(_img).asnumpy()[:, :, ::-1]  # to bgrimage_path = os.path.join(class_path, "%d_%d.jpg" % (label, imgid))cv2.imwrite(image_path, _img)imgid += 1if imgid % 10000 == 0:print(imgid)
if __name__ == '__main__':parser = argparse.ArgumentParser(description='do dataset merge')# generalparser.add_argument('--include', default='', type=str, help='')parser.add_argument('--output', default='', type=str, help='')args = parser.parse_args()main(args)

执行:

python process.py --include=/glint360k/glint360k --output=/glint360k/output

 会像这样生成每个id一个文件夹,每个文件夹里面都是同一个人的照片


http://www.ppmy.cn/news/272656.html

相关文章

停车还能360全方位影像_2020款新途锐锐享版上市,智能泊车360全景影像加量不加价...

前一阵子和大家说过20款途锐即将上市并会有很多新的升级项目,而最近20款途锐3.0锐享版已经开始打响头炮,官方报价71.8W,比3.0锐锋版价位略高,比百万纪念版相差5W,高配锐智版相差10W左右。 今天我们就来看看这款新车途锐…

奇虎360回归A股要如何上市?多家上市公司否认360借壳

奇虎360私有化回归A股将选择借壳哪家上市公司?此事引发了诸多投资者的猜测,但是,不少上市公司都对此予以否认。中葡股份7月29日晚间公告,经向公司控股股东中信国安集团有限公司函证确认,截至目前,公司控股股…

周鸿祎雷军口水战 360特供机上市将考验小米

最近,周鸿祎与雷军微博口水战已经持续快一个月了,整个过程,对360呈现利好趋势,对于360来说,目前特供机还未上市,但一开始便把特供机放在与小米平起平坐的位置。同时,由于口水战的持久性&#xf…

转载:360上市:一个昂贵的免费故事

30日晚,北京豪华会所九朝会,IT记者们受360公司之邀参与晚会,等待身在大洋彼岸的周鸿祎的视频采访。这些记者当年都收到《免费》这本书,赠书者为周鸿祎。当时没有人相信周鸿祎“免费可赚钱、赚大钱”的故事,有记者还拒绝…

今日 | 360上市,老周说了三句话 (内附一张图)

文章经授权转载自浅黑科技(ID:qianheikeji) 1 2018年2月28日,上海证交所。 红色的屏幕,红色的代码,红色的座椅,每人一条红色围巾。周鸿祎几乎是全场唯一一个没有穿西装的人。他穿了一身红衣&…

9本新书上市

你知道吗?思念的模样。 小时候, 思念是二维带花边的小纸片, 它总被丢在街边绿色的圆柱桶里。 后来, 思念变成了一个三维立体的小匣子, 带着长长的线被安放在千家万户的角落里。 再后来, 思念成了几个可随身…

奇虎360上市:投资者继续看好互联网行业

3月30日,奇虎360在美国纽交所上市,开盘价为27美元,较14.50美元的发行价大涨86.2%。收盘时,360股价报34美元,市值达39.57亿美元,在美国和香港上市的中国概念股中排名第9。其创始人周鸿祎身家达到了7.3亿美元…

360和腾讯QQ的那场战争!

阅读本文大概需要10分钟。 这是我的10年程序人生的第五篇,记录一场惊心动魄的商业大战:3Q大战。 在中国互联网历史上,3Q大战是标志性的一战,堪称互联网第一次世界大战。 彼时洋哥还是一个工作不到两年的基层员工,有幸…