澳门新葡亰网址机械学习评测系统,计算加快

TensorFlow Serving https://tensorflow.github.io/serving/

学学笔记TF067:TensorFlow Serving、Flod、总计加速,机器学习评测系统,公开数据集,tf067tensorflow

TensorFlow Serving https://tensorflow.github.io/serving/

延续祖宗门户环境灵活、高品质机器学习模型服务种类。适合基于实际多少大规模运转,发生几个模型磨练进度。可用以开发条件、生产环境。

模型生命周期管理。模型先数据磨练,稳步发生早先模型,优化模型。模型多重算法试验,生成模型管理。客户端(Client)向TensorFlow
Severing请求模型,TensorFlow Severing再次来到适当模型给客户端。TensorFlow
Serving、g本田CR-VPC(谷歌(谷歌)集团开源高品质、跨语言LANDPC框架),提供跨语言君越PC接口,差异编程语言都得以访问模型。

TensorFlow Serving代码 https://hithub.com/tensorflow/serving
。源代码Bazel编写翻译安装
https://github.com/tensorflow/serving/blob/master/tensorflow\_serving/g3doc/setup.md
,Docker安装。https://www.tensorflow.org/serving/setup 。结合TensorFlow
Serving,练习好模型,创立Docker镜像,推送到谷歌 Container Registry
https://cloud.google.com/container-registry/docs/
。模型在谷歌云平台(谷歌 Cloud
Platform)运营。Kubernetes成功安排模型服务。Serving 英斯ption Model with
TensorFlow Serving and Kubernetes
https://tensorflow.github.ic/serving/serving\_inception 。谷歌 ML
Engine,全托管TensorFlow平台,练习模型一键转换预测服务。

TensorFlow Flod https://github.com/tensorflow/fold ,《Deep Learning
with Dynamic Computation Graphs》https://openreview.net/pdf?id=ryrGawqex
。深度学习进度,模型磨练多少预处理,不相同结构数据剪裁成相同维度、尺寸,划分成批,进入锻炼流程。静态图模型,缺点,输入数据无法一般预处理,模型针对不一致输入数据建立差异计算图(computation
graph)分别磨炼,没有充足利用处理器、内部存款和储蓄器、高速缓存。
TensorFlow
Fold(今后还出了Eager格局,能够相比较学习),依照不相同结构输入数据建立动态计算图(dynamic
computation),依据各种差别输入数据建立分裂总括图。动态批处理(dynamic
batching)自动组合总结图,实现输入数据里面批处理,批处理单个输入图内分化节点,不相同输入数据间批处理,批处理差异输入图间运算。可插入附加指令在差异批处理操作间移动数据。简化模型陶冶阶段输入数据预处理进度。CPU模型运维速度增进10倍以上,GPU进步100倍。

TensorFlow总括加快。GPU设备,XLA
框架融合OP,分布式总计、参数部分分布到分歧机器,硬件计算,CPU更尖端命令集SSE、AVX,FPGA编写支持TensorFlow总结单元。
CPU加快。pip命令安装,与更宽泛机器包容,TensorFlow暗许仅在x86机器使用SSE4.1
SIMD指令。源代码安装能够赢得最大品质,开启CPU高级指令集帮忙。bazel
构建只能在本人机器运转二进制文件。

bazel build -c opt –copt=-mavx –copt=-mavx2 –copt=-mfma
–copt=-mfpmath=both –copt=-msse4.2 –copt=-cuda -k
//tensorflow/tools/pip_package:build_pip_package
bazel-bin/tensorflow/tools/pip_package/build_pip_package
/tmp/tensorflow_pkg

在/tmp/tensorflow_pkg发生whell文件,再用pip命令安装wheel文件。

TPU 加速、FPGA加速。
谷歌TensorFlow设计专用集成芯片-张量处理单元(Tensor Processing
Unit,TPU)。CPU逻辑运算(if
else)能力很强,总计能力比GPU差,深度学习须要海量总计。GPU有无往不胜浮点计算单元,GPU着色器(shader)对一批数量以相同步调执行同一指令流水。GPU同权且钟周期执行命令数量千级,三千条。CPU同最近钟周期执行命令数据几十级。数据交互能力远超CPU。GPU逻辑运算能力差,流水生产线并行能力(同一时半时辰周期并发执行不一逻辑种类能力)差,须求批数量同步调执行同样逻辑。神经互连网需求广大数据交互能力,CNN卷积、矩阵运算操作,通过数量交互大幅度提升质量。
GPU出厂后架构固定,硬件原生辅助指令固定。如神经网络有GPU不帮助指令,不能直接硬件实现,只可以软件模拟。FPGA加快,开发者在FPGA里编制程序,改变FPGA硬件结构。FPGA种类布局不一,不是冯·诺伊曼结构,是代码描述逻辑电路。只要片上逻辑门、引脚够多,全体输入、运算、输出都在贰个时钟周期内成功。FPGA1个时钟周期执行三遍全体烧好电路,一个模块就一句超复杂“指令”,不一样模块分歧逻辑种类,连串里就一条指令。区别运算单元硬件直连,数据交互、流水生产线并行共存(GPU流水生产线并行能力约0),浮点运算能力不如GPU。适合低顺延预测推理,每批大小较小。
TPU,专用集成都电子通信工程高校路(application specific integrated
circuit,ASIC),硬件逻辑一旦烧写不可再编制程序,专门为TensorFlow做深度学习开发。TPU近来版本不可能全部运作TensorFlow效用,高效预测推理,不涉及练习。

机械学习评测系统。

人脸识别质量指标。
识假质量,是或不是鉴定识别准确。Top-K识别率,给出前K个结果包括正确结果可能率。错误拒绝辨识率(FNI中华V),注册用户被系统错误辩识为别的注册用户比重。错误接受辩识率(FPI福特Explorer),非注册用户被系统识别为某些注册用户比重。
表达品质,验证人脸模型是还是不是丰富好。误识率(False Accept
Rate,FA奥迪Q3),将其余人误作钦命职员可能率。拒识率(False Reject
Rate,F路虎极光奥德赛),将钦赐职员误作其余职员可能率。识别速度,识别一副人脸图像时间、识别1人岁月。注册速度,注册壹位日子。

闲聊机器人品质目的。
答疑正确率、义务达成率、对话回合数、对话时间、系统平均响应时间、错误音信率。评价为主单元,单轮对话。人机对话进度,接二连三经过。http://sanwen.net/a/hkhptbo.html
《中中原人民共和国人工智能学会通信》二零一四年第五卷第2期。聊天机器人,机器人答句和用户问句应该语义一致,语法正确,逻辑正确。机器人答句应用有趣、各个,不是一贯发生安全应对。机器人应该天性表明相同,年龄、身份、出生地基本背景新闻、爱好、语言风险应该亦然,能想象成三个独占鳌头人。

机械翻译评价方法。
BLEU(bilingual evaluation
understudy)方法,二零零二年,IBM沃森研讨宗旨建议。机译语句与人类专业翻译语句越接近越好。下人工评价高度相关。正确句子作参考译文(reference)、正确句子(golden
sentence),测试句子作候选译文(candidate)。适用测试语言质感具有七个参考译文。比较参考译文与候选译文相同片段数量,参考译文再而三出现N元组(N个单词或字)与候选译文N元组相比较,n单位部分(n-gram)相比。计算完全协作N元组个数与参考译文N元组总个数比例。与职责无关。匹配片段数越来越多,候选译文品质越好。
METEO奥迪Q7,不仅须要候选译文在方方面面句子上,在句子分段级别上,都要与参考译文更类似。https://en.wikipedia.org/wiki/METEOR\#Algorithm
。在待评价字符串与参考文符串间创立平面图。待评价翻译各类一元组必须映射到参考翻译三个或0个一元组。选拔映射交叉数据较少的。

常用通用评价目的。
准确率、召回率、F值、ROC、AUC、AP、mAP。
ROC(Receiver Operating Characteristic,受试者工作特色曲线)、AUC(Area
Under roc Curve,曲线上边积),评价分类器目标。ROC曲线横坐标FPHaval(False
positive rate),纵坐标TP景逸SUV(True positive
rate)。ROC曲线越接近左上角,分类器质量越好。AUC,ROC曲线下方面积大小。ROC曲线处于y=x直线上方,AUC值介于0.5~1.0。AUC值越大表示质量越好。专门AUC总计工具
http://mark.goadrich.com/programs/AUC/
AP(average precision,平均准确性)、mAP(mean average
precision,平均准确性凉均)。总结机视觉,分类难点,AP模型分类能力根本目的。只用P(precision
rate, 准确率)和瑞鹰(recall
rate,召回率)评价,组成P奥迪Q5曲线趋势召回率越高准确率越低。AP曲线上边积,等于对召回率做积分。mAP对富有种类取平均,每种类作3回二分拣职务。图像分类诗歌基本用mAP标准。

公然数据集。

图表数据集。
ImageNet http://www.image-net.org/
。世界最大图像识别数据集,14197322张图像,加州理文高校视觉实验室一生助教李飞(Li Fei)飞创造。每年ImageNet大赛是国际总结机视觉一流赛事。
COCO http://mscoco.org/
。微软成立,分割、加字幕标注数据集。目的细分,通过上下文举办分辨,每一种图像包括七个对象对象,超越两千00图像,当先2000000实例,80种对象,种种图像包涵多少个字幕,包蕴一千00个人关键点。
CIFAR(Canada Institude For Advanced Research) https://www.cifar.ca/
。加拿大先进技术切磋院收集。8000万小图片数据集。包括CIFAPRADO-10、CIFACR-V-100三个数据集。CIFAEscort-10,伍仟0张32×32
本田CR-VGB彩色图片,共十个项目,四千0张操练,一千0张测试(交叉验证)。CIFA福睿斯-100,50000张图像,九二十一个品种,种种品种600张图像,500张磨练,100张测试。25个大类,各个图像包蕴小项目、大连串四个标志。

人脸数据集。
AFLW(Annotated Facial Landmarks in the Wild)
http://lrs.icg.tugraz.at/research/aflw/
,从Flickr收集带标注面部图像大规模wyskwgk,各个姿态、表情、光照、种族、性别、年龄因素影响图片,25000万手工业标注人脸图片,每一种人脸标注2三个特征点,大部分绚丽多彩,53%女性,41%男性。十分适合人脸识别、人脸检查和测试、人脸对齐。
LFW(Labeled Faces in the Wild Home) http://vis-www.cs.umass.edu/lfw/
。U.S.A.新罕布什尔大学阿姆斯特分校总括机视觉实验室整理。13233张图纸,57肆18人,409六位唯有一张图片,16捌10个多于一张。用于商讨非受限景况人脸识别难点。人脸外形不安定,面部表情、阅览角度、光照条件、室内室外、遮盖物(口罩、眼镜、帽子)、年龄影响。为文化界评价识别质量标准(benchmark)。
GENKI http://mplab.ucsd.edu
,佛罗里达大学采访。包涵GENKI-Tucson二〇一〇a、GENKI-4K、GENKI-SZSL。GENKI-R二零一零a,11159图纸。GENKI-4K,5000图形,笑与不笑两类,各个图片人脸姿势、头转动标注角度,专用笑脸识别。GENKI-SZSL,3500图像,广泛背景、光照条件、地理地方、个人身份、种族。
VGG Face http://www.robots.ox.ac.uk/~vgg/data/vgg\_face/
。26贰十三个区别人,每一种人一千张图纸,磨炼人脸识别大数据集。
CelebA(Large-scale CelebFaces Atributes,大规模有名的人人脸标注数据集)
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
。10182个名士,202599张名家图像,每张图像40性格情标注。

录像数据集。
YouTube-8M https://research.google.com/youtube8m/
。800万个YouTube摄像U奥德赛L,50万钟头长度录制,带有录像标注。

问答数据集。
MS MARCO(Microsoft Machine Reading Comprehension) http://www.msmarco.org
。微软颁发,10万个难题和答案数据集。创制像人类一样阅读、回答难题系统。基于匿名真实数据塑造。
康奈尔大学电影和电视独白数据集
https://www.cs.cornell.edu/~cristian/Cornell\_Movie-Dialogs\_Corpus.html
。600部好莱坞影片独白。

活动驾乘数据集。
法兰西共和国国家音信与自动化钻探所游客数据集(IN奥迪Q5IA Person Dataset)
http://pascal.inrialpes.fr/data/human/
。作为图像和录像中央直机关立人检查和测试商讨工作有的采集。图片二种格式,一兼有相应注释文件原始图像,二兼有原始图像经过正规处理64×128像素正像。图片分唯有车、唯有人、有车有人、无车无人陆个品类。
KITTI(Karlsruhe Institute of Technology and Toyota Technological
Institute) http://www.cvlibs.net/datasets/kitti/
。车辆数据集,74八十四个教练图片、7520个测试图片。标注车辆系列、是不是截断、遮挡情形、角度值、二维和三维框、地方、旋转角度。

年龄、性别数据集。
Adience 数据集 http://www.openu.ac.il/home/hassner/Adience/data.html
。来源Flickr相册。用户用智能手提式无线电话机设备拍片,2284种类,26580张图片。保留光照、姿势、噪声影响。性别、年龄估计、人脸检查和测试。

参考资料:
《TensorFlow技术解析与实战》

迎接推荐东京机械学习工作机遇,笔者的微信:qingxingfengzi

http://www.bkjia.com/Pythonjc/1233241.htmlwww.bkjia.comtruehttp://www.bkjia.com/Pythonjc/1233241.htmlTechArticle学习笔记TF067:TensorFlow
Serving、Flod、计算加快,机器学习评测系统,公开数据集,tf067tensorflow
TensorFlow Serving https://tensorflow.github.io/serving/ 。…

生产条件灵活、高质量机器学习模型服务系列。适合基于实际数目大规模运转,发生多个模型训练进度。可用来支付环境、生产环境。

模型生命周期管理。模型先数据陶冶,稳步产生起首进模范型,优化模型。模型多重算法试验,生成模型管理。客户端(Client)向TensorFlow
Severing请求模型,TensorFlow Severing再次来到适当模型给客户端。TensorFlow
Serving、g奥迪Q5PC(谷歌(谷歌(Google))公司开源高质量、跨语言安德拉PC框架),提供跨语言ENVISIONPC接口,不相同编制程序语言都得以访问模型。

TensorFlow Serving代码 https://hithub.com/tensorflow/serving
。源代码Bazel编写翻译安装
https://github.com/tensorflow/serving/blob/master/tensorflow\_serving/g3doc/setup.md
,Docker安装。https://www.tensorflow.org/serving/setup 。结合TensorFlow
Serving,磨练好模型,创建Docker镜像,推送到谷歌 Container Registry
https://cloud.google.com/container-registry/docs/
。模型在谷歌云平台(谷歌 Cloud
Platform)运维。Kubernetes成功布署模型服务。Serving 英斯ption Model with
TensorFlow Serving and Kubernetes
https://tensorflow.github.ic/serving/serving\_inception 。谷歌 ML
Engine,全托管TensorFlow平台,演习模型一键转换预测服务。

TensorFlow Flod https://github.com/tensorflow/fold ,《Deep Learning
with Dynamic Computation Graphs》https://openreview.net/pdf?id=ryrGawqex
。深度学习进程,模型陶冶多少预处理,分化结构数据剪裁成相同维度、尺寸,划分成批,进入磨炼流程。静态图模型,缺点,输入数据无法一般预处理,模型针对分化输入数据建立差别总结图(computation
graph)分别磨炼,没有充足利用处理器、内部存款和储蓄器、高速缓存。
TensorFlow
Fold(将来还出了Eager情势,可以对照学习),依照分歧结构输入数据建立动态总计图(dynamic
computation),根据各类不相同输入数据建立不一样总计图。动态批处理(dynamic
batching)自动组合总结图,完毕输入数据之中批处理,批处理单个输入图内差别节点,不相同输入数据间批处理,批处理不一样输入图间运算。可插入附加指令在分化批处理操作间移动数据。简化模型磨练阶段输入数据预处理进度。CPU模型运营速度增加10倍以上,GPU升高100倍。

TensorFlow总计加快。GPU设备,XLA
框架融合OP,分布式总计、参数部分分布到分裂机器,硬件总括,CPU更尖端命令集SSE、AVX,FPGA编写帮衬TensorFlow总括单元。
CPU加快。pip命令安装,与更广阔机器包容,TensorFlow私下认可仅在x86机器使用SSE4.1
SIMD指令。源代码安装能够获得最大品质,开启CPU高级指令集扶助。bazel
营造只能在投机机器运营二进制文件。

澳门新葡亰网址,bazel build -c opt –copt=-mavx –copt=-mavx2 –copt=-mfma
–copt=-mfpmath=both –copt=-msse4.2 –copt=-cuda -k
//tensorflow/tools/pip_package:build_pip_package
bazel-bin/tensorflow/tools/pip_package/build_pip_package
/tmp/tensorflow_pkg

在/tmp/tensorflow_pkg发生whell文件,再用pip命令安装wheel文件。

TPU 加速、FPGA加速。
谷歌(谷歌(Google))TensorFlow设计专用集成芯片-张量处理单元(Tensor Processing
Unit,TPU)。CPU逻辑运算(if
else)能力很强,总计能力比GPU差,深度学习供给海量总结。GPU有无往不胜浮点总计单元,GPU着色器(shader)对一批数量以平等步调执行同一指令流水。GPU同权且钟周期执行命令数量千级,三千条。CPU同暂时钟周期执行命令数据几十级。数据交互能力远超CPU。GPU逻辑运算能力差,流水生产线并行能力(同暂且钟周期并发执行不一逻辑体系能力)差,要求批数量同步调执行同样逻辑。神经网络供给广大数据交互能力,CNN卷积、矩阵运算操作,通过数量交互大幅升高品质。
GPU出厂后架构固定,硬件原生帮助指令固定。如神经互联网有GPU不支持指令,不能够直接硬件完毕,只可以软件模拟。FPGA加快,开发者在FPGA里编制程序,改变FPGA硬件结构。FPGA类别布局分裂,不是冯·诺伊曼结构,是代码描述逻辑电路。只要片上逻辑门、引脚够多,全体输入、运算、输出都在二个时钟周期内成功。FPGA3个时钟周期执行三遍全部烧好电路,3个模块就一句超复杂“指令”,分化模块分化逻辑种类,连串里就一条指令。差别运算单元硬件直连,数据交互、流水生产线并行共存(GPU流水生产线并行能力约0),浮点运算能力不如GPU。适合低顺延预测推理,每批大小较小。
TPU,专用集成都电子通信工程高校路(application specific integrated
circuit,ASIC),硬件逻辑一旦烧写不可再编制程序,专门为TensorFlow做深度学习开发。TPU近年来版本无法完整运作TensorFlow作用,高效预测推理,不关乎练习。

机器学习评测系统。

人脸识别质量指标。
辨认质量,是还是不是鉴定识别准确。Top-K识别率,给出前K个结果包含正确结果可能率。错误拒绝辨识率(FNI安德拉),注册用户被系统错误辩识为别的注册用户比例。错误接受辩识率(FPI瑞虎),非注册用户被系统识别为有个别注册用户比例。
证实品质,验证人脸模型是或不是丰裕好。误识率(False Accept
Rate,FAKoleos),将别的人误作钦赐职员可能率。拒识率(False Reject
Rate,F福睿斯Rubicon),将钦命人士误作其余人士概率。识别速度,识别一副人脸图像时间、识别一个人岁月。注册速度,注册一位日子。

闲聊机器人质量指标。
解惑正确率、任务达成率、对话回合数、对话时间、系统平均响应时间、错误讯利息率。评价为主单元,单轮对话。人机对话进程,三番五次经过。http://sanwen.net/a/hkhptbo.html
《中国人工智能学会报纸发表》2014年第五卷第贰期。聊天机器人,机器人答句和用户问句应该语义一致,语法正确,逻辑正确。机器人答句应用有趣、二种,不是直接发生安全应对。机器人应该性子表明相同,年龄、身份、出生地基本背景音信、爱好、语言风险应该一致,能设想成多个博学强记人。

机械翻译评价格局。
BLEU(bilingual evaluation
understudy)方法,2003年,IBM沃森研商宗旨指出。机译语句与人类专业翻译语句越接近越好。下人工评价中度相关。正确句子作参考译文(reference)、正确句子(golden
sentence),测试句子作候选译文(candidate)。适用测试语言质感具有多个参考译文。比较参考译文与候选译文相同片段数量,参考译文延续出现N元组(N个单词或字)与候选译文N元组相比较,n单位有的(n-gram)相比较。总括完全合作N元组个数与参考译文N元组总个数比例。与岗位非亲非故。匹配片段数越来越多,候选译文质量越好。
METEOOdyssey,不仅须要候选译文在整整句子上,在句子分段级别上,都要与参考译文更就像。https://en.wikipedia.org/wiki/METEOR\#Algorithm
。在待评价字符串与参考文符串间创制平面图。待评价翻译各类一元组必须映射到参考翻译3个或0个一元组。选取映射交叉数据较少的。

常用通用评价目标。
准确率、召回率、F值、ROC、AUC、AP、mAP。
ROC(Receiver Operating Characteristic,受试者工作特点曲线)、AUC(Area
Under roc Curve,曲线下面积),评价分类器目标。ROC曲线横坐标FP福特Explorer(False
positive rate),纵坐标TP本田UR-V(True positive
rate)。ROC曲线越接近左上角,分类器质量越好。AUC,ROC曲线下方面积大小。ROC曲线处于y=x直线上方,AUC值介于0.5~1.0。AUC值越大表示品质越好。专门AUC总计工具
http://mark.goadrich.com/programs/AUC/
AP(average precision,平均准确性)、mAP(mean average
precision,平均准确性温均)。总计机视觉,分类难题,AP模型分类能力首要目标。只用P(precision
rate, 准确率)和Tiggo(recall
rate,召回率)评价,组成PCRUISER曲线趋势召回率越高准确率越低。AP曲线上面积,等于对召回率做积分。mAP对负有项目取平均,每一个类作2回二分拣职分。图像分类故事集基本用mAP标准。

精晓数据集。

图形数据集。
ImageNet http://www.image-net.org/
。世界最大图像识别数据集,14197222张图像,南洋理工州立高校视觉实验室生平教师李飞(英文名:lǐ fēi)飞创建。每年ImageNet大赛是国际总结机视觉一级赛事。
COCO http://mscoco.org/
。微软创始,分割、加字幕标注数据集。指标细分,通过上下文实行甄别,各个图像包罗多个对象对象,超过300000图像,当先两千000实例,80种对象,每一种图像包罗5个字幕,包罗一千00个人关键点。
CIFAR(Canada Institude For Advanced Research) https://www.cifar.ca/
。加拿大先进技术商量院采集。7000万小图片数据集。包括CIFA哈弗-10、CIFA奥德赛-100多个数据集。CIFALacrosse-10,五千0张32×32
SportageGB彩色图片,共11个品种,陆仟0张陶冶,10000张测试(交叉验证)。CIFACRUISER-100,四千0张图像,九1七个体系,各个门类600张图像,500张演习,100张测试。十多个大类,各样图像包罗小项目、大类型七个标志。

人脸数据集。
AFLW(Annotated Facial Landmarks in the Wild)
http://lrs.icg.tugraz.at/research/aflw/
,从Flickr收集带标注面部图像大规模wyskwgk,各个姿态、表情、光照、种族、性别、年龄因素影响图片,2四千万手工业标注人脸图片,每一种人脸标注二十二个特征点,超越四分之二花团锦簇,三分之二女性,41%男性。卓殊适合人脸识别、人脸检查和测试、人脸对齐。
LFW(Labeled Faces in the Wild Home) http://vis-www.cs.umass.edu/lfw/
。美利坚合众国亚拉巴马大学阿姆斯特分校计算机视觉实验室整理。13233张图片,57四十几人,409八位唯有一张图纸,1676个多于一张。用于钻探非受限意况人脸识别难题。人脸外形不稳定,面部表情、观看角度、光照条件、室内室外、遮盖物(口罩、眼镜、帽子)、年龄影响。为学界评价识别质量标准(benchmark)。
GENKI http://mplab.ucsd.edu
,爱荷华大学搜集。包蕴GENKI-福特Explorer2008a、GENKI-4K、GENKI-SZSL。GENKI-奥迪Q3二〇〇八a,11159图片。GENKI-4K,伍仟图纸,笑与不笑两类,每一种图片人脸姿势、头转动标注角度,专用笑脸识别。GENKI-SZSL,3500图像,广泛背景、光照条件、地理地点、个人身份、种族。
VGG Face http://www.robots.ox.ac.uk/~vgg/data/vgg\_face/
。26二十多少个例别人,每种人一千张图片,演练人脸识别大数量集。
CelebA(Large-scale CelebFaces Atributes,大规模有名气的人人脸标注数据集)
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
。101七二十一个名家,202599张有名气的人图像,每张图像37个属性标注。

摄像数据集。
YouTube-8M https://research.google.com/youtube8m/
。800万个YouTube录制U奥迪Q3L,50万刻钟长度录制,带有摄像标注。

问答数据集。
MS MARCO(Microsoft Machine Reading Comprehension) http://www.msmarco.org
。微软发表,10万个难题和答案数据集。创立像人类一样阅读、回答难题系统。基于匿名真实数据创设。
康奈尔高校影视旁白数据集
https://www.cs.cornell.edu/~cristian/Cornell\_Movie-Dialogs\_Corpus.html
。600部好莱坞影片独白。

机关驾乘数据集。
法兰西国家新闻与自动化商讨所客人数据集(IN揽胜极光IA Person Dataset)
http://pascal.inrialpes.fr/data/human/
。作为图像和录制中央直机关立人检查和测试商量工作有的搜集。图片三种格式,一存有相应注释文件原始图像,二兼有原始图像经过正规处理64×128像素正像。图片分唯有车、唯有人、有车有人、无车无人六个体系。
KITTI(Karlsruhe Institute of Technology and Toyota Technological
Institute) http://www.cvlibs.net/datasets/kitti/
。车辆数据集,74捌十二个教练图片、751玖个测试图片。标注车辆档次、是或不是截断、遮挡情状、角度值、二维和三维框、地方、旋转角度。

年纪、性别数据集。
Adience 数据集 http://www.openu.ac.il/home/hassner/Adience/data.html
。来源Flickr相册。用户用智能手提式有线电话机设备拍录,2284品种,26580张图纸。保留光照、姿势、噪声影响。性别、年龄估计、人脸检查和测试。

参考资料:
《TensorFlow技术解析与实战》

迎接推荐新加坡机械学习工作机会,小编的微信:qingxingfengzi

相关文章

Leave a Comment.