ShaoZi's Blog

Hello World!

基于mmdetection检测模型学习(2):关于NMS

mmdetection

总览 在Faster-RCNN的配置文件中,关于nms的设置放在model training and testing settings下,分别作用于rpn和rcnn部分网络的输出,在rpn部分设置的参数包括: nms_across_levels=False, nms_pre=2000, nms_post=1000, nms_thr=0.7, 在rcnn部分设置的参数包括: scor...

基于mmdetection检测模型学习(1)

mmdetection

前言 最近半年开始频繁的接触工业质检相关的项目,大多数都要用到检测技术。基于之前的技术栈,起初是在detectron2框架下进行算法的训练。随着项目的增多,发现mmdetection的可玩性更高。所以逐渐迁移到这个平台。接近年底,很多项目都接近尾期,闲下来有时间好好研究一下mmdetection的细节。受到mmdetection-mini的启发,决定将我学习的过程记录下来,所以开了一个新的...

PyAV库使用介绍

PyAV

目前使用最广泛的视频编解码库为FFmepg,虽然该库有Python的封装ffmpeg-python,但是该封装功能简单,只能替代在python中调用命令行工具罢了。PyAV同样是FFmpeg封装,不过功能更为强大,能够灵活的编解码视频和音频,并且支持Python常用的数据格式(如numpy)。由于PyAV在ffmpeg的基础上进行开发,所以并不会提升编解码的效率。但是能够方便Python的开...

PySlowFast平台环境搭建及使用

PySlowFast

1.环境搭建 SlowFast 平台是Facebook近期开源的视频识别平台。这里对该平台的环境搭建和使用进行记录和总结。 由于平台依赖Detectron2,Detectron2需要Pytorch 1.3以上版本,Pytorch1.3以上版本需要CUDA10.1及以上版本,所以在CUDA10.0及以下的机器上无法使用,建议升级CUDA及对应的显卡驱动。 如果之前并没有使用过FFmpeg...

服饰搭配推荐研究综述

Paper reading

由于近期在优化服饰搭配算法时碰到了很多难以回答的问题,所以收集了一些最近公开的改领域的论文,对其中的相关理论,算法和实验进行了整理,希望能够回答一些当前存在的疑问,并指导后续的工作。 服饰搭配领域的问题及难点 当前相关研究主要围绕三个问题展开: 这一套服饰组合是否是相搭的 如何生成一套相搭的服饰 为什么这套服饰相搭 这些问题的核心是: 如何表示不同的时尚服饰 ...

导播规则

高清:视频分辨率1080p, 帧率25hz 超高清:视频分辨率2160p,帧率50hz(我们拿到的会被压缩?) 摄像机位置: 比赛开始前确定各路相机的配置参数,根据镜头及位置判断相机作用 临近开场前: 走流程 开场后: 通常状态:主机位 等待开场 主客队教练员特写,裁判特写,主客队明星球员特写,守门员特写,足球特写,回到主机位 场面平淡,长时间主机位,双方焦灼 明星球员接球时,或特写角...

CVPR2019 Metric Learning、Embedding、Retrieval 相关论文阅读及整理

Paper reading

Paper List 这里从CVPR2019收录的论文中挑选了出了标准的度量学习相关的论文,相近领域以及一些特定应用场景的论文被剔除了。总共有十四篇。 A Theoretically Sound Upper Bound on the Triplet Loss for Improving the Efficiency of Deep Distance Metric Learning ...

Apex混合精度加速

Pytorch

为了帮助提高Pytorch的训练效率,英伟达提供了混合精度训练工具Apex。号称能够在不降低性能的情况下,将模型训练的速度提升2-4倍,训练显存消耗减少为之前的一半。该项目开源于:https://github.com/NVIDIA/apex ,文档地址是:https://nvidia.github.io/apex/index.html 该工具提供了三个功能,amp、parallel和nor...

Pytorch分布式训练

Pytorch

背景:需要在短时间内完成大数据量的训练,处理较大的Batch_size 基于以上的需求,有了使用Pytorch进行分布式计算的需求。百度并且Google了一下,发现可供参考的资料并不多。Pytorch的官方文档只给了一个在本地模拟的demo,而且似乎没有用到GPU这里,个人表示写的并不清楚。 其他的参考资料在这篇知乎文章中有较为详细的总结pytorch分布式计算配置,但在作者明显没有做完...

Torchvision扩充:基于Opencv的图像增强

Pytorch

原始的torchvision工具包只支持PIL图像的各种增强操作,模型转换为caffe后,输入图像存在偏差,导致模型性能下降。为了消除该问题,需要实现一套基于opencv的图像增强工具,本文在原先torchvision.transform的基础上进行修改,主要涉及两个文件:functional.py和transforms.py,测试通过的工具包会在文末的地址开源。 functional.p...