本文共 648 字,大约阅读时间需要 2 分钟。
(1)Stride=1
实验证明,将ResNet的最后一个block的stride从2改为1,增大feature map,增加了像素的分辨率,特征会更加鲁棒,性能会得到一定程度的提升。
(2)针对业务场景使用合适的增强(augmentation)
调参:调整学习率、batch、训练周期等。
跳舞场景,可以添加旋转的augmentation。
遮挡场景,加一批半身的augmentation,把一些全身的图片刻意地截取一半训练。
(3)Random Erase可以增强泛化能力
随即擦除,防止过拟合,强迫关注更多地特征。
(4)用GAN造图配合label smooth可以扩充数据
解决数据稀缺的问题,有助于提高模型的泛化能力。GAN要配合label smooth,因为GAN造图即使再真实,也不能保存全部的ID信息,label不能像[0,0,1,0…]这样的hard,可以使用label smooth平滑一下[0.02,0.02,0.9,…]
(5)增大batchsize可以提高TriHard损失的效率
TriHard就是在一个Batch里面挑选一个最难的样本,计算Triplet loss。那么batchsize越大,可选的样本越多,挑选的样本也就越难,网络的泛化能力越强。
对于ReID问题,正常一张卡最多放128张图。
(6)Label noise和长尾效应是普遍存在的
label noise就是标注的噪声,长尾效应(82定律)就是有的ID图片量很多,有的ID图片量很少,数据不平衡。
转载地址:http://dknq.baihongyu.com/