A ConvNet for the 2020s
abs:
github:
Constructed entirely from standard ConvNet modules, achieving 87.8% ImageNet top-1 accuracy and outperforming Swin Transformers on COCO detection and ADE20K segmentation
うおおお!MobileNetの新作!ちゃんとGoogle作!
Inverted Bottleneck内のdepthwise convの有無を最適化するUIB、K/Vをhead間で共有するMQA、Spatial Reduction Attentionの利用、NASも頑張った
MobileNetV4 - Universal Models for the Mobile Ecosystem
久しぶりに深層学習モデルの高速化について社内勉強会で発表しました。FLOPs vs. 精度は良いけど実際の速度が遅そうなVision Transformerも最近はモバイルでも早いモデルが存在するよう。HybridでほぼCNNな感じだけど
MobileOne (CNN) vs. EfficientFormerV2 (ViT) ファイッ
物体検出サーベイ
Object Detection in 20 Years: A Survey submitted to PAMI
Deep Learning for Generic Object Detection: A Survey submitted to IJCV
Recent Advances in Deep Learning for Object Detection;
ファイッ