Computer vision 논문 & 코드리뷰(12)
-
DeepSORT(SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC)
Abstract MOT에서 간단하고 효과적인 알고리즘이었던 SORT의 성능향상을 위해 appearance information을 통합 더 긴 기간동안의 occlusion에도 객체 트래킹이 가능함 효과적으로 identity(ID라 하겠다) switch를 줄임 SORT의 방향과 같이 계산적으로 복잡한 과정은 offline pretrain과정에 치우침 offline pretrain단계에서는 대규모 person re-identification dataset에서 deep association metric을 학습한다. online 적용에서는 visual appearance space에서 nearest neighbor queries를 사용해 measurement-to-track association을 구축 => 즉,..
2021.10.01 -
SORT(Simple Online And Realtime Tracking)
오랜만에 논문리뷰 입니당.... https://arxiv.org/abs/1602.00763 Simple Online and Realtime Tracking This paper explores a pragmatic approach to multiple object tracking where the main focus is to associate objects efficiently for online and realtime applications. To this end, detection quality is identified as a key factor influencing tracking performanc arxiv.org (참고하면 좋은 글) kalman filter - https://brunch.c..
2021.09.28 -
A Style-Based Generator Architecture for Generative Adversarial Networks:StyleGAN
Abstract •Style transfer lecture에서 차용하여 GAN을 위한 새로운 Generator 아키텍쳐 제안 • 새로운 아키텍쳐는 1. 자동으로 학습됨 2. 높은 수준의 특징들(자세, 정체성 등)이 unsupervised seperation됨 • 생성된 영상의 stochastic variation(주근깨, 머리카락 등)으로 scale-specific control of the synthesis가 가능하게 한다. • interpolation quality and disentanglement대한 정량적 표현을 위해 새로운 두가지 제안 1. perceptual path length 2. Linear separability • 다양한 고품질의 새로운 인간 얼굴 데이터셋 소개 - FFHQ data..
2021.07.15 -
Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks (CycleGAN)
Abstract Image-to-Image translation은 vision과 graphics 문제 중 하나. 목적은 input 이미지와 output이미지를 mapping하는 것을 학습하는 것. 정렬된 이미지 쌍의 training set을 사용하여. 많은 tasks에서 paired training data는 사용 불가 paired examples없이 X→Y 변환하는 것을 배우는 접근법을 제시 mapping G: X→Y 매핑을 배우는 것이 목표. G(x)의 분포가 Y와 구분 불가능 하도록 → adversarial loss를 이용하여 왜? 이 mapping은 매우 under-contrained(? 제약이 심하다?)하기 때문에 우리는 이것을 inverse mapping F: Y→X로 짝짓고 cycle con..
2021.06.10 -
SSD: Single Shot MultiBox Detector
새로운 논문 스터디가 시작 되었다 :) 논문 읽기 - 코드리뷰 - 구현까지 화이팅 :) Abstract single deep neural network로 이미지에서 object detection 수행하는 방법 제시 bounding boxes의 output space를 feature map 위치 당 다른 aspect ratio 와 scale을 가진 default boxes 세트로 이산화한다. prediction time에 network는 각 default box에 각 object의 존재에 대한 점수를 생성한다. 그리고 object shape와 더 잘 일치하도록 box에 대한 조정을 한다. network는 여러 feature map의 예측을 다른 해상도와 결합해 다양한 크기의 개체를 자연스럽게 처리한다. S..
2021.05.05 -
SpineNet: Learning Scale-Permuted Backbone for Recognition and Localization(CVPR 2020)
Google Research, Brain Team 에서 발행한 논문이네요. - Abstract CNN은 일반적으로 input image를 해상도가 감소하도록 encoding합니다. -> 분류 작업에는 적합 but 인식 +localization (object detection)에는 적합 x 이 문제 해결 위해 encoder-decoder 아케텍쳐는 분류 위해 설계된 backbone model에 decoder network 를 적용 scale-decreased backbone때문에 encoder-decoder 아키텍쳐는 strong multi-scale features를 생성하는데 효과적이지 않음. -- > SpineNet : a backbone with scale-permuted intermediate f..
2021.04.13