본문 바로가기

전체 글208

[논문 리뷰] Video Person Re-ID: Fantastic Techniques and Where to Find Them Abstract 재식별은 상업적, 학술적 가치가 있음 기존 solution은 attention기반 모델임제안한 손실 함수는 bag-of-tric에 적용됨 본 논문에서는 attention기반에 top of a temporal attention-based가 추가된 CL loss 활용 Introduction Person Re-IDentification의 목표 똑같은 사람을 다른 영상 속에서 찾는 것 갤러리 셋 안의 똑같은 사람을 쿼리 비디오에서 찾는 것 Methodology Baseline(Base Temporal Attention) Revisiting temporal modeling for video-based person reid 데이터셋 ImageNet을 적용 ResNet-50으로 사전 학습 - 비디오 .. 2023. 3. 20.

YOLO version(1~6)별 정리 YOLO v1(2016.05) Anchor Box를 사용하지 않음 Anchor Box - object detecion 을 위해 크기, 비율 미리 정해놓은 Bbox Cell 단위로 Bounding Box Regressor 과정을 통해 Box를 찾음 Localization Error로 인해 성능이 낮다 각 Grid Cell에 대해 2개의 Bounding Box를 찾음 Classification은 한 개에 대해서만 수행 따라서 겹치는 Object는 Detection하기 어려움 작은 물체에 대해서는 성능이 나쁨 YOLO v2(2017.12) YOLO v2는 Classification 문제에 비해 Object Detection 문제는 예측 가능한 Class의 개수가 매우 적음을 지적 이를 해결하기 위한 방법을 제.. 2023. 3. 16.

[논문 리뷰]On the Unreasonable Effectiveness of Centroids in Image Retrieval Abstract 재식별 task SOTA 제안 방법의 전체 architecture 기존 이미지 검색, 재식별 → 갤러리 내 쿼리에서 유사 이미지 검색하는 방식(metric learning: input data간 거리 학습)을 주로 사용 Hard negative sampling(mining) 클래스 불균형 문제 해결을 위한 방법 hard negative(negative인데 postive라고 잘못 예측한 데이터)를 모아 원본 데이터셋에 추가하여 재학습하면 false positive 오류에 강해짐 문제점: 배치의 모든 샘플 사이의 거리 계산하는 방법으로 cost가 커짐 문제점: tiplet loss와 사용할 경우 tiplet loss의 특성 point-to-point loss 때문에 노이즈 레이블 발생하기 쉬.. 2023. 3. 14.

[논문 리뷰] InternImage : Exploring Large-Scale Vision Foundation Models with Deformable Convolutions(2022) [논문 리뷰] 최근 대세인 VIT가 아닌 CNN을 활용한 연구로서, object detection, segmentation 부분 SOTA를 달성하였다. Abstract 최근 몇 년간 large-scale vit의 비약적 성장이 이루어짐 CNN기반 large-scale 모델은 여전히 초기상태에 머무름 InternImage라 부르는 새로운 방법 제안(기존 모델들과의 차이점) ViT처럼 매개변수 및 훈련 데이터 증가 최근 CNN의 초점 large dense kernels와 다름 변형 가능한 컨볼루션을 핵심 연산자로 사용 detection, segmentation과 같은 다운스트림 작업에 필요한 큰 effective receptive field를 가짐 input 및 task information에 따라 조정되는 adaptiv.. 2023. 3. 13.

[논문 리뷰]A Method for Detection of Small Moving Objects inUAV Videos goal: 표준 비디오 카메라가 장착된 무인 항공기를 이용하여 녹화된 비디오에서 작은 움직이는 물체(곤충)를 감지하는 방법 제안 contribution: UAV 사용 캡처한 비디오에서 작은 움직이는 물체 감지를 위한 모양 및 동작 정보를 모두 효과적으로 사용 CNN 기반 탐지기 훈련을 위한 합성 데이터 사용. 합성 교육 비디오를 생성하는 데 사용되는 매개변수의 영향 평가 및 검출기 성능에 대한 기타 설계 선택. 합성 데이터에 대한 검출기 성능이 실제 비디오 시퀀스에 대한 성능의 프록시로 사용될 수 있는지 여부를 조사 abstract 연구의 어려운 점 컨벌루션 신경망(CNN)은 대상 물체가 작을 때(예: 10 x 10 픽셀 미만) 얻은 결과는 좋지 않음 작은 물체에 독특한 모양과 질감이 없기 때문 작은 객.. 2023. 1. 30.

[논문 리뷰] Small Object Detection in Remote Sensing Images with Residual Feature Aggregation-Based Super-Resolution and Object Detector Network GOAL 초고해상도를 기본 모델로 활용 인공위성/항공체의 VHR 영상을 개선한 후 소형 물체 감지(차량 감지) 수행 Abstract 딥러닝 기반의 검출 방법을 이용하여 이미지 해상도 향상을 위한 이미지 초해상도 개념 활용 위성,모든 항공기의 원격탐사 영상에서 작은 물체 검출 검출 성능 향상을 위해 GAN과 RFA(잔차 특징 집계)를 통합 초해상도(SR) 프레임워크 개선 작은 물체에 대한 이미지 초해상도에 대한 이론적 근거 제공 이 방법의 참신함 연구에 사용되는 최종 객체 감지기와 독립적인 프레임워크 제안 객체 감지를 위해 YOLOv3 -> Faster R-CNN 또는 객체 감지기로 대체 RFA 네트워크: 복잡한 feature를 감지하여 감지 성능을 크게 향상됨 RFA 네트워크를 생성기에 사용 전체 네트워.. 2023. 1. 30.

[논문 리뷰] Part-Based Obstacle Detection Using a Multiple Output Neural Network 시맨틱 시그멘테이션 관련 논문 컬러 이미지를 입력으로 사용하는 인코더-디코더 구조를 기반으로 하는 다중 헤드 인공 신경망 출력: 장애물 감지 모듈, 시맨틱 세그멘테이션 모듈, 소실점 감지 모듈 인코더: 입력 이미지에서 적절하고 중요한 특징 추출 시맨틱 세그멘테이션 솔루션 기반 디코더: 여러 예측(출력) 제공 각 모듈을 독립적으로 훈련, 동일 손실 함수 사용 픽셀 기반 특징 추출: ResNet 기반 자유 공간, 특정 장애물에 레이블을 지정X -> 시맨틱 세그멘테이션 CNN을 활용 이미지 픽셀에 해당 개체 부분 레이블 지정 conv 블록: 2D 컨볼루션, 배치 정규화,ReLU 활성화의 세 가지 작업으로 나누어짐 각 conv 블록: 2D 컨볼루션, 배치 정규화 작업 및 ReLU 활성화 필터 수와 커널 크기가 .. 2023. 1. 18.

이전 1 2 3 4 5 ··· 30 다음

티스토리툴바