본문 바로가기
반응형

전체 글210

show bbox(coco) import os import cv2 import json base_path = "" json_path = base_path + '/' + "_annotations.coco.json" with open(json_path, "r") as json_file: st_python = json.load(json_file) red_color = (0,0,255) tmp = 0 for i in range(len(st_python['images'])): file_name = st_python['images'][i]['file_name'] img_id = st_python['images'][i]['id'] img = cv2.imread(base_path+'/'+file_name) while True: bbox = st_.. 2023. 8. 2.
[논문 리뷰] DeFRCN: Decoupled Faster R-CNN for Few-Shot Object Detection Faster R-CNN은 backbone, RPN 및 RCNN의 세 가지 구성 요소를 포함하며 순방향 및 gradient-backward를 통해 서로 상호 작용 위에서 언급한 RPN과 RCNN 사이의 모순으로 인해 세 모듈 간의 디커플링 정도를 gradient를 통해 조정 전체 모델이 둘 중 하나에 의해 지배되는 것을 완화하기 위해 제시 RPN과 RCNN 사이의 모순으로 인한 모듈 간의 디커플링 정도를 gradient를 통해 조정 분류와 회귀 사이의 작업 충돌은 기능의 품질에 영향, 헤드 출력에 성능 하락으로 이어짐 두 작업(분류, 회귀)을 분리하는 목적 달성을 위해 분류 분기에서만 효율적인 점수 보정 모듈을 사용 입력 이미지는 백본으로 전달되어 high level 의 피쳐맵 생성 이후 RPN 및 RCN.. 2023. 7. 25.
[논문 리뷰] Video Person Re-ID: Fantastic Techniques and Where to Find Them Abstract 재식별은 상업적, 학술적 가치가 있음 기존 solution은 attention기반 모델임제안한 손실 함수는 bag-of-tric에 적용됨 본 논문에서는 attention기반에 top of a temporal attention-based가 추가된 CL loss 활용 Introduction Person Re-IDentification의 목표 똑같은 사람을 다른 영상 속에서 찾는 것 갤러리 셋 안의 똑같은 사람을 쿼리 비디오에서 찾는 것 Methodology Baseline(Base Temporal Attention) Revisiting temporal modeling for video-based person reid 데이터셋 ImageNet을 적용 ResNet-50으로 사전 학습 - 비디오 .. 2023. 3. 20.
YOLO version(1~6)별 정리 YOLO v1(2016.05) Anchor Box를 사용하지 않음 Anchor Box - object detecion 을 위해 크기, 비율 미리 정해놓은 Bbox Cell 단위로 Bounding Box Regressor 과정을 통해 Box를 찾음 Localization Error로 인해 성능이 낮다 각 Grid Cell에 대해 2개의 Bounding Box를 찾음 Classification은 한 개에 대해서만 수행 따라서 겹치는 Object는 Detection하기 어려움 작은 물체에 대해서는 성능이 나쁨 YOLO v2(2017.12) YOLO v2는 Classification 문제에 비해 Object Detection 문제는 예측 가능한 Class의 개수가 매우 적음을 지적 이를 해결하기 위한 방법을 제.. 2023. 3. 16.
[논문 리뷰]On the Unreasonable Effectiveness of Centroids in Image Retrieval Abstract 재식별 task SOTA 제안 방법의 전체 architecture 기존 이미지 검색, 재식별 → 갤러리 내 쿼리에서 유사 이미지 검색하는 방식(metric learning: input data간 거리 학습)을 주로 사용 Hard negative sampling(mining) 클래스 불균형 문제 해결을 위한 방법 hard negative(negative인데 postive라고 잘못 예측한 데이터)를 모아 원본 데이터셋에 추가하여 재학습하면 false positive 오류에 강해짐 문제점: 배치의 모든 샘플 사이의 거리 계산하는 방법으로 cost가 커짐 문제점: tiplet loss와 사용할 경우 tiplet loss의 특성 point-to-point loss 때문에 노이즈 레이블 발생하기 쉬.. 2023. 3. 14.
[논문 리뷰] InternImage : Exploring Large-Scale Vision Foundation Models with Deformable Convolutions(2022) [논문 리뷰] 최근 대세인 VIT가 아닌 CNN을 활용한 연구로서, object detection, segmentation 부분 SOTA를 달성하였다. Abstract 최근 몇 년간 large-scale vit의 비약적 성장이 이루어짐 CNN기반 large-scale 모델은 여전히 초기상태에 머무름 InternImage라 부르는 새로운 방법 제안(기존 모델들과의 차이점) ViT처럼 매개변수 및 훈련 데이터 증가 최근 CNN의 초점 large dense kernels와 다름 변형 가능한 컨볼루션을 핵심 연산자로 사용 detection, segmentation과 같은 다운스트림 작업에 필요한 큰 effective receptive field를 가짐 input 및 task information에 따라 조정되는 adaptiv.. 2023. 3. 13.
[논문 리뷰]A Method for Detection of Small Moving Objects inUAV Videos goal: 표준 비디오 카메라가 장착된 무인 항공기를 이용하여 녹화된 비디오에서 작은 움직이는 물체(곤충)를 감지하는 방법 제안 contribution: UAV 사용 캡처한 비디오에서 작은 움직이는 물체 감지를 위한 모양 및 동작 정보를 모두 효과적으로 사용 CNN 기반 탐지기 훈련을 위한 합성 데이터 사용. 합성 교육 비디오를 생성하는 데 사용되는 매개변수의 영향 평가 및 검출기 성능에 대한 기타 설계 선택. 합성 데이터에 대한 검출기 성능이 실제 비디오 시퀀스에 대한 성능의 프록시로 사용될 수 있는지 여부를 조사 abstract 연구의 어려운 점 컨벌루션 신경망(CNN)은 대상 물체가 작을 때(예: 10 x 10 픽셀 미만) 얻은 결과는 좋지 않음 작은 물체에 독특한 모양과 질감이 없기 때문 작은 객.. 2023. 1. 30.
반응형