'ML 관련/이미지 처리 관련' 카테고리의 글 목록

본문 바로가기

[논문 리뷰] DeFRCN: Decoupled Faster R-CNN for Few-Shot Object Detection Faster R-CNN은 backbone, RPN 및 RCNN의 세 가지 구성 요소를 포함하며 순방향 및 gradient-backward를 통해 서로 상호 작용 위에서 언급한 RPN과 RCNN 사이의 모순으로 인해 세 모듈 간의 디커플링 정도를 gradient를 통해 조정 전체 모델이 둘 중 하나에 의해 지배되는 것을 완화하기 위해 제시 RPN과 RCNN 사이의 모순으로 인한 모듈 간의 디커플링 정도를 gradient를 통해 조정 분류와 회귀 사이의 작업 충돌은 기능의 품질에 영향, 헤드 출력에 성능 하락으로 이어짐 두 작업(분류, 회귀)을 분리하는 목적 달성을 위해 분류 분기에서만 효율적인 점수 보정 모듈을 사용 입력 이미지는 백본으로 전달되어 high level 의 피쳐맵 생성 이후 RPN 및 RCN.. 2023. 7. 25.

[논문 리뷰] Video Person Re-ID: Fantastic Techniques and Where to Find Them Abstract 재식별은 상업적, 학술적 가치가 있음 기존 solution은 attention기반 모델임제안한 손실 함수는 bag-of-tric에 적용됨 본 논문에서는 attention기반에 top of a temporal attention-based가 추가된 CL loss 활용 Introduction Person Re-IDentification의 목표 똑같은 사람을 다른 영상 속에서 찾는 것 갤러리 셋 안의 똑같은 사람을 쿼리 비디오에서 찾는 것 Methodology Baseline(Base Temporal Attention) Revisiting temporal modeling for video-based person reid 데이터셋 ImageNet을 적용 ResNet-50으로 사전 학습 - 비디오 .. 2023. 3. 20.

YOLO version(1~6)별 정리 YOLO v1(2016.05) Anchor Box를 사용하지 않음 Anchor Box - object detecion 을 위해 크기, 비율 미리 정해놓은 Bbox Cell 단위로 Bounding Box Regressor 과정을 통해 Box를 찾음 Localization Error로 인해 성능이 낮다 각 Grid Cell에 대해 2개의 Bounding Box를 찾음 Classification은 한 개에 대해서만 수행 따라서 겹치는 Object는 Detection하기 어려움 작은 물체에 대해서는 성능이 나쁨 YOLO v2(2017.12) YOLO v2는 Classification 문제에 비해 Object Detection 문제는 예측 가능한 Class의 개수가 매우 적음을 지적 이를 해결하기 위한 방법을 제.. 2023. 3. 16.

[논문 리뷰]On the Unreasonable Effectiveness of Centroids in Image Retrieval Abstract 재식별 task SOTA 제안 방법의 전체 architecture 기존 이미지 검색, 재식별 → 갤러리 내 쿼리에서 유사 이미지 검색하는 방식(metric learning: input data간 거리 학습)을 주로 사용 Hard negative sampling(mining) 클래스 불균형 문제 해결을 위한 방법 hard negative(negative인데 postive라고 잘못 예측한 데이터)를 모아 원본 데이터셋에 추가하여 재학습하면 false positive 오류에 강해짐 문제점: 배치의 모든 샘플 사이의 거리 계산하는 방법으로 cost가 커짐 문제점: tiplet loss와 사용할 경우 tiplet loss의 특성 point-to-point loss 때문에 노이즈 레이블 발생하기 쉬.. 2023. 3. 14.

[논문 리뷰] InternImage : Exploring Large-Scale Vision Foundation Models with Deformable Convolutions(2022) [논문 리뷰] 최근 대세인 VIT가 아닌 CNN을 활용한 연구로서, object detection, segmentation 부분 SOTA를 달성하였다. Abstract 최근 몇 년간 large-scale vit의 비약적 성장이 이루어짐 CNN기반 large-scale 모델은 여전히 초기상태에 머무름 InternImage라 부르는 새로운 방법 제안(기존 모델들과의 차이점) ViT처럼 매개변수 및 훈련 데이터 증가 최근 CNN의 초점 large dense kernels와 다름 변형 가능한 컨볼루션을 핵심 연산자로 사용 detection, segmentation과 같은 다운스트림 작업에 필요한 큰 effective receptive field를 가짐 input 및 task information에 따라 조정되는 adaptiv.. 2023. 3. 13.

[논문 리뷰]A Method for Detection of Small Moving Objects inUAV Videos goal: 표준 비디오 카메라가 장착된 무인 항공기를 이용하여 녹화된 비디오에서 작은 움직이는 물체(곤충)를 감지하는 방법 제안 contribution: UAV 사용 캡처한 비디오에서 작은 움직이는 물체 감지를 위한 모양 및 동작 정보를 모두 효과적으로 사용 CNN 기반 탐지기 훈련을 위한 합성 데이터 사용. 합성 교육 비디오를 생성하는 데 사용되는 매개변수의 영향 평가 및 검출기 성능에 대한 기타 설계 선택. 합성 데이터에 대한 검출기 성능이 실제 비디오 시퀀스에 대한 성능의 프록시로 사용될 수 있는지 여부를 조사 abstract 연구의 어려운 점 컨벌루션 신경망(CNN)은 대상 물체가 작을 때(예: 10 x 10 픽셀 미만) 얻은 결과는 좋지 않음 작은 물체에 독특한 모양과 질감이 없기 때문 작은 객.. 2023. 1. 30.

[논문 리뷰] Small Object Detection in Remote Sensing Images with Residual Feature Aggregation-Based Super-Resolution and Object Detector Network GOAL 초고해상도를 기본 모델로 활용 인공위성/항공체의 VHR 영상을 개선한 후 소형 물체 감지(차량 감지) 수행 Abstract 딥러닝 기반의 검출 방법을 이용하여 이미지 해상도 향상을 위한 이미지 초해상도 개념 활용 위성,모든 항공기의 원격탐사 영상에서 작은 물체 검출 검출 성능 향상을 위해 GAN과 RFA(잔차 특징 집계)를 통합 초해상도(SR) 프레임워크 개선 작은 물체에 대한 이미지 초해상도에 대한 이론적 근거 제공 이 방법의 참신함 연구에 사용되는 최종 객체 감지기와 독립적인 프레임워크 제안 객체 감지를 위해 YOLOv3 -> Faster R-CNN 또는 객체 감지기로 대체 RFA 네트워크: 복잡한 feature를 감지하여 감지 성능을 크게 향상됨 RFA 네트워크를 생성기에 사용 전체 네트워.. 2023. 1. 30.

[논문 리뷰] Part-Based Obstacle Detection Using a Multiple Output Neural Network 시맨틱 시그멘테이션 관련 논문 컬러 이미지를 입력으로 사용하는 인코더-디코더 구조를 기반으로 하는 다중 헤드 인공 신경망 출력: 장애물 감지 모듈, 시맨틱 세그멘테이션 모듈, 소실점 감지 모듈 인코더: 입력 이미지에서 적절하고 중요한 특징 추출 시맨틱 세그멘테이션 솔루션 기반 디코더: 여러 예측(출력) 제공 각 모듈을 독립적으로 훈련, 동일 손실 함수 사용 픽셀 기반 특징 추출: ResNet 기반 자유 공간, 특정 장애물에 레이블을 지정X -> 시맨틱 세그멘테이션 CNN을 활용 이미지 픽셀에 해당 개체 부분 레이블 지정 conv 블록: 2D 컨볼루션, 배치 정규화,ReLU 활성화의 세 가지 작업으로 나누어짐 각 conv 블록: 2D 컨볼루션, 배치 정규화 작업 및 ReLU 활성화 필터 수와 커널 크기가 .. 2023. 1. 18.

[논문 리뷰] Deep Learning-Based Object Detection and Scene Perceptionunder Bad Weather Conditions 리뷰 abstract YOLO v5 모델을 활용 다양한 날씨 상황에서 자동차, 신호등, 보행자를 식별하여 차량 환경에서 실시간 식별이 가능한 방법 제시 11가지 차량(자동차, 트럭, 자전거), 보행자 및 교통 신호(빨간색, 녹색, 노란색)에 대한 우천 및 일반 기상 시나리오에 대한 거리 수준 기록에서 객체 인식 Roboflow 데이터 세트를 활용 실제 도로 교통 비디오 시퀀스를 사용하여 제안 시스템의 성능 평가 dataset Roboflow 자율 주행 자동차 데이터 세트 사용 사전 훈련된 COCO 가중치 사용 훈련 세트: 959개의 이미지, 검증 세트: 239개의 이미지 테스트 세트: 302개의 이미지 2023. 1. 12.

[논문 리뷰] Thermal Object Detection in Difficult Weather Conditions Using YOLO(ieee 2017) 리뷰 abstract RGB 이미지에서 감지하도록 의도된 컨볼루션 신경망 모델을 사용하여 열화상에서 자동 사람 감지 작업 Faster R-CNN, SSD, Cascade RCNN 및 YOLOv3와 같은 표준 최첨단 개체 감지기의 성능을 국경 주변의 불법 이동을 시뮬레이션하는 비디오에서 추출한 열 이미지 데이터 세트로 재학습한 성능을 비교 보호 구역에서 맑은 날씨, 비, 안개, 밤 다양한 범위에서 다양한 움직임 유형으로 녹화 YOLOv3는 다른 탐지기보다 훨씬 빠르면서도 최고에 필적하는 성능을 달성하여 추가 실험에 사용 테스트 데이터 세트에서 우수한 감지 결과를 얻는 데 필요한 최소 이미지 수를 결정하기 위해 다양한 교육 데이터 세트 설정 실험 학습에 약간의 열화상 세트를 사용, 모든 테스트 시나리오에 대한 평.. 2023. 1. 11.

이전 1 2 다음

티스토리툴바