공부/Deep Learning14 [Paper Review] You Only Look Once: Unified, Real-Time Object Detection A new approach to object detection. Prior work on object detection repurposes classifiers to perform detectionInstead, we frame object detection as a regression problem to spatially separated bounding boxed and associated class probabilities. A single neural network predicts bounding boxes and class probabilities directly from full images in one evaluation. Humans glance at an image and instant.. 2025. 1. 9. [Paper Review] DUSt3R: Geometric 3D Visioin Made Easy+ MASt3R: Grounding Image Matching in 3D 이전의 3D vision 기술들 SfM (Structure from Motion) Reconstructing sparse 3D maps while jointly determining camera parameters from a set of imagespixel correspondences obtained from keypoint matching between multiple images to determine geometric relationships, followed by bundle adjustment ti optimize 3D coordinates and camera parameter jointly.But, The sequential structure of the SfM pipeline persi.. 2025. 1. 8. [Paper Review] RoMa : Robust Dense Feature Matching Image MatchingFeature Matching is an important computer computer vision task that involves estimating correspndences between two images of a 3D scene, and dense methods estimate all such correspondencesDense Method (coarse-to-fine approach): Dense feature matching methods aim to find all matching pixel-pairs between the imagescoarse feature는 3D supervision을 통해 학습 -> 3D dataset은 매우 비싸고 양이 제한, ove.. 2025. 1. 8. [Paper Review] Deep Convolutional Neural Models for Picture-Quality Prediction Deep Convolutional Neural Models for Picture-Quality Prediction 서론이미지 품질 평가에 대한 중요성과 동기딥러닝을 활용한 이미지 품질 평가의 필요성연구 목표 및 방법 소개지각적 이미지 품질 예측딥러닝을 활용한 이미지 품질 예측 모델 소개합성 왜곡 이미지를 활용한 모델 성능 평가대규모 이미지 데이터베이스 수집 방법에 대한 논의딥 이미지 품질 평가자 (DIQA)비참조 이미지 품질 평가 모델 소개DIQA 모델의 훈련 및 성능 평가 결과CNN 기반 완전 참조 이미지 품질 모델CNN을 활용한 완전 참조 이미지 품질 예측 모델 소개다양한 모델의 성능 비교 및 결과 분석데이터 기반 이미지 품질 평가의 도전이미지 품질 평가에서의 데이터 수집 어려움과 해결책주관적 이미지.. 2024. 5. 15. [Paper Review] Quality-aware Pre-trained Models for Blind Image Quality Assessment Abstract BIQA(Blind Image Quality Assessment) 는 단일 이미지의 지각된 품질을 자동으로 평가하는것을 목표로 함 ( 참조 이미지 없이 이미지의 품질 평가) but, label이 지정된 데이터의 부족은 BIQA 방법을 제한함본 논문에서는 BIQA를 위한 전처리 작업으로 self-supervised learning manner 사용해 더 많은 데이터에서 표현을 학습할 수 있는 방법을 제안 학습과정을 제약하기 위해 간단한 가정을 바탕으로 한 품질 인식대조손실을 제안함. 왜곡된 이미지에서 추출된 패치들의 품질은 유사해야하지만, 서로 다른 왜곡을 가진 같은 이미지의 패치들과는 다르며 다른 이미지들의 패치들과는 달라야함 Introduction 이미지 품질은 서비스 제공자가 사용.. 2024. 4. 2. [Paper Review] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Abstract MobileNets - 모바일 및 임베디드 비전 애플리케이션을 위해 설계- 깊이별 분리 가능한 convolution 을 사용하는 간소화된 구조를 바탕으로 light weight deep neural network 구축- 지연 시간과 정확성 사이의 효율적인 절충을 가능하게 하는 두 개의 간단한 전역 하이퍼파라미터 도입 -> 제약 조건에 기반해 애플리케이션에 적합한 크기의 모델 선택 가능 2. Prior Work (작은 모델을 구축하는 이전 작업 검토)이전의 모델들은 small network 에서 latency를 최적화했지만 speed를 고려하지 못했음MobileNets - 주로 깊이별 분리 가능한 컨볼루션에서 구축됨Flattened network - 완전 분해 가능한 컨볼루션으로 구.. 2024. 3. 17. 이전 1 2 3 다음