CNN Backbone의 역할과 의미

컴퓨터비전(Computer Vision) 분야에서 딥러닝이 활발히 활용되면서, Convolutional Neural Network(CNN)는 이미지 처리의 핵심 도구가 되었습니다. 특히 이미지 분류, 객체 탐지, 이미지 세분화와 같은 다양한 과제에서 **백본(Backbone)**이라는 용어가 자주 등장하죠. 그렇다면 백본이란 정확히 무엇이며, 어떤 역할을 할까요?

https://medium.com/@shroffmegha6695/know-your-neural-network-architecture-more-by-understanding-these-terms-67faf4ea0efb

https://medium.com/@shroffmegha6695/know-your-neural-network-architecture-more-by-understanding-these-terms-67faf4ea0efb


컴퓨터비전에서 Backbone이란?

Backbone은 입력 이미지를 고수준의 특징(feature)으로 변환하는 CNN 기반의 신경망 구조입니다.

주로 이미지의 기본적인 패턴(엣지, 텍스처, 형태 등)을 추출하여, 이후 단계인 객체 탐지나 분류 모델의 기반이 되는 '특징 맵(feature map)'을 생성합니다.

다시 말해, Backbone은 '피처 추출기(Feature Extractor)' 역할을 수행하며, 전체 딥러닝 모델의 성능에 핵심적인 영향을 미칩니다.


Backbone의 주요 역할

1. 입력 이미지에서 의미 있는 특징 추출

CNN은 여러 개의 합성곱 계층(convolution layer)을 통해 점차 복잡한 특징을 인식합니다. Backbone은 이러한 과정을 담당하며, 이미지의 시각적 정보 → 숫자 벡터화된 특징맵으로 변환하는 전처리기의 역할을 합니다.

단계 예시
초반 Layer 엣지, 점, 선 등의 저수준 특징
중간 Layer 모양, 패턴 등의 중간 수준 특징
후반 Layer 얼굴, 물체 형태 등의 고수준 특징

2. 탐지/분류/세분화 모델의 기반 제공