✅ 왜 불량 데이터가 부족한가?
AI 기반 검사 시스템 개발 초기 단계에서 가장 흔히 부딪히는 문제는 바로 불량 데이터의 부족입니다.
이는 단순한 데이터 양 부족의 문제가 아니라, 다음과 같은 구조적인 이유에서 비롯됩니다:
- 제조 공정 자체의 불량률이 매우 낮음
- 불량 유형이 다양하고, 변동성이 큼
- 초기에는 신규 제품 또는 신규 공정으로 불량 데이터가 존재하지 않음
- 불량 재현이 어렵거나, 제조사 입장에서 의도적으로 만들기 곤란함
그렇다면 이런 상황에서 우리는 어떤 전략으로 성능을 확보해야 할까요?
🎯 불량 데이터가 부족할 때의 성능 확보 전략
1. 정상 데이터 중심의 One-Class 학습
정상 이미지만 가지고 학습한 후, 나머지를 이상(anomaly)으로 간주하는 방식입니다.
- 대표 기법: AutoEncoder, One-Class SVM, CutPaste, PaDiM, FastFlow
- 장점: 불량 데이터가 없어도 모델 구축 가능
- 단점: 불량 유형별 분류는 불가, Threshold 설정 민감