본문 바로가기

교내|외 활동/LPCVC

LPCV | 모델 학습시켜보기

by 0/0 2026. 2. 19.

본 모델 목표: 작고, export 잘 되고, AI Hub에서 compile 잘 되는 구조

Image Encoder: MobileNetV3-Small 같은 경량 CNN + projection(Linear)
Text Encoder: CLIP 토큰 임베딩 + 아주 작은 Transformer(1~2 layer) + projection(Linear)

임베딩 차원 D: 256 (더 빠름)

단, 추후 정확도(Recall@10) 올리려면 512가 유리할 때가 많음.

'교내|외 활동 > LPCVC' 카테고리의 다른 글

LPCV \| 텍스트, 이미지 인코더 (0)	2026.02.19
LPCV \| 환경설정 (0)	2026.02.12
LPCV \| Clip 모델 (0)	2026.02.12

티스토리툴바