Machine learningDeep learning / NLP / CV
미세 조정된 비전 트랜스포머
미세 조정된 비전 트랜스포머(Fine-Tuned Vision Transformer)는 이미지를 고정 크기 패치로 분할하고 셀프 어텐션 레이어를 통해 처리하는 대규모 사전 훈련된 ViT 모델을 비교적 작은 레이블 데이터셋을 사용하여 새로운 이미지 분류 또는 인식 작업에 적응시킵니다. 대규모 사전 훈련 중에 학습된 풍부한 표현을 활용하여 컴퓨터 비전에서 최첨단 정확도를 달성합니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
+4 more
출처
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/ko/deep-learning/fine-tuned-vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT 기반 분류딥러닝↔ compare
- 미세 조정된 합성곱 신경망딥러닝↔ compare
- 이미지 분류딥러닝↔ compare
- Semantic segmentation딥러닝↔ compare
- Vision Transformer딥러닝↔ compare