24.11.19

모델 강점 추천 이유
Mask2Former 복잡한 세그멘테이션 작업에서 높은 정확도 뼈의 구조와 경계를 정밀하게 구분.
Swin Transformer + UperNet 고해상도 데이터와 복잡한 클래스 처리에 적합 뼈의 세부 구조를 고정밀도로 분리 가능.
Pyramid Vision Transformer (PVT) 메모리 효율적이며 고성능 Transformer 구조 제공 고해상도 뼈 데이터 작업에서 효율적.
MobileViT 경량화된 모델, 제한된 자원 환경에서 적합 리소스 제약이 있는 환경에서 사용.
EfficientNet 효율성과 정확성 간의 균형 제공 고성능이 필요하지 않은 경량 세그멘테이션 작업.

Mask2Former

31개 매개변수 확장

매개변수

Mask2FormerModel 의 구성을 저장하는 구성 클래스입니다 . 지정된 인수에 따라 Mask2Former 모델을 인스턴스화하고 모델 아키텍처를 정의하는 데 사용됩니다. 기본값으로 구성을 인스턴스화하면 Mask2Former facebook/mask2former-swin-small-coco-instance 아키텍처와 유사한 구성이 생성됩니다.

구성 객체는 PretrainedConfig 에서 상속되며 모델 출력을 제어하는 ​​데 사용할 수 있습니다. 자세한 내용은 PretrainedConfig 의 설명서를 읽어보세요.

현재 Mask2Former는 Swin Transformer 만을 백본으로 지원합니다.

root@instance-13781:~/bohyun/ultralytics# python data_utils.py 
Starting convert data to coco format
800it [00:05, 139.29it/s]
Finish convert data to coco format
Starting convert yolo to coco format
800it [00:10, 73.06it/s]
Finish convert yolo to coco format
Train images:  640
Train labels:  640
Valid images:  160
Valid labels:  160


엄청난 속도..

50 epochs completed in 0.627 hours.
Optimizer stripped from Segmentation/T6030_yolo_seg_6409/weights/last.pt, 144.0MB
Optimizer stripped from Segmentation/T6030_yolo_seg_6409/weights/best.pt, 144.0MB

Validating Segmentation/T6030_yolo_seg_6409/weights/best.pt...
Ultralytics 8.3.33 🚀 Python-3.10.13 torch-2.1.0 CUDA:0 (Tesla V100-SXM2-32GB, 32501MiB)
YOLOv8x-seg summary (fused): 295 layers, 71,748,583 parameters, 0 gradients, 343.8 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 4
                   all        160       4640      0.998          1      0.995      0.944      0.994      0.995      0.989      0.844
              finger-1        160        160      0.998          1      0.995      0.979      0.998          1      0.995      0.831
              finger-2        160        160      0.998          1      0.995      0.993      0.998          1      0.995       0.93
              finger-3        160        160      0.998          1      0.995      0.993      0.998          1      0.995      0.959
              finger-4        160        160      0.998          1      0.995      0.967      0.998          1      0.995      0.812
              finger-5        160        160      0.998          1      0.995      0.978      0.998          1      0.995      0.871
              finger-6        160        160      0.998          1      0.995      0.995      0.998          1      0.995      0.964
              finger-7        160        160      0.998          1      0.995      0.992      0.998          1      0.995      0.943
              finger-8        160        160      0.998          1      0.995      0.975      0.998          1      0.995      0.822
              finger-9        160        160      0.998          1      0.995      0.978      0.998          1      0.995      0.913
             finger-10        160        160      0.998          1      0.995      0.995      0.998          1      0.995      0.957
             finger-11        160        160      0.998          1      0.995      0.966      0.998          1      0.995      0.959
             finger-12        160        160      0.998          1      0.995      0.978      0.998          1      0.995      0.827
             finger-13        160        160      0.998          1      0.995      0.991      0.998          1      0.995      0.915
             finger-14        160        160      0.998          1      0.995      0.995      0.998          1      0.995      0.951
             finger-15        160        160      0.998          1      0.995      0.985      0.998          1      0.995      0.897
             finger-16        160        160      0.998          1      0.995      0.978      0.998          1      0.995      0.809
             finger-17        160        160      0.998          1      0.995      0.983      0.998          1      0.995      0.857
             finger-18        160        160      0.998          1      0.995      0.994      0.998          1      0.995      0.945
             finger-19        160        160      0.998          1      0.995      0.989      0.998          1      0.995      0.909
             Trapezium        160        160      0.998          1      0.995      0.809      0.998          1      0.995      0.716
             Trapezoid        160        160      0.999          1      0.995      0.718      0.999          1      0.995      0.659
              Capitate        160        160      0.998          1      0.995      0.888      0.998          1      0.995      0.768
                Hamate        160        160      0.998          1      0.995      0.895      0.998          1      0.995       0.75
              Scaphoid        160        160      0.998          1      0.995      0.962      0.998          1      0.995      0.807
                Lunate        160        160      0.999          1      0.995      0.877      0.999          1      0.995      0.826
            Triquetrum        160        160      0.998          1      0.995      0.892      0.879      0.881      0.829      0.334
              Pisiform        160        160      0.987      0.988      0.987      0.632      0.981      0.981      0.983       0.58
                Radius        160        160      0.998          1      0.995      0.995      0.998          1      0.995      0.995
                  Ulna        160        160      0.998          1      0.995      0.993      0.998          1      0.995      0.972
Speed: 0.4ms preprocess, 12.6ms inference, 0.0ms loss, 1.3ms postprocess per image
Results saved to Segmentation/T6030_yolo_seg_6409

멘토링

외국에서 어린아이 배우 문제가 이슈가 있어서

이미지 하나당 29줄 쭉쭉 나와야되는데 이건 클래스 이름도 안적혀있어