Danh mục mô hình phân đoạn (Workspace) và phát hiện đối tượng (huấn luyện / tương thích bộ dữ liệu lớp). Cấu hình Workspace lưu cục bộ trên trình duyệt.
| Mô tả | Đầu vào | Hành động | ||||
|---|---|---|---|---|---|---|
| DETR Nghiên cứu, multi-object scenes | Phát hiện đối tượng | Meta AI | Detection với Transformer, không cần anchor hand-crafted. | Ảnh, query set cố định | Sắp tích hợp | |
| EfficientDet Mobile / edge với budget FLOPs | Phát hiện đối tượng | Google Brain | Compound scaling (backbone + BiFPN); hiệu quả tham số. | Ảnh đa độ phân giải | Sắp tích hợp | |
| Faster R-CNN Benchmark độ chính xác, ảnh vệ tinh độ phân giải cao | Phát hiện đối tượng | Microsoft Research | Detector hai giai đoạn (RPN + RoI); độ chính xác cao, chậm hơn YOLO. | Ảnh, bbox | Sắp tích hợp | |
| Mask R-CNN Detect + polygon instance | Phát hiện đối tượng | Facebook AI | Mở rộng Faster R-CNN với mask instance segmentation. | Ảnh, bbox + mask | Sắp tích hợp | |
| RetinaNet Detect đối tượng nhỏ trên ảnh lớn | Phát hiện đối tượng | Facebook AI | One-stage với Focal Loss; xử lý mất cân bằng foreground/background. | Ảnh, pyramid đặc trưng | Sắp tích hợp | |
| RF-DETR Custom dataset từ bộ xuất lớp | Phát hiện đối tượng | Roboflow | DETR cải tiến cho mAP cao trên bộ dữ liệu tùy chỉnh. | Ảnh, fine-tune nhẹ | Sắp tích hợp | |
| RT-DETR Detect real-time trên GPU | Phát hiện đối tượng | Baidu / PaddlePaddle | Biến thể DETR tối ưu tốc độ suy luận thời gian thực. | Ảnh, TensorRT / ONNX | Sắp tích hợp | |
| SAM (Segment Anything) Tách vật thể (Workspace) — thế hệ 1 | Phân đoạn | Meta AI | Mô hình phân đoạn zero-shot theo điểm hoặc hộp bao; nền tảng cho pipeline tách đối tượng trên ảnh tĩnh. | Điểm gợi ý, hộp (bbox), ảnh RGB | Không khả dụng | — |
| SAM 2 Tách vật thể (Workspace) — thế hệ 2 | Phân đoạn | Meta AI | Kế thừa SAM với theo dõi đối tượng trên video và phân đoạn nhanh hơn trên ảnh. | Điểm, mask, video / ảnh | Không khả dụng | — |
| SAM 3 Tách vật thể (Workspace) — mặc định hệ thống | Phân đoạn | Meta AI | Hỗ trợ mô tả văn bản (text prompt) và điểm gợi ý; phù hợp mô tả đối tượng bằng tiếng Việt/Anh trong Workspace. | Điểm gợi ý, mô tả văn bản, ảnh GeoTIFF | Đang hỗ trợ | Đang dùng |
| SSD (MobileNet) On-device detect | Phát hiện đối tượng | Single Shot Detector trên backbone MobileNet — nhẹ cho thiết bị. | Ảnh nhỏ, quantized | Sắp tích hợp | ||
| YOLO26 Suy luận hàng loạt trên server | Phát hiện đối tượng | Ultralytics | Phiên bản 2026, end-to-end không NMS; tối ưu CPU/GPU cho pipeline sản xuất. | Ảnh, batch suy luận | Sắp tích hợp | |
| YOLOv10 Detect thời gian thực, edge deployment | Phát hiện đối tượng | Ultralytics / THU | YOLO thế hệ mới với thiết kế NMS-free, tối ưu độ trễ suy luận. | Ảnh, anchor-free | Sắp tích hợp | |
| YOLOv11 Detect + tracking tích hợp | Phát hiện đối tượng | Ultralytics | Cải tiến backbone và neck; thường dùng làm baseline detect mới. | Ảnh đa tỷ lệ | Sắp tích hợp | |
| YOLOv5 Legacy deploy, fine-tune nhanh | Phát hiện đối tượng | Ultralytics | Họ YOLO cổ điển, ecosystem rộng (export ONNX, TensorRT). | Ảnh, PyTorch weights | Sắp tích hợp | |
| YOLOv8 Huấn luyện / suy luận detect (tương thích bộ dữ liệu lớp) | Phát hiện đối tượng | Ultralytics | Detector một giai đoạn, cân bằng tốc độ và độ chính xác; phổ biến cho suy luận thời gian thực. | Ảnh / video, nhãn lớp COCO-style | Sắp tích hợp |
Mô hình Phân đoạn (SAM) dùng trực tiếp trong Workspace — bấm «Chọn cho Workspace» để đổi (hiện chỉ SAM 3 được bật). Mô hình Phát hiện đối tượng liên quan tới xuất/huấn luyện bộ dữ liệu lớp; sẽ kết nối API sau.