Hệ thống lấy mẫu

Quản lý mô hình

Danh mục mô hình phân đoạn (Workspace) và phát hiện đối tượng (huấn luyện / tương thích bộ dữ liệu lớp). Cấu hình Workspace lưu cục bộ trên trình duyệt.

			Mô tả	Đầu vào		Hành động
DETR Nghiên cứu, multi-object scenes	Phát hiện đối tượng	Meta AI	Detection với Transformer, không cần anchor hand-crafted.	Ảnh, query set cố định	Sắp tích hợp
EfficientDet Mobile / edge với budget FLOPs	Phát hiện đối tượng	Google Brain	Compound scaling (backbone + BiFPN); hiệu quả tham số.	Ảnh đa độ phân giải	Sắp tích hợp
Faster R-CNN Benchmark độ chính xác, ảnh vệ tinh độ phân giải cao	Phát hiện đối tượng	Microsoft Research	Detector hai giai đoạn (RPN + RoI); độ chính xác cao, chậm hơn YOLO.	Ảnh, bbox	Sắp tích hợp
Mask R-CNN Detect + polygon instance	Phát hiện đối tượng	Facebook AI	Mở rộng Faster R-CNN với mask instance segmentation.	Ảnh, bbox + mask	Sắp tích hợp
RetinaNet Detect đối tượng nhỏ trên ảnh lớn	Phát hiện đối tượng	Facebook AI	One-stage với Focal Loss; xử lý mất cân bằng foreground/background.	Ảnh, pyramid đặc trưng	Sắp tích hợp
RF-DETR Custom dataset từ bộ xuất lớp	Phát hiện đối tượng	Roboflow	DETR cải tiến cho mAP cao trên bộ dữ liệu tùy chỉnh.	Ảnh, fine-tune nhẹ	Sắp tích hợp
RT-DETR Detect real-time trên GPU	Phát hiện đối tượng	Baidu / PaddlePaddle	Biến thể DETR tối ưu tốc độ suy luận thời gian thực.	Ảnh, TensorRT / ONNX	Sắp tích hợp
SAM (Segment Anything) Tách vật thể (Workspace) — thế hệ 1	Phân đoạn	Meta AI	Mô hình phân đoạn zero-shot theo điểm hoặc hộp bao; nền tảng cho pipeline tách đối tượng trên ảnh tĩnh.	Điểm gợi ý, hộp (bbox), ảnh RGB	Không khả dụng	—
SAM 2 Tách vật thể (Workspace) — thế hệ 2	Phân đoạn	Meta AI	Kế thừa SAM với theo dõi đối tượng trên video và phân đoạn nhanh hơn trên ảnh.	Điểm, mask, video / ảnh	Không khả dụng	—
SAM 3 Tách vật thể (Workspace) — mặc định hệ thống	Phân đoạn	Meta AI	Hỗ trợ mô tả văn bản (text prompt) và điểm gợi ý; phù hợp mô tả đối tượng bằng tiếng Việt/Anh trong Workspace.	Điểm gợi ý, mô tả văn bản, ảnh GeoTIFF	Đang hỗ trợ	Đang dùng
SSD (MobileNet) On-device detect	Phát hiện đối tượng	Google	Single Shot Detector trên backbone MobileNet — nhẹ cho thiết bị.	Ảnh nhỏ, quantized	Sắp tích hợp
YOLO26 Suy luận hàng loạt trên server	Phát hiện đối tượng	Ultralytics	Phiên bản 2026, end-to-end không NMS; tối ưu CPU/GPU cho pipeline sản xuất.	Ảnh, batch suy luận	Sắp tích hợp
YOLOv10 Detect thời gian thực, edge deployment	Phát hiện đối tượng	Ultralytics / THU	YOLO thế hệ mới với thiết kế NMS-free, tối ưu độ trễ suy luận.	Ảnh, anchor-free	Sắp tích hợp
YOLOv11 Detect + tracking tích hợp	Phát hiện đối tượng	Ultralytics	Cải tiến backbone và neck; thường dùng làm baseline detect mới.	Ảnh đa tỷ lệ	Sắp tích hợp
YOLOv5 Legacy deploy, fine-tune nhanh	Phát hiện đối tượng	Ultralytics	Họ YOLO cổ điển, ecosystem rộng (export ONNX, TensorRT).	Ảnh, PyTorch weights	Sắp tích hợp
YOLOv8 Huấn luyện / suy luận detect (tương thích bộ dữ liệu lớp)	Phát hiện đối tượng	Ultralytics	Detector một giai đoạn, cân bằng tốc độ và độ chính xác; phổ biến cho suy luận thời gian thực.	Ảnh / video, nhãn lớp COCO-style	Sắp tích hợp

Mô hình Phân đoạn (SAM) dùng trực tiếp trong Workspace — bấm «Chọn cho Workspace» để đổi (hiện chỉ SAM 3 được bật). Mô hình Phát hiện đối tượng liên quan tới xuất/huấn luyện bộ dữ liệu lớp; sẽ kết nối API sau.