Визуальные данные
Изображения, видео, кадры, разрешение, FPS, камера, объектив, свет, шум, фон, перекрытия and motion blur. Без понимания источника картинки модель будет ломаться на реальной съёмке.
Разметка
Classes, bounding boxes, masks, polygons, keypoints, OCR labels, спорные случаи, consistency and inter-annotator agreement. Качество labels часто важнее выбора новой архитектуры.
CV-задачи
Classification, object detection, semantic segmentation, instance segmentation, tracking, OCR, pose estimation, anomaly detection and defect detection. Каждая задача требует своих данных и метрик.
ML/DL-база
Baseline, train/val/test split, transfer learning, overfitting, augmentation, class imbalance and domain shift. Это помогает не обмануть себя хорошей метрикой на удобном датасете.
Фреймворки
Python, PyTorch, TensorFlow, OpenCV, NumPy, torchvision and albumentations. Инструменты важны, но они не заменяют проверку данных и ошибок.
Модели
CNN, YOLO, Faster R-CNN, Mask R-CNN, U-Net, EfficientNet, Vision Transformers and OCR models. Выбор модели зависит от задачи, latency, данных and cost of error.
Метрики
Precision, recall, F1, mAP, IoU, confusion matrix, false positives, false negatives and threshold selection. В CV нельзя смотреть только на одну итоговую цифру.
Ошибки
Плохой свет, blur, small objects, occlusion, rare defects, camera shift, background shift and class confusion. Error album показывает качество понятнее, чем сухой отчёт.
Инференс
Batch inference, stream inference, API, video pipeline, latency, FPS, memory and GPU/CPU. Модель должна работать в нужном режиме, а не только в ноутбуке.
Оптимизация
ONNX, TensorRT, OpenVINO, quantization, pruning, model size and throughput. Этот слой нужен, когда качество уже понятно, а ограничение упирается в скорость или железо.
Production
Docker, Kubernetes basics, monitoring, drift, error album, retraining loop, manual review and rollback. Визуальные модели меняются вместе с камерами, светом и сценой.
Домен
Производство, медицина, документы, транспорт, безопасность, ритейл and робототехника. В каждом домене своя цена пропуска, ложного срабатывания и задержки.