Etienne SCHMITZ
La vision par ordinateur est une branche de l’intelligence artificielle qui permet à une machine de voir, analyser et comprendre le contenu d’une image ou d’une vidéo.
Multiplateforme : Python, C++, Java, compatible ROS / ROS 2 Créé par Intel en 2000, aujourd’hui open-source sous licence Apache 2.0
OpenCV est la boîte à outils standard de vision pour les robots
(0, 0)
(y, x)
┌ x ─────────────┐ y │ │ │ │ │ └
img_rgb = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB) img_hsv = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2HSV)
HSV facilite la segmentation de couleurs indépendamment de l’éclairage
class CNN(nn.Module): def __init__(self): super().__init__() self.conv1 = nn.Conv2d(1, 10, 5) self.conv2 = nn.Conv2d(10, 20, 5) self.fc1 = nn.Linear(320, 50) self.fc2 = nn.Linear(50, 10)
X
Y
Ŷ
Loss(Ŷ, Y)
mesure à quel point le modèle se trompe (ex. : CrossEntropyLoss pour la classification)
CrossEntropyLoss
calcul automatique du gradient de l’erreur pour chaque poids du réseau
par descente de gradient, l’optimiseur (Adam, SGD...) ajuste les paramètres
Une epoch = une passation complète sur tout l'ensemble d'entraînement
Exemple : 60 000 images → 10 epochs = 600 000 images vues au total
YOLO peut être intégré dans OpenCV avec cv2.dnn ou utilisé via la bibliothèque ultralytics
Soyez curieux, testez vos idées, explorez des cas concrets !