Annotations d'images

Ajoutez des légendes visuelles à n'importe quelle image — captures d'écran, diagrammes, docs d'architecture, frames de démo — en utilisant PIL/Pillow. Mettez en évidence ce qui a changé ou ce qu'il faut regarder, pour que les relecteurs n'aient pas à deviner.

Quand utiliser cette compétence

Utilisez cette compétence quand vous avez besoin de :

Mettre en évidence une zone spécifique dans une capture d'écran pour une description de PR
Annoter des images avant/après pour montrer ce qui a changé
Ajouter des labels et des légendes à des diagrammes ou images d'architecture
Créer des frames annotées pour des démos GIF animés

Prérequis

pip install Pillow -q

Règles de couleurs

Rouge (#E63946) — uniquement pour les choses « mauvaises » / « supprimées » (ex : encercler un bug en cours de correction)
Jaune-orange (#FF9F1C) — pour les mises en évidence neutres (« regardez ici », « nouvelle fonctionnalité », etc.)
N'utilisez jamais le rouge juste parce que c'est attrayant — rouge = mauvais/supprimé

Police

Utilisez Ink Free (C:/Windows/Fonts/Inkfree.ttf) pour un look manuscrit sur Windows
Sur Linux/macOS, utilisez ImageFont.load_default()
Taille 36 pour les annotations sur des images d'environ 1400px de large
stroke_width=1 avec stroke_fill=<même couleur que fill> — donne du corps sans être trop épais
N'utilisez PAS de trait blanc — ça ressemble à un mauvais effet de lueur

Formes

Préférez les rectangles arrondis aux cercles/ellipses — moins de pixelisation aux bords
draw.rounded_rectangle([x1, y1, x2, y2], radius=14, outline=color, width=5)
Padding 18px autour du contenu cible

Snippet de référence

from PIL import Image, ImageDraw, ImageFont

# Setup
font = ImageFont.truetype('C:/Windows/Fonts/Inkfree.ttf', 36)  # ou load_default()
color = '#FF9F1C'  # orange pour les mises en évidence
stroke = 5
pad = 18

img = Image.open('screenshot.png')
draw = ImageDraw.Draw(img)

# Rectangle arrondi avec padding
draw.rounded_rectangle(
    [x1 - pad, y1 - pad, x2 + pad, y2 + pad],
    radius=14, outline=color, width=stroke
)

# Ligne de leader (même épaisseur que le rectangle)
draw.line([x2 + pad, cy, x2 + pad + 40, cy - 30], fill=color, width=stroke)

# Label — trait de même couleur pour le corps, PAS de trait blanc
draw.text(
    (x2 + pad + 45, cy - 60), 'label text',
    fill=color, font=font, stroke_width=1, stroke_fill=color
)

img.save('annotated.png')

Annotation algorithmique — `annotate.py`

Pour les images avec plusieurs éléments à annoter, utilisez le module annotate.py ci-dessous. Sauvegardez-le à côté de votre script et importez-le. Il gère automatiquement le placement des labels sans chevauchement.

Démarrage rapide

from annotate import annotate_image

result = annotate_image(
    'screenshot.png',
    [
        {'elem': (560, 275, 635, 390), 'label': 'button', 'draw_box': True},
        {'elem': (105, 453, 236, 470), 'label': 'status text'},
    ],
    debug=True,
)
result.save('annotated.png')

elem: (x1, y1, x2, y2) boîte englobante serrée — doit être exactement les coordonnées en pixels
label: texte du label (supporte \n pour le multi-ligne)
draw_box: si True, dessine un rectangle arrondi autour de l'élément. Si False (défaut), dessine une pointe de flèche-V pointant vers l'élément
debug: affiche les rectangles de ciblage et la heatmap candidate pour la validation du placement

Helper de grille de coordonnées

Utilisez toujours grid_image() avant d'annoter une image non familière. Les aperçus réduits affichent des images plus petites que les vraies dimensions en pixels — l'erreur s'accumule à mesure que vous vous éloignez de (0,0).

from annotate import grid_image

grid = grid_image('screenshot.png', step=100)
grid.save('grid.png')

Ensuite, vérifiez avec de petites cultures :

from PIL import Image
img = Image.open('screenshot.png')
crop = img.crop((x1 - 20, y1 - 20, x2 + 20, y2 + 20))
crop.save('verify.png')

Aperçu de l'algorithme

Recherche en anneau : candidates entre MIN_ARROW (25px) et MAX_ARROW (120px) du bord de l'élément
Scoring de contraste : préfère les placements où le texte du label est lisible — abs(avg_brightness - 147) - std * 0.3 - dist * 0.02
Résolution conjointe : candidates calculées indépendamment, placées goulûment (meilleur score en premier)
Blocs durs : les labels ne peuvent pas chevaucher la boîte d'élément ou d'espace respirable d'une autre annotation
Pénalité de proximité : les labels à moins de 40px d'autres boîtes placées reçoivent une pénalité de score
Pénalité de croisement de flèche : -50 pour les flèches qui croisent des flèches déjà placées

Couleurs du mode debug

Couleur	Signification
Cyan	Boîte d'élément cible (elem + padding)
Gris	Zone d'exclusion (buffer MIN_ARROW)
Rouge→Vert	Heatmap candidate (rouge=mauvais, vert=bon)
Magenta	Position du label choisie
Orange	Annotation finale rendue

Styles de flèche

draw_box=True : rectangle arrondi + ligne droite jusqu'au label, pas de pointe
draw_box=False : pointe de flèche en V avec extrémités arrondies

`annotate.py` — module complet

Sauvegardez ceci comme annotate.py et importez-le :

"""
Annotation algorithmique de screenshots avec placement automatique de labels.

pip install Pillow numpy
Optionnel pour diff_images: pip install scipy
"""
import math
import numpy as np
from PIL import Image, ImageDraw, ImageFont

# --- Valeurs par défaut ---
DEFAULT_FONT = 'C:/Windows/Fonts/Inkfree.ttf'
DEFAULT_FONT_SIZE = 32
DEFAULT_COLOR = '#FF9F1C'
DEFAULT_STROKE = 5
MIN_ARROW = 25
MAX_ARROW = 120
TEXT_PAD = 6
BREATH = 18
CROSSING_PENALTY = 50
PROXIMITY_MARGIN = 40
PROXIMITY_PENALTY = 50


def _rect_intersects(a, b):
    return a[0] < b[2] and a[2] > b[0] and a[1] < b[3] and a[3] > b[1]


def _segments_intersect(p1, p2, p3, p4):
    def cross(o, a, b):
        return (a[0] - o[0]) * (b[1] - o[1]) - (a[1] - o[1]) * (b[0] - o[0])
    d1, d2 = cross(p3, p4, p1), cross(p3, p4, p2)
    d3, d4 = cross(p1, p2, p3), cross(p1, p2, p4)
    return ((d1 > 0 and d2 < 0) or (d1 < 0 and d2 > 0)) and \
           ((d3 > 0 and d4 < 0) or (d3 < 0 and d4 > 0))


def _line_rect_exit(cx, cy, tx, ty, rect):
    x1, y1, x2, y2 = rect
    dx, dy = tx - cx, ty - cy
    tmin, tmax = 0.0, 1.0
    for lo, hi, p, d in [(x1, x2, cx, dx), (y1, y2, cy, dy)]:
        if abs(d) < 1e-9:
            continue
        t0, t1 = (lo - p) / d, (hi - p) / d
        if t0 > t1:
            t0, t1 = t1, t0
        tmin, tmax = max(tmin, t0), min(tmax, t1)
    return (cx + dx * tmax, cy + dy * tmax)


def _rect_gap(a, b):
    dx = max(a[0] - b[2], b[0] - a[2], 0)
    dy = max(a[1] - b[3], b[1] - a[3], 0)
    if dx == 0 and dy == 0:
        return 0
    return math.sqrt(dx**2 + dy**2)


def _find_candidates(pixels, W, H, cyan, pw, ph, font):
    cx, cy = (cyan[0] + cyan[2]) / 2, (cyan[1] + cyan[3]) / 2
    excl_zone = (cyan[0] - MIN_ARROW, cyan[1] - MIN_ARROW,
                 cyan[2] + MIN_ARROW, cyan[3] + MIN_ARROW)
    sx1 = max(0, cyan[0] - MAX_ARROW - pw)
    sy1 = max(0, cyan[1] - MAX_ARROW - ph)
    sx2 = min(W - pw, cyan[2] + MAX_ARROW)
    sy2 = min(H - ph, cyan[3] + MAX_ARROW)
    step_x = max(8, min(pw // 2, MAX_ARROW // 3))
    step_y = max(8, min(ph // 2, MAX_ARROW // 3))
    cands = []
    for px in range(sx1, sx2, step_x):
        for py in range(sy1, sy2, step_y):
            pink = (px, py, px + pw, py + ph)
            if _rect_intersects(pink, excl_zone):
                continue
            gl, gr = cyan[0] - pink[2], pink[0] - cyan[2]
            gt, gb = cyan[1] - pink[3], pink[1] - cyan[3]
            hd, vd = max(gl, gr, 0), max(gt, gb, 0)
            ed = math.sqrt(hd**2 + vd**2) if (hd > 0 and vd > 0) else max(hd, vd)
            if ed > MAX_ARROW:
                continue
            region = pixels[py:py + ph, px:px + pw, :3].astype(float)
            score = abs(np.mean(region) - 147) - np.std(region) * 0.3
            dist = math.sqrt((px + pw/2 - cx)**2 + (py + ph/2 - cy)**2)
            score -= dist * 0.02
            cands.append(((px, py), score))
    return cands


def _resolve_placements(annots, font):
    placed = []
    all_elem_zones = []
    for ann in annots:
        all_elem_zones.append(ann['cyan'])
        if ann.get('draw_box', False):
            c = ann['cyan']
            all_elem_zones.append((c[0]-BREATH, c[1]-BREATH, c[2]+BREATH, c[3]+BREATH))
    for ann in sorted(annots, key=lambda a: -a['best_score']):
        pw, ph = ann['pw'], ann['ph']
        cyan = ann['cyan']
        cx, cy = ann['cyan_center']
        draw_box = ann.get('draw_box', False)
        best_pos, best_score = None, -999
        valid = []
        for (px, py), score in ann['candidates']:
            pink = (px, py, px + pw, py + ph)
            ok = True
            for ez in all_elem_zones:
                if ez == cyan:
                    continue
                if ann.get('draw_box', False):
                    own_viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
                    if ez == own_viz:
                        continue
                if _rect_intersects(pink, ez):
                    ok = False; break
            if not ok:
                continue
            for p_pink, p_excl, p_viz, _ in placed:
                if _rect_intersects(pink, p_pink) or _rect_intersects(pink, p_excl):
                    ok = False; break
                if p_viz and _rect_intersects(pink, p_viz):
                    ok = False; break
            if not ok:
                continue
            for p_pink, p_excl, p_viz, _ in placed:
                for rect in [p_pink, p_excl, p_viz]:
                    if rect is None:
                        continue
                    gap = _rect_gap(pink, rect)
                    if gap < PROXIMITY_MARGIN:
                        score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
            for ez in all_elem_zones:
                if ez == cyan:
                    continue
                gap = _rect_gap(pink, ez)
                if gap < PROXIMITY_MARGIN:
                    score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
            tcx, tcy = px + pw/2, py + ph/2
            cand_start = _line_rect_exit(tcx, tcy, cx, cy, pink)
            if draw_box:
                viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
                cand_end = _line_rect_exit(cx, cy, tcx, tcy, viz)
            else:
                cand_end = _line_rect_exit(cx, cy, tcx, tcy, cyan)
            for _, _, _, pa in placed:
                if pa and _segments_intersect(cand_start, cand_end, pa[0], pa[1]):
                    score -= CROSSING_PENALTY; break
            valid.append(((px, py), score))
            if score > best_score:
                best_score, best_pos = score, (px, py)
        ann['valid_candidates'] = valid
        if best_pos is None:
            ann['pink'] = ann['tpos'] = ann['astart'] = ann['aend'] = ann['viz'] = None
            continue
        px, py = best_pos
        pink = (px, py, px + pw, py + ph)
        ann['pink'] = pink
        ann['tpos'] = (px + TEXT_PAD, py + TEXT_PAD)
        tcx, tcy = px + pw/2, py + ph/2
        ann['astart'] = _line_rect_exit(tcx, tcy, cx, cy, pink)
        if draw_box:
            viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
            ann['viz'] = viz
            ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, viz)
        else:
            ann['viz'] = None
            ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, cyan)
        placed.append((pink, ann['excl_zone'], ann['viz'], (ann['astart'], ann['aend'])))


def _draw_debug(img, annots, color):
    overlay = Image.new('RGBA', img.size, (0, 0, 0, 0))
    od = ImageDraw.Draw(overlay)
    for ann in annots:
        cands = ann.get('valid_candidates', ann['candidates'])
        if not cands:
            continue
        pw, ph = ann['pw'], ann['ph']
        scores = [s for _, s in cands]
        smin, smax = min(scores), max(scores)
        rng = smax - smin if smax > smin else 1
        for (px, py), score in cands:
            t = (score - smin) / rng
            if t < 0.5:
                r_c, g_c, b_c = 220, int(180 * (t * 2)), 0
            else:
                r_c, g_c, b_c = int(220 * (1 - (t-0.5)*2)), 200, 0
            alpha_fill = int(40 + 70 * t)
            alpha_out = int(80 + 120 * t)
            od.rectangle((px, py, px + pw, py + ph),
                         fill=(r_c, g_c, b_c, alpha_fill), outline=(r_c, g_c, b_c, alpha_out), width=1)
    for ann in annots:
        ez = ann['excl_zone']
        od.rectangle(ez, fill=(120, 120, 120, 50), outline=(160, 160, 160, 160), width=1)
        od.rectangle(ann['cyan'], fill=(0, 255, 255, 30), outline=(0, 255, 255, 180), width=2)
        if ann.get('pink'):
            od.rectangle(ann['pink'], fill=(255, 0, 255, 50),
                         outline=(255, 0, 255, 180), width=2)
    return Image.alpha_composite(img, overlay)


def _draw_annotations(img, annots, font, color, stroke_width):
    draw = ImageDraw.Draw(img)
    for ann in annots:
        if ann.get('viz'):
            draw.rounded_rectangle(ann['viz'], radius=12, outline=color, width=stroke_width)
        tpos = ann.get('tpos')
        astart, aend = ann.get('astart'), ann.get('aend')
        if not (tpos and astart and aend):
            continue
        sx, sy = int(astart[0]), int(astart[1])
        ex, ey = int(aend[0]), int(aend[1])
        draw.line([(sx, sy), (ex, ey)], fill=color, width=4, joint='curve')
        r = 2
        draw.ellipse([(sx-r, sy-r), (sx+r, sy+r)], fill=color)
        draw.ellipse([(ex-r, ey-r), (ex+r, ey+r)], fill=color)
        if not ann.get('draw_box', False):
            angle = math.atan2(ey - sy, ex - sx)
            al, spread = 18, 0.45
            ax = ex - al * math.cos(angle - spread)
            ay = ey - al * math.sin(angle - spread)
            bx = ex - al * math.cos(angle + spread)
            by = ey - al * math.sin(angle + spread)
            draw.line([(int(ax), int(ay)), (ex, ey)], fill=color, width=4)
            draw.line([(int(bx), int(by)), (ex, ey)], fill=color, width=4)
            for px_, py_ in [(int(ax), int(ay)), (int(bx), int(by))]:
                draw.ellipse([(px_-r, py_-r), (px_+r, py_+r)], fill=color)
        draw.text(tpos, ann['label'], fill=color, font=font,
                  stroke_width=1, stroke_fill=color)
    return img


def annotate_image(image_path, annotations, *,
                   debug=False,
                   font_path=DEFAULT_FONT,
                   font_size=DEFAULT_FONT_SIZE,
                   color=DEFAULT_COLOR,
                   stroke_width=DEFAULT_STROKE):
    """
    Annoter une capture d'écran avec placement automatique de labels.

    Args:
        image_path: chemin vers l'image d'entrée
        annotations: liste de dicts avec les clés :
            - elem: (x1, y1, x2, y2) boîte englobante serrée de l'élément
            - label: chaîne texte du label
            - draw_box: (optionnel, défaut False) dessiner un rect arrondi autour de l'élément
        debug: si True, dessiner les rectangles développeur (cyan/pink/gris/heatmap)
        font_path: chemin vers le fichier de police TTF
        font_size: taille de police en pixels
        color: couleur hex pour les annotations (défaut orange #FF9F1C)
        stroke_width: largeur du contour du rectangle de surbrillance orange

    Returns:
        PIL.Image avec les annotations dessinées
    """
    font = ImageFont.truetype(font_path, font_size)
    img = Image.open(image_path).convert('RGBA')
    pixels = np.array(img)
    W, H = img.size
    annots = []
    for i, spec in enumerate(annotations):
        eb = spec['elem']
        em_pad = min(20, max(10, (eb[2] - eb[0]) // 10))
        cyan = (eb[0] - em_pad, eb[1] - em_pad, eb[2] + em_pad, eb[3] + em_pad)
        lines = spec['label'].split('\n')
        tw = max(font.getbbox(line)[2] - font.getbbox(line)[0] for line in lines)
        line_h = font.getbbox('Ay')[3] - font.getbbox('Ay')[0]
        th = line_h * len(lines) + 4 * (len(lines) - 1)
        pw, ph = tw + 2 * TEXT_PAD, th + 2 * TEXT_PAD
        cands = _find_candidates(pixels, W, H, cyan, pw, ph, font)
        annots.append({
            'id': i,
            'label': spec['label'],
            'draw_box': spec.get('draw_box', False),
            'cyan': cyan,
            'cyan_center': ((cyan[0]+cyan[2])/2, (cyan[1]+cyan[3])/2),
            'excl_zone': (cyan[0]-MIN_ARROW, cyan[1]-MIN_ARROW,
                          cyan[2]+MIN_ARROW, cyan[3]+MIN_ARROW),
            'pw': pw, 'ph': ph,
            'candidates': cands,
            'best_score': max((s for _, s in cands), default=-999),
        })
    _resolve_placements(annots, font)
    annots.sort(key=lambda a: a['id'])
    if debug:
        img = _draw_debug(img, annots, color)
    img = _draw_annotations(img, annots, font, color, stroke_width)
    return img


def diff_images(before_path, after_path, *, threshold=30, min_pixels=300,
                dilate=5, debug=False):
    """Trouver les régions modifiées entre deux captures d'écran et retourner les boîtes de clusters.

    Retourne (clusters, debug_img_or_None):
        clusters: liste de (x1, y1, x2, y2, pixel_count) triée de la plus grande à la plus petite
        debug_img: si debug=True, PIL Image avec heatmap overlay et boîtes de clusters
    """
    from scipy import ndimage
    img_a = Image.open(before_path).convert('RGB')
    img_b = Image.open(after_path).convert('RGB')
    if img_a.size != img_b.size:
        raise ValueError(f"Les tailles d'images diffèrent : {img_a.size} vs {img_b.size}")
    arr_a = np.array(img_a, dtype=np.float32)
    arr_b = np.array(img_b, dtype=np.float32)
    W, H = img_a.size
    diff = np.abs(arr_b - arr_a).max(axis=2)
    mask = diff > threshold
    dilated = ndimage.binary_dilation(mask, iterations=dilate)
    labeled, n_clusters = ndimage.label(dilated)
    clusters = []
    for i in range(1, n_clusters + 1):
        ys, xs = np.where(labeled == i)
        if len(ys) < min_pixels:
            continue
        clusters.append((int(xs.min()), int(ys.min()),
                          int(xs.max()), int(ys.max()), len(ys)))
    clusters.sort(key=lambda c: -c[4])
    debug_img = None
    if debug:
        overlay = img_b.copy().convert('RGBA')
        norm = np.clip(diff / 255.0, 0, 1)
        show_mask = diff > 10
        r = np.clip((norm * 2) * 255, 0, 255).astype(np.uint8)
        g = np.clip((1 - np.abs(norm - 0.5) * 2) * 200, 0, 200).astype(np.uint8)
        b = np.clip((1 - norm) * 255, 0, 255).astype(np.uint8)
        a = np.where(show_mask, np.clip(norm * 200 + 40, 40, 220).astype(np.uint8), 0)
        heat = Image.fromarray(np.stack([r, g, b, a], axis=2), 'RGBA')
        overlay = Image.alpha_composite(overlay, heat)
        draw = ImageDraw.Draw(overlay)
        try:
            font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 18)
        except OSError:
            font = ImageFont.load_default()
        for idx, (x1, y1, x2, y2, px_count) in enumerate(clusters):
            draw.rectangle([x1, y1, x2, y2], outline=(0, 255, 255, 200), width=3)
            label = f"#{idx+1}  {px_count:,}px"
            bbox = font.getbbox(label)
            tw, th = bbox[2] - bbox[0], bbox[3] - bbox[1]
            lx, ly = x1, max(0, y1 - th - 8)
            draw.rectangle([lx, ly, lx + tw + 8, ly + th + 4], fill=(0, 0, 0, 180))
            draw.text((lx + 4, ly + 2), label, fill=(0, 255, 255, 255), font=font)
        debug_img = overlay
    return clusters, debug_img


def grid_image(image_path, step=100):
    """Dessiner une grille de coordonnées sur une image pour localiser précisément les éléments."""
    img = Image.open(image_path).convert('RGBA')
    draw = ImageDraw.Draw(img)
    W, H = img.size
    try:
        font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 14)
    except OSError:
        font = ImageFont.load_default()
    for x in range(0, W, step):
        draw.line([(x, 0), (x, H)], fill=(255, 0, 0, 120), width=1)
        draw.text((x + 2, 2), str(x), fill=(255, 0, 0, 200), font=font)
    for y in range(0, H, step):
        draw.line([(0, y), (W, y)], fill=(255, 0, 0, 120), width=1)
        draw.text((2, y + 2), str(y), fill=(255, 0, 0, 200), font=font)
    return img

Comparaison d'images

Trouvez ce qui a changé entre deux captures d'écran de manière programmatique. À utiliser comme filet de sécurité pour les changements subtils — quand la différence est évidente, annotez directement à la place.

from annotate import diff_images

clusters, debug_img = diff_images(
    'before.png', 'after.png',
    threshold=30,     # seuil de différence de pixels (0-255)
    min_pixels=300,   # ignorer les petits clusters de bruit
    dilate=5,         # fusionner les pixels modifiés proches
    debug=True,       # rendre heatmap overlay
)

# clusters = [(x1, y1, x2, y2, pixel_count), ...] triée de la plus grande à la plus petite
if debug_img:
    debug_img.save('diff-debug.png')

# Alimenter les clusters dans annotate_image :
annotations = [
    {'elem': (x1, y1, x2, y2), 'label': f'Change #{i+1}', 'draw_box': True}
    for i, (x1, y1, x2, y2, _) in enumerate(clusters[:3])
]

Couleurs de heatmap debug : Bleu = petite différence, Jaune = moyenne, Rouge = grande, Boîtes Cyan = boîtes englobantes de clusters.

Quand utiliser : changements subtils d'opacité, lignes pointillées, petits décalages de couleur, différences d'anti-aliasing. Quand NE PAS utiliser : tout changement que vous pouvez voir à l'œil nu — annotez directement pour des labels meilleurs.

Annotations GIF animés

Différentes des images statiques — les animations ont du timing, des transitions et du mouvement visuel en concurrence.

Mise en évidence d'éléments

Rectangles pour les grandes zones, flèches pour les petits éléments — zone 500x300px = rect, élément 200x25px = flèche
Les labels vont À CÔTÉ de ce qu'ils décrivent — flèche courte (30-80px), label adjacent. L'œil du spectateur ne devrait pas parcourir plus d'environ 100px
La flèche ne doit pas traverser son propre label — choisir le bord le plus proche de la cible
Pas de barre inférieure / approche sous-titre — les yeux sautent entre le contenu et la barre. Placement contextuel uniquement
Le message héros obtient une police plus grande — principal takeaway 64pt+, annotations détaillées 38pt

Timing et rythme

Fade : pop-in 2-frame à 10fps — 50% → 100% opacité (0,2s total). Les courbes de lissage sont moches à faible FPS
Type → pause → annoter — pendant une action rapide, afficher AUCUNE annotation. Pause, puis l'ajouter
Durée de frame variable — rapide pendant l'action (100ms), lent pendant les pauses (600-800ms), long hold pour le héros (500ms)
FPS plus élevé pour un mouvement lisse — minimum 10fps pour la dactylographie/interaction

Implémentation du pop-in fade

# 2-frame pop-in à 10fps
FADE_ALPHAS = [0.50, 1.00]

for frame_idx in range(total_frames):
    if annotation_just_changed and local_idx < len(FADE_ALPHAS):
        alpha = FADE_ALPHAS[local_idx]
    else:
        alpha = 1.0
    # Appliquer l'alpha aux éléments d'annotation :
    # - fond de pill : fill=(r, g, b, int(base_alpha * alpha))
    # - texte : fill=(*color, int(255 * alpha))
    # - contour du rect : outline=(*color, int(255 * alpha))

Directives

Tous les éléments même épaisseur — rect width, line width et le poids visuel du texte doivent sembler cohérents (~5px)
Placer les labels proches du rectangle — ligne de leader courte (25-35px)
Les labels peuvent chevaucher le contenu — le trait donne assez de contraste
Afficher localement d'abord — vérifier avant de télécharger sur une PR
Prendre les captures d'écran à 1x natif, contrôler la taille d'affichage en HTML — utiliser <img width="300"> en markdown, ne jamais redimensionner avec PIL (crée des artefacts)
Toujours vérifier Image.open(path).size en premier — les captures d'écran HiDPI sont plus grandes qu'elles n'apparaissent (mise à l'échelle 150% = dimensions de pixels CSS 1,5x)
Les courts labels fonctionnent mieux — les labels larges ont moins de placements valides. Utiliser 1-3 mots si possible
Vérifier avec debug=True — toujours vérifier la première annotation d'une nouvelle image en mode debug

Limitations

La police Ink Free est uniquement Windows ; les autres plateformes ont besoin d'une police de secours
Le rendu de texte PIL est basique — pas de texte riche, pas de markdown
Les annotations GIF animés nécessitent un traitement image par image ce qui peut être lent pour les longues enregistrements
Le placement algorithmique fonctionne mieux avec 2-6 annotations ; plus que cela peut produire des résultats encombrés

image-annotations

Annotations d'images

Quand utiliser cette compétence

Prérequis

Règles de couleurs

Police

Formes

Snippet de référence

Annotation algorithmique — `annotate.py`

Démarrage rapide

Helper de grille de coordonnées

Aperçu de l'algorithme

Couleurs du mode debug

Styles de flèche

`annotate.py` — module complet

Comparaison d'images

Annotations GIF animés

Mise en évidence d'éléments

Timing et rythme

Implémentation du pop-in fade

Directives

Limitations

Skills similaires

Annotations d'images

Quand utiliser cette compétence

Prérequis

Règles de couleurs

Police

Formes

Snippet de référence

Annotation algorithmique — annotate.py

Démarrage rapide

Helper de grille de coordonnées

Aperçu de l'algorithme

Couleurs du mode debug

Styles de flèche

annotate.py — module complet

Comparaison d'images

Annotations GIF animés

Mise en évidence d'éléments

Timing et rythme

Implémentation du pop-in fade

Directives

Limitations

Skills similaires

Annotation algorithmique — `annotate.py`

`annotate.py` — module complet