image-annotations

Par github · awesome-copilot

Annotez des captures d'écran, des diagrammes et des images avec des rectangles de légende, des flèches, des étiquettes et des surlignages en couleur à l'aide de PIL. Inclut des règles pour les annotations de GIF animés avec gestion du timing et du rythme.

npx skills add https://github.com/github/awesome-copilot --skill image-annotations

Annotations d'images

Ajoutez des légendes visuelles à n'importe quelle image — captures d'écran, diagrammes, docs d'architecture, frames de démo — en utilisant PIL/Pillow. Mettez en évidence ce qui a changé ou ce qu'il faut regarder, pour que les relecteurs n'aient pas à deviner.

Quand utiliser cette compétence

Utilisez cette compétence quand vous avez besoin de :

  • Mettre en évidence une zone spécifique dans une capture d'écran pour une description de PR
  • Annoter des images avant/après pour montrer ce qui a changé
  • Ajouter des labels et des légendes à des diagrammes ou images d'architecture
  • Créer des frames annotées pour des démos GIF animés

Prérequis

pip install Pillow -q

Règles de couleurs

  • Rouge (#E63946) — uniquement pour les choses « mauvaises » / « supprimées » (ex : encercler un bug en cours de correction)
  • Jaune-orange (#FF9F1C) — pour les mises en évidence neutres (« regardez ici », « nouvelle fonctionnalité », etc.)
  • N'utilisez jamais le rouge juste parce que c'est attrayant — rouge = mauvais/supprimé

Police

  • Utilisez Ink Free (C:/Windows/Fonts/Inkfree.ttf) pour un look manuscrit sur Windows
  • Sur Linux/macOS, utilisez ImageFont.load_default()
  • Taille 36 pour les annotations sur des images d'environ 1400px de large
  • stroke_width=1 avec stroke_fill=<même couleur que fill> — donne du corps sans être trop épais
  • N'utilisez PAS de trait blanc — ça ressemble à un mauvais effet de lueur

Formes

  • Préférez les rectangles arrondis aux cercles/ellipses — moins de pixelisation aux bords
  • draw.rounded_rectangle([x1, y1, x2, y2], radius=14, outline=color, width=5)
  • Padding 18px autour du contenu cible

Snippet de référence

from PIL import Image, ImageDraw, ImageFont

# Setup
font = ImageFont.truetype('C:/Windows/Fonts/Inkfree.ttf', 36)  # ou load_default()
color = '#FF9F1C'  # orange pour les mises en évidence
stroke = 5
pad = 18

img = Image.open('screenshot.png')
draw = ImageDraw.Draw(img)

# Rectangle arrondi avec padding
draw.rounded_rectangle(
    [x1 - pad, y1 - pad, x2 + pad, y2 + pad],
    radius=14, outline=color, width=stroke
)

# Ligne de leader (même épaisseur que le rectangle)
draw.line([x2 + pad, cy, x2 + pad + 40, cy - 30], fill=color, width=stroke)

# Label — trait de même couleur pour le corps, PAS de trait blanc
draw.text(
    (x2 + pad + 45, cy - 60), 'label text',
    fill=color, font=font, stroke_width=1, stroke_fill=color
)

img.save('annotated.png')

Annotation algorithmique — annotate.py

Pour les images avec plusieurs éléments à annoter, utilisez le module annotate.py ci-dessous. Sauvegardez-le à côté de votre script et importez-le. Il gère automatiquement le placement des labels sans chevauchement.

Démarrage rapide

from annotate import annotate_image

result = annotate_image(
    'screenshot.png',
    [
        {'elem': (560, 275, 635, 390), 'label': 'button', 'draw_box': True},
        {'elem': (105, 453, 236, 470), 'label': 'status text'},
    ],
    debug=True,
)
result.save('annotated.png')
  • elem: (x1, y1, x2, y2) boîte englobante serrée — doit être exactement les coordonnées en pixels
  • label: texte du label (supporte \n pour le multi-ligne)
  • draw_box: si True, dessine un rectangle arrondi autour de l'élément. Si False (défaut), dessine une pointe de flèche-V pointant vers l'élément
  • debug: affiche les rectangles de ciblage et la heatmap candidate pour la validation du placement

Helper de grille de coordonnées

Utilisez toujours grid_image() avant d'annoter une image non familière. Les aperçus réduits affichent des images plus petites que les vraies dimensions en pixels — l'erreur s'accumule à mesure que vous vous éloignez de (0,0).

from annotate import grid_image

grid = grid_image('screenshot.png', step=100)
grid.save('grid.png')

Ensuite, vérifiez avec de petites cultures :

from PIL import Image
img = Image.open('screenshot.png')
crop = img.crop((x1 - 20, y1 - 20, x2 + 20, y2 + 20))
crop.save('verify.png')

Aperçu de l'algorithme

  1. Recherche en anneau : candidates entre MIN_ARROW (25px) et MAX_ARROW (120px) du bord de l'élément
  2. Scoring de contraste : préfère les placements où le texte du label est lisible — abs(avg_brightness - 147) - std * 0.3 - dist * 0.02
  3. Résolution conjointe : candidates calculées indépendamment, placées goulûment (meilleur score en premier)
  4. Blocs durs : les labels ne peuvent pas chevaucher la boîte d'élément ou d'espace respirable d'une autre annotation
  5. Pénalité de proximité : les labels à moins de 40px d'autres boîtes placées reçoivent une pénalité de score
  6. Pénalité de croisement de flèche : -50 pour les flèches qui croisent des flèches déjà placées

Couleurs du mode debug

Couleur Signification
Cyan Boîte d'élément cible (elem + padding)
Gris Zone d'exclusion (buffer MIN_ARROW)
Rouge→Vert Heatmap candidate (rouge=mauvais, vert=bon)
Magenta Position du label choisie
Orange Annotation finale rendue

Styles de flèche

  • draw_box=True : rectangle arrondi + ligne droite jusqu'au label, pas de pointe
  • draw_box=False : pointe de flèche en V avec extrémités arrondies

annotate.py — module complet

Sauvegardez ceci comme annotate.py et importez-le :

"""
Annotation algorithmique de screenshots avec placement automatique de labels.

pip install Pillow numpy
Optionnel pour diff_images: pip install scipy
"""
import math
import numpy as np
from PIL import Image, ImageDraw, ImageFont

# --- Valeurs par défaut ---
DEFAULT_FONT = 'C:/Windows/Fonts/Inkfree.ttf'
DEFAULT_FONT_SIZE = 32
DEFAULT_COLOR = '#FF9F1C'
DEFAULT_STROKE = 5
MIN_ARROW = 25
MAX_ARROW = 120
TEXT_PAD = 6
BREATH = 18
CROSSING_PENALTY = 50
PROXIMITY_MARGIN = 40
PROXIMITY_PENALTY = 50


def _rect_intersects(a, b):
    return a[0] < b[2] and a[2] > b[0] and a[1] < b[3] and a[3] > b[1]


def _segments_intersect(p1, p2, p3, p4):
    def cross(o, a, b):
        return (a[0] - o[0]) * (b[1] - o[1]) - (a[1] - o[1]) * (b[0] - o[0])
    d1, d2 = cross(p3, p4, p1), cross(p3, p4, p2)
    d3, d4 = cross(p1, p2, p3), cross(p1, p2, p4)
    return ((d1 > 0 and d2 < 0) or (d1 < 0 and d2 > 0)) and \
           ((d3 > 0 and d4 < 0) or (d3 < 0 and d4 > 0))


def _line_rect_exit(cx, cy, tx, ty, rect):
    x1, y1, x2, y2 = rect
    dx, dy = tx - cx, ty - cy
    tmin, tmax = 0.0, 1.0
    for lo, hi, p, d in [(x1, x2, cx, dx), (y1, y2, cy, dy)]:
        if abs(d) < 1e-9:
            continue
        t0, t1 = (lo - p) / d, (hi - p) / d
        if t0 > t1:
            t0, t1 = t1, t0
        tmin, tmax = max(tmin, t0), min(tmax, t1)
    return (cx + dx * tmax, cy + dy * tmax)


def _rect_gap(a, b):
    dx = max(a[0] - b[2], b[0] - a[2], 0)
    dy = max(a[1] - b[3], b[1] - a[3], 0)
    if dx == 0 and dy == 0:
        return 0
    return math.sqrt(dx**2 + dy**2)


def _find_candidates(pixels, W, H, cyan, pw, ph, font):
    cx, cy = (cyan[0] + cyan[2]) / 2, (cyan[1] + cyan[3]) / 2
    excl_zone = (cyan[0] - MIN_ARROW, cyan[1] - MIN_ARROW,
                 cyan[2] + MIN_ARROW, cyan[3] + MIN_ARROW)
    sx1 = max(0, cyan[0] - MAX_ARROW - pw)
    sy1 = max(0, cyan[1] - MAX_ARROW - ph)
    sx2 = min(W - pw, cyan[2] + MAX_ARROW)
    sy2 = min(H - ph, cyan[3] + MAX_ARROW)
    step_x = max(8, min(pw // 2, MAX_ARROW // 3))
    step_y = max(8, min(ph // 2, MAX_ARROW // 3))
    cands = []
    for px in range(sx1, sx2, step_x):
        for py in range(sy1, sy2, step_y):
            pink = (px, py, px + pw, py + ph)
            if _rect_intersects(pink, excl_zone):
                continue
            gl, gr = cyan[0] - pink[2], pink[0] - cyan[2]
            gt, gb = cyan[1] - pink[3], pink[1] - cyan[3]
            hd, vd = max(gl, gr, 0), max(gt, gb, 0)
            ed = math.sqrt(hd**2 + vd**2) if (hd > 0 and vd > 0) else max(hd, vd)
            if ed > MAX_ARROW:
                continue
            region = pixels[py:py + ph, px:px + pw, :3].astype(float)
            score = abs(np.mean(region) - 147) - np.std(region) * 0.3
            dist = math.sqrt((px + pw/2 - cx)**2 + (py + ph/2 - cy)**2)
            score -= dist * 0.02
            cands.append(((px, py), score))
    return cands


def _resolve_placements(annots, font):
    placed = []
    all_elem_zones = []
    for ann in annots:
        all_elem_zones.append(ann['cyan'])
        if ann.get('draw_box', False):
            c = ann['cyan']
            all_elem_zones.append((c[0]-BREATH, c[1]-BREATH, c[2]+BREATH, c[3]+BREATH))
    for ann in sorted(annots, key=lambda a: -a['best_score']):
        pw, ph = ann['pw'], ann['ph']
        cyan = ann['cyan']
        cx, cy = ann['cyan_center']
        draw_box = ann.get('draw_box', False)
        best_pos, best_score = None, -999
        valid = []
        for (px, py), score in ann['candidates']:
            pink = (px, py, px + pw, py + ph)
            ok = True
            for ez in all_elem_zones:
                if ez == cyan:
                    continue
                if ann.get('draw_box', False):
                    own_viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
                    if ez == own_viz:
                        continue
                if _rect_intersects(pink, ez):
                    ok = False; break
            if not ok:
                continue
            for p_pink, p_excl, p_viz, _ in placed:
                if _rect_intersects(pink, p_pink) or _rect_intersects(pink, p_excl):
                    ok = False; break
                if p_viz and _rect_intersects(pink, p_viz):
                    ok = False; break
            if not ok:
                continue
            for p_pink, p_excl, p_viz, _ in placed:
                for rect in [p_pink, p_excl, p_viz]:
                    if rect is None:
                        continue
                    gap = _rect_gap(pink, rect)
                    if gap < PROXIMITY_MARGIN:
                        score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
            for ez in all_elem_zones:
                if ez == cyan:
                    continue
                gap = _rect_gap(pink, ez)
                if gap < PROXIMITY_MARGIN:
                    score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
            tcx, tcy = px + pw/2, py + ph/2
            cand_start = _line_rect_exit(tcx, tcy, cx, cy, pink)
            if draw_box:
                viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
                cand_end = _line_rect_exit(cx, cy, tcx, tcy, viz)
            else:
                cand_end = _line_rect_exit(cx, cy, tcx, tcy, cyan)
            for _, _, _, pa in placed:
                if pa and _segments_intersect(cand_start, cand_end, pa[0], pa[1]):
                    score -= CROSSING_PENALTY; break
            valid.append(((px, py), score))
            if score > best_score:
                best_score, best_pos = score, (px, py)
        ann['valid_candidates'] = valid
        if best_pos is None:
            ann['pink'] = ann['tpos'] = ann['astart'] = ann['aend'] = ann['viz'] = None
            continue
        px, py = best_pos
        pink = (px, py, px + pw, py + ph)
        ann['pink'] = pink
        ann['tpos'] = (px + TEXT_PAD, py + TEXT_PAD)
        tcx, tcy = px + pw/2, py + ph/2
        ann['astart'] = _line_rect_exit(tcx, tcy, cx, cy, pink)
        if draw_box:
            viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
            ann['viz'] = viz
            ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, viz)
        else:
            ann['viz'] = None
            ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, cyan)
        placed.append((pink, ann['excl_zone'], ann['viz'], (ann['astart'], ann['aend'])))


def _draw_debug(img, annots, color):
    overlay = Image.new('RGBA', img.size, (0, 0, 0, 0))
    od = ImageDraw.Draw(overlay)
    for ann in annots:
        cands = ann.get('valid_candidates', ann['candidates'])
        if not cands:
            continue
        pw, ph = ann['pw'], ann['ph']
        scores = [s for _, s in cands]
        smin, smax = min(scores), max(scores)
        rng = smax - smin if smax > smin else 1
        for (px, py), score in cands:
            t = (score - smin) / rng
            if t < 0.5:
                r_c, g_c, b_c = 220, int(180 * (t * 2)), 0
            else:
                r_c, g_c, b_c = int(220 * (1 - (t-0.5)*2)), 200, 0
            alpha_fill = int(40 + 70 * t)
            alpha_out = int(80 + 120 * t)
            od.rectangle((px, py, px + pw, py + ph),
                         fill=(r_c, g_c, b_c, alpha_fill), outline=(r_c, g_c, b_c, alpha_out), width=1)
    for ann in annots:
        ez = ann['excl_zone']
        od.rectangle(ez, fill=(120, 120, 120, 50), outline=(160, 160, 160, 160), width=1)
        od.rectangle(ann['cyan'], fill=(0, 255, 255, 30), outline=(0, 255, 255, 180), width=2)
        if ann.get('pink'):
            od.rectangle(ann['pink'], fill=(255, 0, 255, 50),
                         outline=(255, 0, 255, 180), width=2)
    return Image.alpha_composite(img, overlay)


def _draw_annotations(img, annots, font, color, stroke_width):
    draw = ImageDraw.Draw(img)
    for ann in annots:
        if ann.get('viz'):
            draw.rounded_rectangle(ann['viz'], radius=12, outline=color, width=stroke_width)
        tpos = ann.get('tpos')
        astart, aend = ann.get('astart'), ann.get('aend')
        if not (tpos and astart and aend):
            continue
        sx, sy = int(astart[0]), int(astart[1])
        ex, ey = int(aend[0]), int(aend[1])
        draw.line([(sx, sy), (ex, ey)], fill=color, width=4, joint='curve')
        r = 2
        draw.ellipse([(sx-r, sy-r), (sx+r, sy+r)], fill=color)
        draw.ellipse([(ex-r, ey-r), (ex+r, ey+r)], fill=color)
        if not ann.get('draw_box', False):
            angle = math.atan2(ey - sy, ex - sx)
            al, spread = 18, 0.45
            ax = ex - al * math.cos(angle - spread)
            ay = ey - al * math.sin(angle - spread)
            bx = ex - al * math.cos(angle + spread)
            by = ey - al * math.sin(angle + spread)
            draw.line([(int(ax), int(ay)), (ex, ey)], fill=color, width=4)
            draw.line([(int(bx), int(by)), (ex, ey)], fill=color, width=4)
            for px_, py_ in [(int(ax), int(ay)), (int(bx), int(by))]:
                draw.ellipse([(px_-r, py_-r), (px_+r, py_+r)], fill=color)
        draw.text(tpos, ann['label'], fill=color, font=font,
                  stroke_width=1, stroke_fill=color)
    return img


def annotate_image(image_path, annotations, *,
                   debug=False,
                   font_path=DEFAULT_FONT,
                   font_size=DEFAULT_FONT_SIZE,
                   color=DEFAULT_COLOR,
                   stroke_width=DEFAULT_STROKE):
    """
    Annoter une capture d'écran avec placement automatique de labels.

    Args:
        image_path: chemin vers l'image d'entrée
        annotations: liste de dicts avec les clés :
            - elem: (x1, y1, x2, y2) boîte englobante serrée de l'élément
            - label: chaîne texte du label
            - draw_box: (optionnel, défaut False) dessiner un rect arrondi autour de l'élément
        debug: si True, dessiner les rectangles développeur (cyan/pink/gris/heatmap)
        font_path: chemin vers le fichier de police TTF
        font_size: taille de police en pixels
        color: couleur hex pour les annotations (défaut orange #FF9F1C)
        stroke_width: largeur du contour du rectangle de surbrillance orange

    Returns:
        PIL.Image avec les annotations dessinées
    """
    font = ImageFont.truetype(font_path, font_size)
    img = Image.open(image_path).convert('RGBA')
    pixels = np.array(img)
    W, H = img.size
    annots = []
    for i, spec in enumerate(annotations):
        eb = spec['elem']
        em_pad = min(20, max(10, (eb[2] - eb[0]) // 10))
        cyan = (eb[0] - em_pad, eb[1] - em_pad, eb[2] + em_pad, eb[3] + em_pad)
        lines = spec['label'].split('\n')
        tw = max(font.getbbox(line)[2] - font.getbbox(line)[0] for line in lines)
        line_h = font.getbbox('Ay')[3] - font.getbbox('Ay')[0]
        th = line_h * len(lines) + 4 * (len(lines) - 1)
        pw, ph = tw + 2 * TEXT_PAD, th + 2 * TEXT_PAD
        cands = _find_candidates(pixels, W, H, cyan, pw, ph, font)
        annots.append({
            'id': i,
            'label': spec['label'],
            'draw_box': spec.get('draw_box', False),
            'cyan': cyan,
            'cyan_center': ((cyan[0]+cyan[2])/2, (cyan[1]+cyan[3])/2),
            'excl_zone': (cyan[0]-MIN_ARROW, cyan[1]-MIN_ARROW,
                          cyan[2]+MIN_ARROW, cyan[3]+MIN_ARROW),
            'pw': pw, 'ph': ph,
            'candidates': cands,
            'best_score': max((s for _, s in cands), default=-999),
        })
    _resolve_placements(annots, font)
    annots.sort(key=lambda a: a['id'])
    if debug:
        img = _draw_debug(img, annots, color)
    img = _draw_annotations(img, annots, font, color, stroke_width)
    return img


def diff_images(before_path, after_path, *, threshold=30, min_pixels=300,
                dilate=5, debug=False):
    """Trouver les régions modifiées entre deux captures d'écran et retourner les boîtes de clusters.

    Retourne (clusters, debug_img_or_None):
        clusters: liste de (x1, y1, x2, y2, pixel_count) triée de la plus grande à la plus petite
        debug_img: si debug=True, PIL Image avec heatmap overlay et boîtes de clusters
    """
    from scipy import ndimage
    img_a = Image.open(before_path).convert('RGB')
    img_b = Image.open(after_path).convert('RGB')
    if img_a.size != img_b.size:
        raise ValueError(f"Les tailles d'images diffèrent : {img_a.size} vs {img_b.size}")
    arr_a = np.array(img_a, dtype=np.float32)
    arr_b = np.array(img_b, dtype=np.float32)
    W, H = img_a.size
    diff = np.abs(arr_b - arr_a).max(axis=2)
    mask = diff > threshold
    dilated = ndimage.binary_dilation(mask, iterations=dilate)
    labeled, n_clusters = ndimage.label(dilated)
    clusters = []
    for i in range(1, n_clusters + 1):
        ys, xs = np.where(labeled == i)
        if len(ys) < min_pixels:
            continue
        clusters.append((int(xs.min()), int(ys.min()),
                          int(xs.max()), int(ys.max()), len(ys)))
    clusters.sort(key=lambda c: -c[4])
    debug_img = None
    if debug:
        overlay = img_b.copy().convert('RGBA')
        norm = np.clip(diff / 255.0, 0, 1)
        show_mask = diff > 10
        r = np.clip((norm * 2) * 255, 0, 255).astype(np.uint8)
        g = np.clip((1 - np.abs(norm - 0.5) * 2) * 200, 0, 200).astype(np.uint8)
        b = np.clip((1 - norm) * 255, 0, 255).astype(np.uint8)
        a = np.where(show_mask, np.clip(norm * 200 + 40, 40, 220).astype(np.uint8), 0)
        heat = Image.fromarray(np.stack([r, g, b, a], axis=2), 'RGBA')
        overlay = Image.alpha_composite(overlay, heat)
        draw = ImageDraw.Draw(overlay)
        try:
            font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 18)
        except OSError:
            font = ImageFont.load_default()
        for idx, (x1, y1, x2, y2, px_count) in enumerate(clusters):
            draw.rectangle([x1, y1, x2, y2], outline=(0, 255, 255, 200), width=3)
            label = f"#{idx+1}  {px_count:,}px"
            bbox = font.getbbox(label)
            tw, th = bbox[2] - bbox[0], bbox[3] - bbox[1]
            lx, ly = x1, max(0, y1 - th - 8)
            draw.rectangle([lx, ly, lx + tw + 8, ly + th + 4], fill=(0, 0, 0, 180))
            draw.text((lx + 4, ly + 2), label, fill=(0, 255, 255, 255), font=font)
        debug_img = overlay
    return clusters, debug_img


def grid_image(image_path, step=100):
    """Dessiner une grille de coordonnées sur une image pour localiser précisément les éléments."""
    img = Image.open(image_path).convert('RGBA')
    draw = ImageDraw.Draw(img)
    W, H = img.size
    try:
        font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 14)
    except OSError:
        font = ImageFont.load_default()
    for x in range(0, W, step):
        draw.line([(x, 0), (x, H)], fill=(255, 0, 0, 120), width=1)
        draw.text((x + 2, 2), str(x), fill=(255, 0, 0, 200), font=font)
    for y in range(0, H, step):
        draw.line([(0, y), (W, y)], fill=(255, 0, 0, 120), width=1)
        draw.text((2, y + 2), str(y), fill=(255, 0, 0, 200), font=font)
    return img

Comparaison d'images

Trouvez ce qui a changé entre deux captures d'écran de manière programmatique. À utiliser comme filet de sécurité pour les changements subtils — quand la différence est évidente, annotez directement à la place.

from annotate import diff_images

clusters, debug_img = diff_images(
    'before.png', 'after.png',
    threshold=30,     # seuil de différence de pixels (0-255)
    min_pixels=300,   # ignorer les petits clusters de bruit
    dilate=5,         # fusionner les pixels modifiés proches
    debug=True,       # rendre heatmap overlay
)

# clusters = [(x1, y1, x2, y2, pixel_count), ...] triée de la plus grande à la plus petite
if debug_img:
    debug_img.save('diff-debug.png')

# Alimenter les clusters dans annotate_image :
annotations = [
    {'elem': (x1, y1, x2, y2), 'label': f'Change #{i+1}', 'draw_box': True}
    for i, (x1, y1, x2, y2, _) in enumerate(clusters[:3])
]

Couleurs de heatmap debug : Bleu = petite différence, Jaune = moyenne, Rouge = grande, Boîtes Cyan = boîtes englobantes de clusters.

Quand utiliser : changements subtils d'opacité, lignes pointillées, petits décalages de couleur, différences d'anti-aliasing. Quand NE PAS utiliser : tout changement que vous pouvez voir à l'œil nu — annotez directement pour des labels meilleurs.

Annotations GIF animés

Différentes des images statiques — les animations ont du timing, des transitions et du mouvement visuel en concurrence.

Mise en évidence d'éléments

  1. Rectangles pour les grandes zones, flèches pour les petits éléments — zone 500x300px = rect, élément 200x25px = flèche
  2. Les labels vont À CÔTÉ de ce qu'ils décrivent — flèche courte (30-80px), label adjacent. L'œil du spectateur ne devrait pas parcourir plus d'environ 100px
  3. La flèche ne doit pas traverser son propre label — choisir le bord le plus proche de la cible
  4. Pas de barre inférieure / approche sous-titre — les yeux sautent entre le contenu et la barre. Placement contextuel uniquement
  5. Le message héros obtient une police plus grande — principal takeaway 64pt+, annotations détaillées 38pt

Timing et rythme

  1. Fade : pop-in 2-frame à 10fps — 50% → 100% opacité (0,2s total). Les courbes de lissage sont moches à faible FPS
  2. Type → pause → annoter — pendant une action rapide, afficher AUCUNE annotation. Pause, puis l'ajouter
  3. Durée de frame variable — rapide pendant l'action (100ms), lent pendant les pauses (600-800ms), long hold pour le héros (500ms)
  4. FPS plus élevé pour un mouvement lisse — minimum 10fps pour la dactylographie/interaction

Implémentation du pop-in fade

# 2-frame pop-in à 10fps
FADE_ALPHAS = [0.50, 1.00]

for frame_idx in range(total_frames):
    if annotation_just_changed and local_idx < len(FADE_ALPHAS):
        alpha = FADE_ALPHAS[local_idx]
    else:
        alpha = 1.0
    # Appliquer l'alpha aux éléments d'annotation :
    # - fond de pill : fill=(r, g, b, int(base_alpha * alpha))
    # - texte : fill=(*color, int(255 * alpha))
    # - contour du rect : outline=(*color, int(255 * alpha))

Directives

  1. Tous les éléments même épaisseur — rect width, line width et le poids visuel du texte doivent sembler cohérents (~5px)
  2. Placer les labels proches du rectangle — ligne de leader courte (25-35px)
  3. Les labels peuvent chevaucher le contenu — le trait donne assez de contraste
  4. Afficher localement d'abord — vérifier avant de télécharger sur une PR
  5. Prendre les captures d'écran à 1x natif, contrôler la taille d'affichage en HTML — utiliser <img width="300"> en markdown, ne jamais redimensionner avec PIL (crée des artefacts)
  6. Toujours vérifier Image.open(path).size en premier — les captures d'écran HiDPI sont plus grandes qu'elles n'apparaissent (mise à l'échelle 150% = dimensions de pixels CSS 1,5x)
  7. Les courts labels fonctionnent mieux — les labels larges ont moins de placements valides. Utiliser 1-3 mots si possible
  8. Vérifier avec debug=True — toujours vérifier la première annotation d'une nouvelle image en mode debug

Limitations

  • La police Ink Free est uniquement Windows ; les autres plateformes ont besoin d'une police de secours
  • Le rendu de texte PIL est basique — pas de texte riche, pas de markdown
  • Les annotations GIF animés nécessitent un traitement image par image ce qui peut être lent pour les longues enregistrements
  • Le placement algorithmique fonctionne mieux avec 2-6 annotations ; plus que cela peut produire des résultats encombrés

Skills similaires