Annotations d'images
Ajoutez des légendes visuelles à n'importe quelle image — captures d'écran, diagrammes, docs d'architecture, frames de démo — en utilisant PIL/Pillow. Mettez en évidence ce qui a changé ou ce qu'il faut regarder, pour que les relecteurs n'aient pas à deviner.
Quand utiliser cette compétence
Utilisez cette compétence quand vous avez besoin de :
- Mettre en évidence une zone spécifique dans une capture d'écran pour une description de PR
- Annoter des images avant/après pour montrer ce qui a changé
- Ajouter des labels et des légendes à des diagrammes ou images d'architecture
- Créer des frames annotées pour des démos GIF animés
Prérequis
pip install Pillow -q
Règles de couleurs
- Rouge (
#E63946) — uniquement pour les choses « mauvaises » / « supprimées » (ex : encercler un bug en cours de correction) - Jaune-orange (
#FF9F1C) — pour les mises en évidence neutres (« regardez ici », « nouvelle fonctionnalité », etc.) - N'utilisez jamais le rouge juste parce que c'est attrayant — rouge = mauvais/supprimé
Police
- Utilisez Ink Free (
C:/Windows/Fonts/Inkfree.ttf) pour un look manuscrit sur Windows - Sur Linux/macOS, utilisez
ImageFont.load_default() - Taille 36 pour les annotations sur des images d'environ 1400px de large
stroke_width=1avecstroke_fill=<même couleur que fill>— donne du corps sans être trop épais- N'utilisez PAS de trait blanc — ça ressemble à un mauvais effet de lueur
Formes
- Préférez les rectangles arrondis aux cercles/ellipses — moins de pixelisation aux bords
draw.rounded_rectangle([x1, y1, x2, y2], radius=14, outline=color, width=5)- Padding 18px autour du contenu cible
Snippet de référence
from PIL import Image, ImageDraw, ImageFont
# Setup
font = ImageFont.truetype('C:/Windows/Fonts/Inkfree.ttf', 36) # ou load_default()
color = '#FF9F1C' # orange pour les mises en évidence
stroke = 5
pad = 18
img = Image.open('screenshot.png')
draw = ImageDraw.Draw(img)
# Rectangle arrondi avec padding
draw.rounded_rectangle(
[x1 - pad, y1 - pad, x2 + pad, y2 + pad],
radius=14, outline=color, width=stroke
)
# Ligne de leader (même épaisseur que le rectangle)
draw.line([x2 + pad, cy, x2 + pad + 40, cy - 30], fill=color, width=stroke)
# Label — trait de même couleur pour le corps, PAS de trait blanc
draw.text(
(x2 + pad + 45, cy - 60), 'label text',
fill=color, font=font, stroke_width=1, stroke_fill=color
)
img.save('annotated.png')
Annotation algorithmique — annotate.py
Pour les images avec plusieurs éléments à annoter, utilisez le module annotate.py ci-dessous. Sauvegardez-le à côté de votre script et importez-le. Il gère automatiquement le placement des labels sans chevauchement.
Démarrage rapide
from annotate import annotate_image
result = annotate_image(
'screenshot.png',
[
{'elem': (560, 275, 635, 390), 'label': 'button', 'draw_box': True},
{'elem': (105, 453, 236, 470), 'label': 'status text'},
],
debug=True,
)
result.save('annotated.png')
elem:(x1, y1, x2, y2)boîte englobante serrée — doit être exactement les coordonnées en pixelslabel: texte du label (supporte\npour le multi-ligne)draw_box: siTrue, dessine un rectangle arrondi autour de l'élément. SiFalse(défaut), dessine une pointe de flèche-V pointant vers l'élémentdebug: affiche les rectangles de ciblage et la heatmap candidate pour la validation du placement
Helper de grille de coordonnées
Utilisez toujours grid_image() avant d'annoter une image non familière. Les aperçus réduits affichent des images plus petites que les vraies dimensions en pixels — l'erreur s'accumule à mesure que vous vous éloignez de (0,0).
from annotate import grid_image
grid = grid_image('screenshot.png', step=100)
grid.save('grid.png')
Ensuite, vérifiez avec de petites cultures :
from PIL import Image
img = Image.open('screenshot.png')
crop = img.crop((x1 - 20, y1 - 20, x2 + 20, y2 + 20))
crop.save('verify.png')
Aperçu de l'algorithme
- Recherche en anneau : candidates entre MIN_ARROW (25px) et MAX_ARROW (120px) du bord de l'élément
- Scoring de contraste : préfère les placements où le texte du label est lisible —
abs(avg_brightness - 147) - std * 0.3 - dist * 0.02 - Résolution conjointe : candidates calculées indépendamment, placées goulûment (meilleur score en premier)
- Blocs durs : les labels ne peuvent pas chevaucher la boîte d'élément ou d'espace respirable d'une autre annotation
- Pénalité de proximité : les labels à moins de 40px d'autres boîtes placées reçoivent une pénalité de score
- Pénalité de croisement de flèche : -50 pour les flèches qui croisent des flèches déjà placées
Couleurs du mode debug
| Couleur | Signification |
|---|---|
| Cyan | Boîte d'élément cible (elem + padding) |
| Gris | Zone d'exclusion (buffer MIN_ARROW) |
| Rouge→Vert | Heatmap candidate (rouge=mauvais, vert=bon) |
| Magenta | Position du label choisie |
| Orange | Annotation finale rendue |
Styles de flèche
draw_box=True: rectangle arrondi + ligne droite jusqu'au label, pas de pointedraw_box=False: pointe de flèche en V avec extrémités arrondies
annotate.py — module complet
Sauvegardez ceci comme annotate.py et importez-le :
"""
Annotation algorithmique de screenshots avec placement automatique de labels.
pip install Pillow numpy
Optionnel pour diff_images: pip install scipy
"""
import math
import numpy as np
from PIL import Image, ImageDraw, ImageFont
# --- Valeurs par défaut ---
DEFAULT_FONT = 'C:/Windows/Fonts/Inkfree.ttf'
DEFAULT_FONT_SIZE = 32
DEFAULT_COLOR = '#FF9F1C'
DEFAULT_STROKE = 5
MIN_ARROW = 25
MAX_ARROW = 120
TEXT_PAD = 6
BREATH = 18
CROSSING_PENALTY = 50
PROXIMITY_MARGIN = 40
PROXIMITY_PENALTY = 50
def _rect_intersects(a, b):
return a[0] < b[2] and a[2] > b[0] and a[1] < b[3] and a[3] > b[1]
def _segments_intersect(p1, p2, p3, p4):
def cross(o, a, b):
return (a[0] - o[0]) * (b[1] - o[1]) - (a[1] - o[1]) * (b[0] - o[0])
d1, d2 = cross(p3, p4, p1), cross(p3, p4, p2)
d3, d4 = cross(p1, p2, p3), cross(p1, p2, p4)
return ((d1 > 0 and d2 < 0) or (d1 < 0 and d2 > 0)) and \
((d3 > 0 and d4 < 0) or (d3 < 0 and d4 > 0))
def _line_rect_exit(cx, cy, tx, ty, rect):
x1, y1, x2, y2 = rect
dx, dy = tx - cx, ty - cy
tmin, tmax = 0.0, 1.0
for lo, hi, p, d in [(x1, x2, cx, dx), (y1, y2, cy, dy)]:
if abs(d) < 1e-9:
continue
t0, t1 = (lo - p) / d, (hi - p) / d
if t0 > t1:
t0, t1 = t1, t0
tmin, tmax = max(tmin, t0), min(tmax, t1)
return (cx + dx * tmax, cy + dy * tmax)
def _rect_gap(a, b):
dx = max(a[0] - b[2], b[0] - a[2], 0)
dy = max(a[1] - b[3], b[1] - a[3], 0)
if dx == 0 and dy == 0:
return 0
return math.sqrt(dx**2 + dy**2)
def _find_candidates(pixels, W, H, cyan, pw, ph, font):
cx, cy = (cyan[0] + cyan[2]) / 2, (cyan[1] + cyan[3]) / 2
excl_zone = (cyan[0] - MIN_ARROW, cyan[1] - MIN_ARROW,
cyan[2] + MIN_ARROW, cyan[3] + MIN_ARROW)
sx1 = max(0, cyan[0] - MAX_ARROW - pw)
sy1 = max(0, cyan[1] - MAX_ARROW - ph)
sx2 = min(W - pw, cyan[2] + MAX_ARROW)
sy2 = min(H - ph, cyan[3] + MAX_ARROW)
step_x = max(8, min(pw // 2, MAX_ARROW // 3))
step_y = max(8, min(ph // 2, MAX_ARROW // 3))
cands = []
for px in range(sx1, sx2, step_x):
for py in range(sy1, sy2, step_y):
pink = (px, py, px + pw, py + ph)
if _rect_intersects(pink, excl_zone):
continue
gl, gr = cyan[0] - pink[2], pink[0] - cyan[2]
gt, gb = cyan[1] - pink[3], pink[1] - cyan[3]
hd, vd = max(gl, gr, 0), max(gt, gb, 0)
ed = math.sqrt(hd**2 + vd**2) if (hd > 0 and vd > 0) else max(hd, vd)
if ed > MAX_ARROW:
continue
region = pixels[py:py + ph, px:px + pw, :3].astype(float)
score = abs(np.mean(region) - 147) - np.std(region) * 0.3
dist = math.sqrt((px + pw/2 - cx)**2 + (py + ph/2 - cy)**2)
score -= dist * 0.02
cands.append(((px, py), score))
return cands
def _resolve_placements(annots, font):
placed = []
all_elem_zones = []
for ann in annots:
all_elem_zones.append(ann['cyan'])
if ann.get('draw_box', False):
c = ann['cyan']
all_elem_zones.append((c[0]-BREATH, c[1]-BREATH, c[2]+BREATH, c[3]+BREATH))
for ann in sorted(annots, key=lambda a: -a['best_score']):
pw, ph = ann['pw'], ann['ph']
cyan = ann['cyan']
cx, cy = ann['cyan_center']
draw_box = ann.get('draw_box', False)
best_pos, best_score = None, -999
valid = []
for (px, py), score in ann['candidates']:
pink = (px, py, px + pw, py + ph)
ok = True
for ez in all_elem_zones:
if ez == cyan:
continue
if ann.get('draw_box', False):
own_viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
if ez == own_viz:
continue
if _rect_intersects(pink, ez):
ok = False; break
if not ok:
continue
for p_pink, p_excl, p_viz, _ in placed:
if _rect_intersects(pink, p_pink) or _rect_intersects(pink, p_excl):
ok = False; break
if p_viz and _rect_intersects(pink, p_viz):
ok = False; break
if not ok:
continue
for p_pink, p_excl, p_viz, _ in placed:
for rect in [p_pink, p_excl, p_viz]:
if rect is None:
continue
gap = _rect_gap(pink, rect)
if gap < PROXIMITY_MARGIN:
score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
for ez in all_elem_zones:
if ez == cyan:
continue
gap = _rect_gap(pink, ez)
if gap < PROXIMITY_MARGIN:
score -= PROXIMITY_PENALTY * (1 - gap / PROXIMITY_MARGIN)
tcx, tcy = px + pw/2, py + ph/2
cand_start = _line_rect_exit(tcx, tcy, cx, cy, pink)
if draw_box:
viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
cand_end = _line_rect_exit(cx, cy, tcx, tcy, viz)
else:
cand_end = _line_rect_exit(cx, cy, tcx, tcy, cyan)
for _, _, _, pa in placed:
if pa and _segments_intersect(cand_start, cand_end, pa[0], pa[1]):
score -= CROSSING_PENALTY; break
valid.append(((px, py), score))
if score > best_score:
best_score, best_pos = score, (px, py)
ann['valid_candidates'] = valid
if best_pos is None:
ann['pink'] = ann['tpos'] = ann['astart'] = ann['aend'] = ann['viz'] = None
continue
px, py = best_pos
pink = (px, py, px + pw, py + ph)
ann['pink'] = pink
ann['tpos'] = (px + TEXT_PAD, py + TEXT_PAD)
tcx, tcy = px + pw/2, py + ph/2
ann['astart'] = _line_rect_exit(tcx, tcy, cx, cy, pink)
if draw_box:
viz = (cyan[0]-BREATH, cyan[1]-BREATH, cyan[2]+BREATH, cyan[3]+BREATH)
ann['viz'] = viz
ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, viz)
else:
ann['viz'] = None
ann['aend'] = _line_rect_exit(cx, cy, tcx, tcy, cyan)
placed.append((pink, ann['excl_zone'], ann['viz'], (ann['astart'], ann['aend'])))
def _draw_debug(img, annots, color):
overlay = Image.new('RGBA', img.size, (0, 0, 0, 0))
od = ImageDraw.Draw(overlay)
for ann in annots:
cands = ann.get('valid_candidates', ann['candidates'])
if not cands:
continue
pw, ph = ann['pw'], ann['ph']
scores = [s for _, s in cands]
smin, smax = min(scores), max(scores)
rng = smax - smin if smax > smin else 1
for (px, py), score in cands:
t = (score - smin) / rng
if t < 0.5:
r_c, g_c, b_c = 220, int(180 * (t * 2)), 0
else:
r_c, g_c, b_c = int(220 * (1 - (t-0.5)*2)), 200, 0
alpha_fill = int(40 + 70 * t)
alpha_out = int(80 + 120 * t)
od.rectangle((px, py, px + pw, py + ph),
fill=(r_c, g_c, b_c, alpha_fill), outline=(r_c, g_c, b_c, alpha_out), width=1)
for ann in annots:
ez = ann['excl_zone']
od.rectangle(ez, fill=(120, 120, 120, 50), outline=(160, 160, 160, 160), width=1)
od.rectangle(ann['cyan'], fill=(0, 255, 255, 30), outline=(0, 255, 255, 180), width=2)
if ann.get('pink'):
od.rectangle(ann['pink'], fill=(255, 0, 255, 50),
outline=(255, 0, 255, 180), width=2)
return Image.alpha_composite(img, overlay)
def _draw_annotations(img, annots, font, color, stroke_width):
draw = ImageDraw.Draw(img)
for ann in annots:
if ann.get('viz'):
draw.rounded_rectangle(ann['viz'], radius=12, outline=color, width=stroke_width)
tpos = ann.get('tpos')
astart, aend = ann.get('astart'), ann.get('aend')
if not (tpos and astart and aend):
continue
sx, sy = int(astart[0]), int(astart[1])
ex, ey = int(aend[0]), int(aend[1])
draw.line([(sx, sy), (ex, ey)], fill=color, width=4, joint='curve')
r = 2
draw.ellipse([(sx-r, sy-r), (sx+r, sy+r)], fill=color)
draw.ellipse([(ex-r, ey-r), (ex+r, ey+r)], fill=color)
if not ann.get('draw_box', False):
angle = math.atan2(ey - sy, ex - sx)
al, spread = 18, 0.45
ax = ex - al * math.cos(angle - spread)
ay = ey - al * math.sin(angle - spread)
bx = ex - al * math.cos(angle + spread)
by = ey - al * math.sin(angle + spread)
draw.line([(int(ax), int(ay)), (ex, ey)], fill=color, width=4)
draw.line([(int(bx), int(by)), (ex, ey)], fill=color, width=4)
for px_, py_ in [(int(ax), int(ay)), (int(bx), int(by))]:
draw.ellipse([(px_-r, py_-r), (px_+r, py_+r)], fill=color)
draw.text(tpos, ann['label'], fill=color, font=font,
stroke_width=1, stroke_fill=color)
return img
def annotate_image(image_path, annotations, *,
debug=False,
font_path=DEFAULT_FONT,
font_size=DEFAULT_FONT_SIZE,
color=DEFAULT_COLOR,
stroke_width=DEFAULT_STROKE):
"""
Annoter une capture d'écran avec placement automatique de labels.
Args:
image_path: chemin vers l'image d'entrée
annotations: liste de dicts avec les clés :
- elem: (x1, y1, x2, y2) boîte englobante serrée de l'élément
- label: chaîne texte du label
- draw_box: (optionnel, défaut False) dessiner un rect arrondi autour de l'élément
debug: si True, dessiner les rectangles développeur (cyan/pink/gris/heatmap)
font_path: chemin vers le fichier de police TTF
font_size: taille de police en pixels
color: couleur hex pour les annotations (défaut orange #FF9F1C)
stroke_width: largeur du contour du rectangle de surbrillance orange
Returns:
PIL.Image avec les annotations dessinées
"""
font = ImageFont.truetype(font_path, font_size)
img = Image.open(image_path).convert('RGBA')
pixels = np.array(img)
W, H = img.size
annots = []
for i, spec in enumerate(annotations):
eb = spec['elem']
em_pad = min(20, max(10, (eb[2] - eb[0]) // 10))
cyan = (eb[0] - em_pad, eb[1] - em_pad, eb[2] + em_pad, eb[3] + em_pad)
lines = spec['label'].split('\n')
tw = max(font.getbbox(line)[2] - font.getbbox(line)[0] for line in lines)
line_h = font.getbbox('Ay')[3] - font.getbbox('Ay')[0]
th = line_h * len(lines) + 4 * (len(lines) - 1)
pw, ph = tw + 2 * TEXT_PAD, th + 2 * TEXT_PAD
cands = _find_candidates(pixels, W, H, cyan, pw, ph, font)
annots.append({
'id': i,
'label': spec['label'],
'draw_box': spec.get('draw_box', False),
'cyan': cyan,
'cyan_center': ((cyan[0]+cyan[2])/2, (cyan[1]+cyan[3])/2),
'excl_zone': (cyan[0]-MIN_ARROW, cyan[1]-MIN_ARROW,
cyan[2]+MIN_ARROW, cyan[3]+MIN_ARROW),
'pw': pw, 'ph': ph,
'candidates': cands,
'best_score': max((s for _, s in cands), default=-999),
})
_resolve_placements(annots, font)
annots.sort(key=lambda a: a['id'])
if debug:
img = _draw_debug(img, annots, color)
img = _draw_annotations(img, annots, font, color, stroke_width)
return img
def diff_images(before_path, after_path, *, threshold=30, min_pixels=300,
dilate=5, debug=False):
"""Trouver les régions modifiées entre deux captures d'écran et retourner les boîtes de clusters.
Retourne (clusters, debug_img_or_None):
clusters: liste de (x1, y1, x2, y2, pixel_count) triée de la plus grande à la plus petite
debug_img: si debug=True, PIL Image avec heatmap overlay et boîtes de clusters
"""
from scipy import ndimage
img_a = Image.open(before_path).convert('RGB')
img_b = Image.open(after_path).convert('RGB')
if img_a.size != img_b.size:
raise ValueError(f"Les tailles d'images diffèrent : {img_a.size} vs {img_b.size}")
arr_a = np.array(img_a, dtype=np.float32)
arr_b = np.array(img_b, dtype=np.float32)
W, H = img_a.size
diff = np.abs(arr_b - arr_a).max(axis=2)
mask = diff > threshold
dilated = ndimage.binary_dilation(mask, iterations=dilate)
labeled, n_clusters = ndimage.label(dilated)
clusters = []
for i in range(1, n_clusters + 1):
ys, xs = np.where(labeled == i)
if len(ys) < min_pixels:
continue
clusters.append((int(xs.min()), int(ys.min()),
int(xs.max()), int(ys.max()), len(ys)))
clusters.sort(key=lambda c: -c[4])
debug_img = None
if debug:
overlay = img_b.copy().convert('RGBA')
norm = np.clip(diff / 255.0, 0, 1)
show_mask = diff > 10
r = np.clip((norm * 2) * 255, 0, 255).astype(np.uint8)
g = np.clip((1 - np.abs(norm - 0.5) * 2) * 200, 0, 200).astype(np.uint8)
b = np.clip((1 - norm) * 255, 0, 255).astype(np.uint8)
a = np.where(show_mask, np.clip(norm * 200 + 40, 40, 220).astype(np.uint8), 0)
heat = Image.fromarray(np.stack([r, g, b, a], axis=2), 'RGBA')
overlay = Image.alpha_composite(overlay, heat)
draw = ImageDraw.Draw(overlay)
try:
font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 18)
except OSError:
font = ImageFont.load_default()
for idx, (x1, y1, x2, y2, px_count) in enumerate(clusters):
draw.rectangle([x1, y1, x2, y2], outline=(0, 255, 255, 200), width=3)
label = f"#{idx+1} {px_count:,}px"
bbox = font.getbbox(label)
tw, th = bbox[2] - bbox[0], bbox[3] - bbox[1]
lx, ly = x1, max(0, y1 - th - 8)
draw.rectangle([lx, ly, lx + tw + 8, ly + th + 4], fill=(0, 0, 0, 180))
draw.text((lx + 4, ly + 2), label, fill=(0, 255, 255, 255), font=font)
debug_img = overlay
return clusters, debug_img
def grid_image(image_path, step=100):
"""Dessiner une grille de coordonnées sur une image pour localiser précisément les éléments."""
img = Image.open(image_path).convert('RGBA')
draw = ImageDraw.Draw(img)
W, H = img.size
try:
font = ImageFont.truetype('C:/Windows/Fonts/consola.ttf', 14)
except OSError:
font = ImageFont.load_default()
for x in range(0, W, step):
draw.line([(x, 0), (x, H)], fill=(255, 0, 0, 120), width=1)
draw.text((x + 2, 2), str(x), fill=(255, 0, 0, 200), font=font)
for y in range(0, H, step):
draw.line([(0, y), (W, y)], fill=(255, 0, 0, 120), width=1)
draw.text((2, y + 2), str(y), fill=(255, 0, 0, 200), font=font)
return img
Comparaison d'images
Trouvez ce qui a changé entre deux captures d'écran de manière programmatique. À utiliser comme filet de sécurité pour les changements subtils — quand la différence est évidente, annotez directement à la place.
from annotate import diff_images
clusters, debug_img = diff_images(
'before.png', 'after.png',
threshold=30, # seuil de différence de pixels (0-255)
min_pixels=300, # ignorer les petits clusters de bruit
dilate=5, # fusionner les pixels modifiés proches
debug=True, # rendre heatmap overlay
)
# clusters = [(x1, y1, x2, y2, pixel_count), ...] triée de la plus grande à la plus petite
if debug_img:
debug_img.save('diff-debug.png')
# Alimenter les clusters dans annotate_image :
annotations = [
{'elem': (x1, y1, x2, y2), 'label': f'Change #{i+1}', 'draw_box': True}
for i, (x1, y1, x2, y2, _) in enumerate(clusters[:3])
]
Couleurs de heatmap debug : Bleu = petite différence, Jaune = moyenne, Rouge = grande, Boîtes Cyan = boîtes englobantes de clusters.
Quand utiliser : changements subtils d'opacité, lignes pointillées, petits décalages de couleur, différences d'anti-aliasing. Quand NE PAS utiliser : tout changement que vous pouvez voir à l'œil nu — annotez directement pour des labels meilleurs.
Annotations GIF animés
Différentes des images statiques — les animations ont du timing, des transitions et du mouvement visuel en concurrence.
Mise en évidence d'éléments
- Rectangles pour les grandes zones, flèches pour les petits éléments — zone 500x300px = rect, élément 200x25px = flèche
- Les labels vont À CÔTÉ de ce qu'ils décrivent — flèche courte (30-80px), label adjacent. L'œil du spectateur ne devrait pas parcourir plus d'environ 100px
- La flèche ne doit pas traverser son propre label — choisir le bord le plus proche de la cible
- Pas de barre inférieure / approche sous-titre — les yeux sautent entre le contenu et la barre. Placement contextuel uniquement
- Le message héros obtient une police plus grande — principal takeaway 64pt+, annotations détaillées 38pt
Timing et rythme
- Fade : pop-in 2-frame à 10fps — 50% → 100% opacité (0,2s total). Les courbes de lissage sont moches à faible FPS
- Type → pause → annoter — pendant une action rapide, afficher AUCUNE annotation. Pause, puis l'ajouter
- Durée de frame variable — rapide pendant l'action (100ms), lent pendant les pauses (600-800ms), long hold pour le héros (500ms)
- FPS plus élevé pour un mouvement lisse — minimum 10fps pour la dactylographie/interaction
Implémentation du pop-in fade
# 2-frame pop-in à 10fps
FADE_ALPHAS = [0.50, 1.00]
for frame_idx in range(total_frames):
if annotation_just_changed and local_idx < len(FADE_ALPHAS):
alpha = FADE_ALPHAS[local_idx]
else:
alpha = 1.0
# Appliquer l'alpha aux éléments d'annotation :
# - fond de pill : fill=(r, g, b, int(base_alpha * alpha))
# - texte : fill=(*color, int(255 * alpha))
# - contour du rect : outline=(*color, int(255 * alpha))
Directives
- Tous les éléments même épaisseur — rect
width, linewidthet le poids visuel du texte doivent sembler cohérents (~5px) - Placer les labels proches du rectangle — ligne de leader courte (25-35px)
- Les labels peuvent chevaucher le contenu — le trait donne assez de contraste
- Afficher localement d'abord — vérifier avant de télécharger sur une PR
- Prendre les captures d'écran à 1x natif, contrôler la taille d'affichage en HTML — utiliser
<img width="300">en markdown, ne jamais redimensionner avec PIL (crée des artefacts) - Toujours vérifier
Image.open(path).sizeen premier — les captures d'écran HiDPI sont plus grandes qu'elles n'apparaissent (mise à l'échelle 150% = dimensions de pixels CSS 1,5x) - Les courts labels fonctionnent mieux — les labels larges ont moins de placements valides. Utiliser 1-3 mots si possible
- Vérifier avec debug=True — toujours vérifier la première annotation d'une nouvelle image en mode debug
Limitations
- La police Ink Free est uniquement Windows ; les autres plateformes ont besoin d'une police de secours
- Le rendu de texte PIL est basique — pas de texte riche, pas de markdown
- Les annotations GIF animés nécessitent un traitement image par image ce qui peut être lent pour les longues enregistrements
- Le placement algorithmique fonctionne mieux avec 2-6 annotations ; plus que cela peut produire des résultats encombrés