scvelo

Par mkurman · zorai

npx skills add https://github.com/mkurman/zorai --skill scvelo

name: scvelo description: Analyse de vélocité ARN avec scVelo. Estimer les transitions d'état cellulaire à partir de la dynamique des ARNm non-épissés/épissés, déduire les directions de trajectoire, calculer le temps latent et identifier les gènes moteurs dans les données d'ARN-seq à cellule unique. Complète Scanpy/scVI-tools pour l'inférence de trajectoire. license: BSD-3-Clause tags: [scientific-skills, scvelo, scanpy, bioinformatics] metadata: skill-author: Kuan-lin Huang -------|-----|-------------| | adata.layers | velocity | Vélocité ARN par gène par cellule | | adata.layers | fit_t | Temps latent ajusté par gène par cellule | | adata.obsm | velocity_umap | Vecteurs de vélocité 2D sur UMAP | | adata.obs | velocity_pseudotime | Pseudotemps à partir de la vélocité | | adata.obs | latent_time | Temps latent du modèle dynamique | | adata.obs | velocity_length | Vitesse de chaque cellule | | adata.obs | velocity_confidence | Score de confiance par cellule | | adata.var | fit_likelihood | Qualité d'ajustement du modèle au niveau du gène | | adata.var | fit_alpha | Taux de transcription | | adata.var | fit_beta | Taux d'épissage | | adata.var | fit_gamma | Taux de dégradation | | adata.uns | velocity_graph | Matrice de probabilité de transition cellule-cellule |

Comparaison des modèles de vélocité

Modèle Vitesse Précision Quand l'utiliser
stochastic Rapide Modérée Exploration ; grands jeux de données
deterministic Moyen Modérée Cinétique linéaire simple
dynamical Lent Élevée Qualité publication ; identifie les gènes moteurs

Bonnes pratiques

  • Commencer en mode stochastique pour l'exploration ; basculer vers dynamique pour l'analyse finale
  • Besoin d'une bonne couverture des lectures non-épissées : Les lectures courtes (< 100 pb) peuvent manquer la couverture d'intron
  • Minimum 2 000 cellules : La vélocité ARN est bruitée avec moins de cellules
  • La vélocité doit être cohérente : Les flèches doivent suivre la biologie connue ; le caractère aléatoire indique des problèmes
  • La bande passante k-NN compte : Trop peu de voisins → vélocité bruitée ; trop de voisins → sur-lissée
  • Vérification de cohérence : Les cellules racines (progéniteurs) doivent avoir des rapports non-épissé/épissé élevés pour les gènes marqueurs
  • Le modèle dynamique nécessite des états cinétiques distincts : Fonctionne mieux pour les processus de différenciation clairs

Dépannage

Problème Solution
Couche non-épissée manquante Réexécuter velocyto ou utiliser STARsolo avec --soloFeatures Gene Velocyto
Très peu de gènes de vélocité Réduire min_shared_counts ; vérifier la profondeur de séquençage
Flèches d'apparence aléatoire Essayer différentes valeurs de n_neighbors ou modèle de vélocité
Erreur mémoire avec dynamique Mettre n_jobs=1 ; réduire n_top_genes
Vélocité négative partout Vérifier que les couches épissée/non-épissée ne sont pas inversées

Ressources supplémentaires

Skills similaires