📚 Documentation StatLabo

Guides complets, tutoriels et références pour maîtriser l'analyse statistique avec StatLabo

🚀 Guide de Démarrage Rapide

Commencez à analyser vos données en quelques minutes avec ces étapes simples.

Étape 1 : Créer un compte

Inscrivez-vous gratuitement sur StatLabo. Aucune carte de crédit n'est requise pour commencer.

Étape 2 : Importer vos données

Vous pouvez importer vos données de plusieurs manières :

  • Fichier CSV : Glissez-déposez votre fichier CSV directement sur la zone d'import
  • Excel (XLSX) : Support natif des fichiers Microsoft Excel
  • Google Sheets : Connectez votre compte Google pour importer directement
  • Saisie manuelle : Entrez vos données directement dans notre éditeur de tableaux

Étape 3 : Analyser

Une fois vos données importées, StatLabo génère automatiquement :

  • Un résumé statistique complet (moyenne, médiane, écart-type, quartiles)
  • Des visualisations adaptées au type de données
  • Des suggestions de tests statistiques pertinents
  • Des alertes sur les valeurs manquantes ou aberrantes

📁 Importation de Données

Formats supportés

  • CSV (Comma-Separated Values) : Format universel, recommandé pour sa simplicité
  • Excel (.xlsx, .xls) : Importez directement vos classeurs Excel
  • JSON : Pour les données structurées provenant d'APIs
  • Bases de données SQL : Connexion directe à PostgreSQL, MySQL, SQLite

Bonnes pratiques pour l'import

  • Utilisez la première ligne comme en-têtes de colonnes
  • Évitez les caractères spéciaux dans les noms de colonnes
  • Assurez-vous que les nombres utilisent le point comme séparateur décimal
  • Pour les dates, privilégiez le format YYYY-MM-DD (ex: 2024-01-15)
💡 Conseil : StatLabo détecte automatiquement le type de vos données (numérique, catégorielle, date). Vérifiez toujours cette détection après l'import.

🧪 Tests Statistiques Disponibles

Tests de comparaison

  • Test t de Student : Compare les moyennes de 2 groupes indépendants
  • Test t apparié : Compare les moyennes de 2 groupes appariés (avant/après)
  • ANOVA à un facteur : Compare les moyennes de 3+ groupes indépendants
  • ANOVA à deux facteurs : Analyse l'effet de 2 variables catégorielles
  • Test de Mann-Whitney : Alternative non-paramétrique au test t
  • Test de Kruskal-Wallis : Alternative non-paramétrique à l'ANOVA

Tests de corrélation et régression

  • Corrélation de Pearson : Mesure la relation linéaire entre 2 variables continues
  • Corrélation de Spearman : Mesure la relation monotone (non-paramétrique)
  • Régression linéaire simple : Modélise Y en fonction d'un seul X
  • Régression linéaire multiple : Modélise Y en fonction de plusieurs X

Tests pour données catégorielles

  • Test du Chi-deux (χ²) : Teste l'indépendance entre 2 variables catégorielles
  • Test exact de Fisher : Pour les petits échantillons (tableau 2×2)

Tests de normalité

  • Test de Shapiro-Wilk : Vérifie si les données suivent une loi normale
  • Test de Kolmogorov-Smirnov : Compare à une distribution théorique

📊 Visualisations

Graphiques pour données continues

  • Histogramme : Distribution d'une variable continue
  • Box Plot (Boîte à moustaches) : Médiane, quartiles et outliers
  • Scatter Plot : Relation entre deux variables continues
  • Courbe de densité : Estimation de la distribution

Graphiques pour données catégorielles

  • Diagramme en barres : Fréquences par catégorie
  • Diagramme circulaire : Proportions relatives
  • Heatmap : Matrice de corrélation ou tableau croisé

Personnalisation

Tous les graphiques sont personnalisables : couleurs, titres, étiquettes, taille. Exportez en PNG, SVG ou incluez-les directement dans vos rapports PDF.

📐 Référence des Formules

Moyenne (Mean)

x̄ = (Σxᵢ) / n

Somme de toutes les valeurs divisée par le nombre d'observations.

Variance

s² = Σ(xᵢ - x̄)² / (n-1)

Moyenne des carrés des écarts à la moyenne. On divise par (n-1) pour un échantillon.

Écart-type (Standard Deviation)

s = √s² = √[Σ(xᵢ - x̄)² / (n-1)]

Racine carrée de la variance, exprimée dans les mêmes unités que les données.

Coefficient de corrélation de Pearson

r = Σ[(xᵢ - x̄)(yᵢ - ȳ)] / √[Σ(xᵢ - x̄)² × Σ(yᵢ - ȳ)²]

Mesure la force et la direction de la relation linéaire entre X et Y.

Intervalle de confiance (95%)

IC = x̄ ± 1.96 × (s / √n)

Plage de valeurs contenant probablement la vraie moyenne de la population.

Test t de Student

t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)

Mesure la différence entre deux moyennes en unités d'erreur standard.

❓ Questions Fréquentes

Quelle taille d'échantillon est nécessaire ?

Cela dépend du test. En règle générale, n ≥ 30 permet d'utiliser les tests paramétriques grâce au théorème central limite. Pour les petits échantillons (n < 30), utilisez les tests non-paramétriques ou vérifiez la normalité.

Comment interpréter la p-value ?

La p-value représente la probabilité d'obtenir vos résultats si l'hypothèse nulle était vraie. Si p < 0.05 (seuil conventionnel), on considère le résultat comme "statistiquement significatif" , mais cela ne garantit pas une importance pratique.

Mes données ne suivent pas une loi normale, que faire ?

Utilisez des tests non-paramétriques (Mann-Whitney, Kruskal-Wallis, Spearman) qui ne supposent pas de distribution particulière. Vous pouvez aussi essayer des transformations (logarithme, racine carrée).

Comment gérer les valeurs manquantes ?

StatLabo offre plusieurs options : suppression des lignes incomplètes, imputation par la moyenne/médiane, ou analyse des patterns de données manquantes. Le choix dépend du mécanisme de missing (MCAR, MAR, MNAR).

Prêt à analyser vos données ?

Commencez gratuitement, sans carte de crédit.

Créer un compte gratuit