📚 Documentation StatLabo
Guides complets, tutoriels et références pour maîtriser l'analyse statistique avec StatLabo
🚀 Guide de Démarrage Rapide
Commencez à analyser vos données en quelques minutes avec ces étapes simples.
Étape 1 : Créer un compte
Inscrivez-vous gratuitement sur StatLabo. Aucune carte de crédit n'est requise pour commencer.
Étape 2 : Importer vos données
Vous pouvez importer vos données de plusieurs manières :
- Fichier CSV : Glissez-déposez votre fichier CSV directement sur la zone d'import
- Excel (XLSX) : Support natif des fichiers Microsoft Excel
- Google Sheets : Connectez votre compte Google pour importer directement
- Saisie manuelle : Entrez vos données directement dans notre éditeur de tableaux
Étape 3 : Analyser
Une fois vos données importées, StatLabo génère automatiquement :
- Un résumé statistique complet (moyenne, médiane, écart-type, quartiles)
- Des visualisations adaptées au type de données
- Des suggestions de tests statistiques pertinents
- Des alertes sur les valeurs manquantes ou aberrantes
📁 Importation de Données
Formats supportés
- CSV (Comma-Separated Values) : Format universel, recommandé pour sa simplicité
- Excel (.xlsx, .xls) : Importez directement vos classeurs Excel
- JSON : Pour les données structurées provenant d'APIs
- Bases de données SQL : Connexion directe à PostgreSQL, MySQL, SQLite
Bonnes pratiques pour l'import
- Utilisez la première ligne comme en-têtes de colonnes
- Évitez les caractères spéciaux dans les noms de colonnes
- Assurez-vous que les nombres utilisent le point comme séparateur décimal
- Pour les dates, privilégiez le format YYYY-MM-DD (ex: 2024-01-15)
🧪 Tests Statistiques Disponibles
Tests de comparaison
- Test t de Student : Compare les moyennes de 2 groupes indépendants
- Test t apparié : Compare les moyennes de 2 groupes appariés (avant/après)
- ANOVA à un facteur : Compare les moyennes de 3+ groupes indépendants
- ANOVA à deux facteurs : Analyse l'effet de 2 variables catégorielles
- Test de Mann-Whitney : Alternative non-paramétrique au test t
- Test de Kruskal-Wallis : Alternative non-paramétrique à l'ANOVA
Tests de corrélation et régression
- Corrélation de Pearson : Mesure la relation linéaire entre 2 variables continues
- Corrélation de Spearman : Mesure la relation monotone (non-paramétrique)
- Régression linéaire simple : Modélise Y en fonction d'un seul X
- Régression linéaire multiple : Modélise Y en fonction de plusieurs X
Tests pour données catégorielles
- Test du Chi-deux (χ²) : Teste l'indépendance entre 2 variables catégorielles
- Test exact de Fisher : Pour les petits échantillons (tableau 2×2)
Tests de normalité
- Test de Shapiro-Wilk : Vérifie si les données suivent une loi normale
- Test de Kolmogorov-Smirnov : Compare à une distribution théorique
📊 Visualisations
Graphiques pour données continues
- Histogramme : Distribution d'une variable continue
- Box Plot (Boîte à moustaches) : Médiane, quartiles et outliers
- Scatter Plot : Relation entre deux variables continues
- Courbe de densité : Estimation de la distribution
Graphiques pour données catégorielles
- Diagramme en barres : Fréquences par catégorie
- Diagramme circulaire : Proportions relatives
- Heatmap : Matrice de corrélation ou tableau croisé
Personnalisation
Tous les graphiques sont personnalisables : couleurs, titres, étiquettes, taille. Exportez en PNG, SVG ou incluez-les directement dans vos rapports PDF.
📐 Référence des Formules
Moyenne (Mean)
x̄ = (Σxᵢ) / n
Somme de toutes les valeurs divisée par le nombre d'observations.
Variance
s² = Σ(xᵢ - x̄)² / (n-1)
Moyenne des carrés des écarts à la moyenne. On divise par (n-1) pour un échantillon.
Écart-type (Standard Deviation)
s = √s² = √[Σ(xᵢ - x̄)² / (n-1)]
Racine carrée de la variance, exprimée dans les mêmes unités que les données.
Coefficient de corrélation de Pearson
r = Σ[(xᵢ - x̄)(yᵢ - ȳ)] / √[Σ(xᵢ - x̄)² × Σ(yᵢ - ȳ)²]
Mesure la force et la direction de la relation linéaire entre X et Y.
Intervalle de confiance (95%)
IC = x̄ ± 1.96 × (s / √n)
Plage de valeurs contenant probablement la vraie moyenne de la population.
Test t de Student
t = (x̄₁ - x̄₂) / √(s₁²/n₁ + s₂²/n₂)
Mesure la différence entre deux moyennes en unités d'erreur standard.
❓ Questions Fréquentes
Quelle taille d'échantillon est nécessaire ?
Cela dépend du test. En règle générale, n ≥ 30 permet d'utiliser les tests paramétriques grâce au théorème central limite. Pour les petits échantillons (n < 30), utilisez les tests non-paramétriques ou vérifiez la normalité.
Comment interpréter la p-value ?
La p-value représente la probabilité d'obtenir vos résultats si l'hypothèse nulle était vraie. Si p < 0.05 (seuil conventionnel), on considère le résultat comme "statistiquement significatif" , mais cela ne garantit pas une importance pratique.
Mes données ne suivent pas une loi normale, que faire ?
Utilisez des tests non-paramétriques (Mann-Whitney, Kruskal-Wallis, Spearman) qui ne supposent pas de distribution particulière. Vous pouvez aussi essayer des transformations (logarithme, racine carrée).
Comment gérer les valeurs manquantes ?
StatLabo offre plusieurs options : suppression des lignes incomplètes, imputation par la moyenne/médiane, ou analyse des patterns de données manquantes. Le choix dépend du mécanisme de missing (MCAR, MAR, MNAR).