Articles

PMC (Français)

Posted by admin

aujourd’hui, les statistiques fournissent la base de l’inférence dans la plupart des recherches médicales. Pourtant, faute d’être exposé à la théorie et à la pratique statistiques, il continue d’être considéré comme le talon d’Achille par tous les acteurs de la recherche et de la publication – les chercheurs (auteurs), les réviseurs, les éditeurs et les lecteurs.

la plupart d’entre nous connaissent dans une certaine mesure les mesures statistiques descriptives telles que celles de la tendance centrale et celles de la dispersion. Cependant, nous faiblissons devant les statistiques inférentielles., Cela ne doit pas nécessairement être le cas, en particulier avec la disponibilité généralisée de logiciels statistiques puissants et en même temps conviviaux. Comme nous l’avons souligné ci-dessous, quelques considérations fondamentales mèneront à choisir le test statistique approprié pour le test d’hypothèse. Cependant, il est important que l’analyse statistique appropriée soit décidée avant de commencer l’étude, au stade de la planification elle-même, et que la taille de l’échantillon choisie soit optimale. Ceux-ci ne peuvent être décidés arbitrairement après la fin de l’étude et après la collecte de données.,

la grande majorité des études peuvent être abordées à travers un panier de quelque 30 tests parmi plus de 100 qui sont en cours d’utilisation. Le test à utiliser dépend du type de question de recherche posée. Les autres facteurs déterminants sont le type de données analysées, et le nombre de groupes ou de séries de données impliqués dans l’étude. Les schémas suivants, basés sur cinq questions de recherche génériques, devraient aider.

Question 1: Existe-t-il une différence entre les groupes non appariés?, Les groupes ou ensembles de données sont considérés comme non appariés s’il n’y a aucune possibilité que les valeurs d’un ensemble de données soient liées ou influencées par les valeurs des autres ensembles de données. Différents tests sont nécessaires pour les données quantitatives ou numériques et les données qualitatives ou catégorielles comme indiqué à la Fig. 1. Pour les données numériques, il est important de décider si elles suivent les paramètres de la courbe de distribution normale (courbe gaussienne), auquel cas des tests paramétriques sont appliqués. Si la distribution des données n’est pas normale ou si l’on n’est pas sûr de la distribution, il est plus sûr d’utiliser des tests non paramétriques., Lors de la comparaison de plus de deux ensembles de données numériques, un test de comparaison de groupes multiples tel que l’analyse unidirectionnelle de la variance (ANOVA) ou le test de Kruskal-Wallis doit être utilisé en premier. S’ils renvoient une valeur p statistiquement significative (ce qui signifie généralement p < 0.05), ils doivent seulement être suivis d’un test post-hoc pour déterminer exactement entre les deux ensembles de données la différence. L’application répétée du test t ou de son homologue non paramétrique, le test de Mann-Whitney U, à une situation de groupe multiple augmente la possibilité de rejeter incorrectement l’hypothèse nulle.,

Tests pour répondre à la question: y a – t-il une différence entre les groupes-situation non appariée (groupes parallèles et indépendants)?

Question 2: Est-il une différence entre les groupes qui sont associées? L’appariement signifie que les ensembles de données sont dérivés par des mesures répétées (par exemple des mesures avant-après ou des mesures multiples dans le temps) sur le même ensemble de sujets. L’appariement se produira également si les groupes de sujets sont différents mais que les valeurs d’un groupe sont liées ou liées à des valeurs de l’autre groupe (par exemple, études sur les jumeaux, études sur les frères et sœurs, études sur les parents et la progéniture). Une conception d’étude croisée nécessite également l’application de tests de groupe appariés pour comparer les effets de différentes interventions sur les mêmes sujets. Parfois, les sujets sont délibérément appariés pour correspondre aux caractéristiques de base telles que l’âge, le sexe, la gravité ou la durée de la maladie. Un schéma similaire à la Fig. 1est suivi dans les tests d’ensembles de données appariés, comme indiqué sur la Fig. 2. Encore une fois, la comparaison de plusieurs ensembles de données devrait être effectuée au moyen de tests de plusieurs groupes appropriés suivis de tests post-hoc.,

Tests pour répondre à la question: y a – t-il une différence entre les situations groupées?

Question 3: Est-il une association entre les variables? Les différents essais applicables sont décrits à la Fig. 3. Il convient de noter que les tests destinés aux données numériques sont destinés à tester l’association entre deux variables. Ce sont des tests de corrélation et ils expriment la force de l’association en tant que coefficient de corrélation. Une corrélation inverse entre deux variables est représentée par un signe moins., Tous les coefficients de corrélation varient en magnitude de 0 (aucune corrélation du tout) à 1 (corrélation parfaite). Une corrélation parfaite peut indiquer, mais ne signifie pas nécessairement causalité. Lorsque deux variables numériques sont linéairement liées l’une à l’autre, une analyse de régression linéaire peut générer une équation mathématique, qui peut prédire la variable dépendante en fonction d’une valeur donnée de la variable indépendante. Les rapports de cotes et les risques relatifs sont l’essentiel des études épidémiologiques et expriment l’association entre les données catégorielles qui peuvent être résumées sous la forme d’un tableau de contingence 2 × 2., La régression logistique est en fait une méthode d’analyse multivariée qui exprime la force de l’association entre une variable dépendante binaire et deux ou plusieurs variables indépendantes sous forme de rapports de cotes ajustés.

Tests pour répondre à la question: il y a une association entre les variables?

Question 4: Est-il d’accord entre les ensembles de données?, Cela peut être une comparaison entre une nouvelle technique de dépistage par rapport au test standard, un nouveau test de diagnostic par rapport à l’étalon-or disponible ou un accord entre les notes ou les scores donnés par différents observateurs. Comme vu de la Fig. 4, l’accord entre les variables numériques peut être exprimé quantitativement par le coefficient de corrélation intraclasse ou graphiquement en construisant un tracé de fade-Altman dans lequel la différence entre deux variables x et y est tracée par rapport à la moyenne de x et Y., Dans le cas de données catégorielles, la statistique Kappa de Cohen est fréquemment utilisée, avec kappa (qui varie de 0 pour aucun accord du tout à 1 pour un accord parfait) indiquant un accord fort quand il est > 0.7. Il est inapproprié de déduire un accord en montrant qu’il n’y a pas de différence statistiquement significative entre les moyennes ou en calculant un coefficient de corrélation.

les Tests de répondre à la question: existe-il un accord entre l’évaluation (dépistage / évaluation / diagnostic), des techniques?,

Question 5: existe-t-il une différence entre les tendances temporelles ou les diagrammes de survie? Cette question est spécifique à l’analyse de la survie(le paramètre pour une telle analyse pourrait être la mort ou tout événement pouvant survenir après une période de temps) qui se caractérise par la censure des données, ce qui signifie qu’une proportion importante des sujets de l’étude initiale peut ne pas atteindre le paramètre en question au moment où l’étude Les ensembles de données sur les tendances de survie sont toujours considérés comme non paramétriques., S’il y a deux groupes, les tests applicables sont le test de Cox-Mantel, le test de Gehan (Wilcoxon généralisé) ou le test de log-rank. Dans le cas de plus de deux groupes, le test de Peto et le test de Peto ou le test de log-rank peuvent être appliqués pour rechercher une différence significative entre les tendances time-to-event.

d’après le schéma ci-dessus, il est important de distinguer les données paramétriques des données non paramétriques. Des Tests de normalité (par exemple, le test de Kolmogorov-Smirnov ou le test de Shapiro-Wilk sur la qualité de l’ajustement) peuvent être appliqués plutôt que de faire des hypothèses., Certaines des autres conditions préalables des tests paramétriques sont que les échantillons ont la même variance, c’est-à-dire tirés de la même population, les observations au sein d’un groupe sont indépendantes et que les échantillons ont été tirés au hasard de la population.

Un test unilatéral calcule la possibilité de déviation à partir de l’hypothèse nulle dans une direction spécifique, alors qu’un test bilatéral calcule la possibilité de déviation à partir de l’hypothèse nulle dans les deux sens., Lorsque L’Intervention A est comparée à L’Intervention B dans un parcours clinique, l’hypothèse nulle suppose qu’il n’y a pas de différence entre les deux interventions. Écart par rapport à cette hypothèse peut se produire en faveur de l’intervention dans un test bilatéral, mais dans un test unilatéral, il est présumé qu’une seule intervention peut montrer la supériorité sur les autres. Bien que pour un ensemble de données donné, un test à une queue renverra une valeur p plus petite qu’un test à deux queues, ce dernier est généralement préféré à moins qu’il n’y ait un cas étanche pour un test à une queue.,

Il est évident que nous ne pouvons pas faire référence à tous les tests statistiques dans un seul éditorial. Cependant, les schémas décrits couvriront les exigences de test d’hypothèse de la majorité des études observationnelles et interventionnelles. Enfin, il ne faut pas oublier qu’il n’y a pas de substitut à travailler concrètement avec des ensembles de données factices ou réels, et à demander l’avis d’un statisticien, afin d’apprendre les nuances des tests d’hypothèses statistiques.

Leave A Comment