5
Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405 401 TEMAS DE ACTUALIDAD

PERTINEN PBAS DXS

Embed Size (px)

Citation preview

  • Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405 401

    TEMAS DE ACTUALIDAD

    1Juan O. Talavera,2Rodolfo Rivas-Ruiz

    1Centro de Adiestramiento en Investigacin Clnica,Coordinacin de Investigacin en Salud,

    2Servicio de Escolares y Adolescentes, Hospital de Pediatra

    Autores 1 y 2, Centro Mdico Nacional Siglo XXI,Instituto Mexicano del Seguro Social, Distrito Federal, Mxico

    Comunicacin con: Juan O. TalaveraCorreo electrnico: [email protected]

    ResumenCuando observamos la diferencia entre dos terapias o la aso-ciacin de un factor de riesgo o indicador pronstico con sudesenlace, tenemos que evaluar la certeza del resultado. Estaevaluacin se basa en un juicio que utiliza informacin relacio-nada con el diseo del estudio y el manejo estadstico de la in-formacin. En este artculo se menciona especficamente lapertinencia de la prueba estadstica seleccionada. Las pruebasestadsticas se eligen a partir de dos caractersticas: el objetivodel estudio y el tipo de variables. El objetivo se puede dividir entres grupos de pruebas: a) en las que se desea mostrar diferen-cias entre grupos, o de un mismo grupo antes y despus de unamaniobra; b) en las que se busca mostrar la relacin entre lasvariables; c) en las que se pretende predecir un desenlace. Encuanto a los tipos de variables tenemos dos: las cuantitativas(continuas y discontinuas) y las cualitativas (ordinales y dico-tmicas). Por ejemplo, si se busca demostrar diferencias enedad (variable cuantitativa), entre pacientes con lupus eritema-toso sistmico, con y sin afeccin neurolgica (dos grupos), laprueba apropiada es la t de Student para muestras indepen-dientes; pero si lo que se compara entre esos mismos gruposes la frecuencia de mujeres (variable binomial), entonces la prue-ba estadstica pertinente es la 2.

    Palabras claveinvestigacin biomdica

    proyectos de investigacinestadstica y datos numricos

    SummaryWhen we look at the difference between two therapies or the as-sociation of a risk factor or prognostic indicator with its outcome,we need to evaluate the accuracy of the result. This assessmentis based on a judgment that uses information about the studydesign and statistical management of the information. Thispaper specifically mentions the relevance of the statistical testselected. Statistical tests are chosen mainly from two characte-ristics: the objective of the study and type of variables. The ob-jective can be divided into three test groups: a) those in which youwant to show differences between groups or inside a group be-fore and after a maneuver, b) those that seek to show the rela-tionship (correlation) between variables, and c) those that aim topredict an outcome. The types of variables are divided in two: quantitative (continuous and discontinuous) and qualitative (ordi-nal and dichotomous). For example, if we seek to demonstra-te differences in age (quantitative variable) among patients withsystemic lupus erythematosus (SLE) with and without neurologicaldisease (two groups), the appropriate test is the Student t testfor independent samples. But if the comparison is about thefrequency of females (binomial variable), then the appropriatestatistical test is the 2.

    Key wordsbiomedical researchresearch designstatistics and numerical data

    Introduccin

    Cuando observamos la diferencia entre dos terapias o la asocia-cin de un factor de riesgo o indicador pronstico con su desen-lace, surge un cuestionamiento: el resultado es real? Decidir sies real requiere dos juicios que se complementan:

    1. La planeacin y el desarrollo del proceso que docu-mentan dicha diferencia o asociacin estn libres de erro-res, o cuando menos stos son de una magnitud menorque no modifican la orientacin de la diferencia o de laasociacin (es decir, diseo apropiado y ejecucin ade-cuada).

    Investigacin clnica IV.Pertinencia de laprueba estadstica

  • Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405402

    Talavera JO et al. Pertinencia de la prueba estadstica seleccionada

    2. Mostrar relacin (correlacin) entre variables (por ejem-plo, la creatinina srica se eleva conforme disminuye lafuncin renal).

    3. Predecir un desenlace (por ejemplo, la probabilidad deque el sujeto con vida sedentaria y sobrepeso desarrollediabetes mellitus tipo 2).

    Frecuentemente se superponen los modelos, y es as queen ocasiones para demostrar diferencias entre dos grupos sehace uso de modelos inicialmente identificados para prede-

    2. El tamao de la muestra es suficiente para mantener laestabilidad de los datos y la prueba estadstica es apro-piada al objetivo.

    La planeacin y el desarrollo del proceso se han mencio-nado en los tres captulos previos de esta serie. Por otra parte,la estabilidad de los datos ser discutida a detalle en un artcu-lo posterior al hablar de tamao de muestra y valor de p.

    En este artculo discutiremos la pertinencia de la prueba es-tadstica seleccionada. Sin duda, este conocimiento nos permiti-r comprender con mayor precisin los resultados obtenidos enestudios de investigacin clnica y, por supuesto, incrementarnuestra capacidad para hacer un uso adecuado de los mismos.

    Objetivo del estudio y tipo de variable

    Las pruebas estadsticas se eligen a partir de dos caractersti-cas: el objetivo del estudio y el tipo de variables. Dentro delos objetivos del estudio podemos identificar tres:

    1. Demostrar diferencias entre grupos o diferencias en unmismo grupo antes y despus de una maniobra (por ejem-plo, el tratamiento con el frmaco A reduce en mayor pro-porcin la presin sangunea que el tratamiento con elfrmaco B).

    Cuadro I Peso de sujetos en estudio bajo dos esquemasteraputicos

    Grupo A Grupo B

    77 6578 6980 7782 7885 83.5 Promedio 85 83.5 Promedio85 85.0 Mediana 85 85.0 Mediana85 85.0 Moda 89 85.0 Moda86 9388 9689 98

    Las medidas de tendencia central son iguales, pero la dispersin de losdatos es distinta

    Figura 1 Histograma

    Edad

    0

    5

    20 40 60 80 100

    10

    15

    20

    25

    30

    Nm

    ero

    Media 59.79Desviacin estndar de 13.882. Dos desviaciones estndar a cada lado de la media reflejan 95 % de la poblacinPromedio de 59.79, con IC 95 % = 32.03-87.55

  • 403Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405

    Talavera JO et al. Pertinencia de la prueba estadstica seleccionada

    cir un desenlace; esto ocurre sobre todo cuando se requiereajustar la maniobra principal (frmaco A versus frmaco B)por mltiples factores (edad, sexo, ndice de masa corporal,etctera). Pero tambin acontece el fenmeno opuesto, cuan-do se busca predecir un suceso que ocurrir a futuro perosolo se cuenta con una o dos variables predictivas, en estecaso se utiliza una prueba para demostrar diferencias.

    Es importante aclarar que la correlacin bsicamente sir-ve para ver la magnitud de la asociacin entre variables, aun-que debe quedar claro que no determina causalidad, de hechoninguna prueba estadstica puede hacerlo, para ello se re-quiere cubrir una serie de principios descritos por sir AustinBradford Hill.

    Definir el tipo de variable resulta relevante debido a quees el eje para seleccionar la prueba apropiada dependiendodel objetivo buscado. Dentro del tipo de variable existen dosgrupos:

    1. Cuantitativas continuas y discontinuas o discretas: las pri-meras se caracterizan porque pueden tomar cualquier va-lor a lo largo de un continuo (por ejemplo, talla 1.75 m).Por su lado, las discontinuas o discretas utilizan solo n-meros enteros (nmero de partos, 1, 2, 3). En ambas, ladistancia entre una unidad y otra a travs de toda su esca-la es equidistante.

    2. Cualitativas: dentro de stas se encuentran la ordinal y ladicotmica. La ordinal permite dar un orden a la caracte-rstica en estudio, y a diferencia de las cuantitativas ladistancia entre dos categoras no es equidistante (por ejem-plo, falla cardiaca grados I a IV). Las dicotmicas, comosu nombre lo dice, son en las que solo hay dos categoras,que pueden ser binomiales (es una opcin u otra, por ejem-plo, hombre o mujer) o nominales (se refiere a la presen-cia o no de la caracterstica, por ejemplo, vivo a seis meses,s o no).

    Figura 2 Curva de distribucin normal

    Porcentajes

    0.6826

    0.9554

    0.9974

    0.3413 0.3413

    0.4772 0.4772

    0.4987 0.4987

    34.13 %

    13.59 %

    2.14 %

    0.13 %

    Desviacin estndar 3 2 1 0 +1 +2 +3

  • Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405404

    Talavera JO et al. Pertinencia de la prueba estadstica seleccionada

    Es importante mencionar el manejo que sufrir el tipo devariable durante el proceso de anlisis, empezando por la re-coleccin de datos en forma cruda, lo que significa quesolo se trata de una compilacin de informacin de un grupode sujetos. Para que estos datos tengan un significado de uti-lidad se necesita organizarlos y resumirlos. La forma ms sim-ple de organizacin son las tablas de distribucin de frecuencia,sin embargo, en ocasiones es ms fcil entender su represen-tacin grfica a travs de un histograma o polgono de fre-cuencias. No obstante la utilidad de esta informacin, senecesita informacin cuantitativa de los datos recolectados,es decir, se requieren ndices numricos que reflejen las dis-tintas distribuciones de probabilidad, cuya funcin primor-dial es modelar el comportamiento de una gran variedad defenmenos biolgicos. Dentro de estos ndices numricos en-contramos las medidas de tendencia central y las medidas dedispersin.

    1. Medidas de tendencia central (cuadro I y figura 1).

    a) Media: es la suma de un conjunto de datos divididos por elnmero total de ellos. El smbolo para representar la mediade una poblacin es la letra griega mu (), y la media deuna muestra est representada por ,. Es la medida de resu-men ms utilizada para variables cuantitativas.

    b) Mediana: es el valor que se encuentra exactamente a lamitad del total de los datos. La mediana divide una distri-bucin de datos ordenados en exactamente dos partes igua-les. La ventaja de la mediana como medida de tendenciacentral es que sta no se ve afectada por el valor de datosextremos, fenmeno que s ocurre con la media. Es el

    tipo de medida de resumen ms utilizado para las varia-bles cuantitativas que no siguen una distribucin normaly para variables ordinales.

    c) Moda: se refiere al valor que ms se repite en una distribucin.

    2. Medidas de dispersin ms comunes.

    a) Desviacin estndar: refleja la variacin entre todo el con-junto de datos y se utiliza cuando stos siguen una distri-bucin normal.

    b) Percentil: describe la posicin de un valor de la distribu-cin. Se utiliza para variables cuantitativas que no siguenuna distribucin normal y para variables de tipo ordinal.

    c) Rango: diferencia entre el valor ms alto y el valor msbajo de la distribucin.

    En investigacin clnica, como en muchos otros fenme-nos de la vida real, los datos ms frecuentemente analizadosson los cuantitativos, que en el ms de los casos muestranuna distribucin gaussiana, tambin conocida como distribu-cin normal, que se caracteriza por tener forma acampanada,ser simtrica respecto a su media, tener valores de frecuenciadecrecientes conforme se alejan de la media y que nunca lle-gan a cero (asinttica), la moda y la mediana son iguales a lamedia, aproximadamente 68 % de los datos se encuentran en 1 desviacin estndar respecto a su media y 95 % en 2desviaciones estndar (figura 2). Es as que si la agrupacinde datos son de tipo cuantitativo con distribucin normal, sumedida de resumen ser la media y su medida de dispersin,la desviacin estndar. Sin embargo, si su distribucin no esgaussiana, al igual que para una variable de tipo ordinal, su

    Cuadro II Seleccin de la prueba estadstica conforme el objetivo y el tipo de variable

    Demostrar diferencia Mostrar relacin& Predecir 1 variableTipo variable Tipo muestra Dos grupos Tres grupos Dos variables Variable desenlace

    Cuantitativa NR t Student* Anova 1 factor Pearson Regresin lineal(distribucin normal) R t Student** Anova 1 factor

    Cualitativa ordinal NR U Mann-Whitney Kruskal-Wallis SpearmanR Wilcoxon Friedman

    Cualitativa dicotmica NR 2 (Fisher) 2 Coeficiente phi Regresin logstica/

    R McNemar Curvas de supervivencia

    NR = no relacionada, R = relacionada, R = medicin de la variable en el mismo sujeto en dos tiempos distintos* t de Student para muestras independientes

    ** t de Student para muestras relacionadas& Para la correlacin entre 2 variables se utiliza la prueba de aquella en la escala inferior (en realidad ninguna escala es inferior, sin embargo, se hanordenado de las cuantitativas continuas a las dicotmicas, pasando por las cuantitativas discontinuas y las ordinales).

    La variable predictiva puede ser cuantitativa, dicotmica u ordinal (estas ltimas transformadas a variables tipo dummy)

  • 405Rev Med Inst Mex Seguro Soc 2011; 49 (4): 401-405

    Talavera JO et al. Pertinencia de la prueba estadstica seleccionada

    medida de resumen ser la mediana y su medida de disper-sin, el percentil o rango. Finalmente, habr que mencionarque para las variables dicotmicas su medida de resumen esla frecuencia y su medida de dispersin la desviacin estn-dar (su distribucin se acerca a la normal).

    Pertinencia de la prueba estadstica

    Una vez que conocemos nuestro objetivo y las caractersticas denuestros datos (tipo de variable) podemos considerar la pertinen-cia de la prueba estadstica (cuadro II). Sin embargo, existen dosconsideraciones ms cuando el objetivo sea demostrar diferencia:

    1. Si se trata de un estudio donde se compara el valor de undato antes y despus de una maniobra ya sea observacionalo experimental, se le conoce como de muestras relaciona-das, pero si se trata de la comparacin de datos entre dis-tintos grupos se le denomina de muestras no relacionadas.

    2. Si se trata de comparacin entre distintos grupos es nece-sario determinar si ser entre dos o ms grupos.

    Ya con la informacin completa, con el cuadro II pode-mos verificar si la seleccin de la prueba estadstica fue laadecuado conforme la variable y el objetivo. Por ejemplo, sise compara la edad (variable cuantitativa con distribucinnormal en este caso), entre pacientes con lupus eritematososistmico, con y sin afeccin neurolgica (dos grupos), la

    prueba apropiada es la t de Student para muestras indepen-dientes. Pero si lo que se compara entre esos mismos es lafrecuencia de mujeres (variable binomial), entonces la prue-ba estadstica pertinente es la 2. Si lo que se compara entrelos dos grupos es su grado de actividad lpica (escala ordinal),la prueba estadstica pertinente es la U de Mann-Whitney.Por otro lado, si lo que nos muestran es la magnitud de laasociacin (relacin) entre edad (variable cuantitativa condistribucin normal) y el grado de actividad lpica (variableordinal), la prueba pertinente es la r de Spearman. Finalmen-te, si lo que se busca es predecir el peso de un nio (variablecuantitativa) a partir de la edad (variable cuantitativa), tipode alimentacin (variable ordinal: buena, regular o mala) y elsexo (dicotmica), la prueba pertinente es la regresin lineal.Pero si lo que se quiere es predecir la probabilidad de infarto(dicotmica nominal) en los siguientes 10 aos a partir de laedad (cuantitativa), el riesgo aterognico (ordinal, bajo, me-dio y alto) y el sexo (dicotmica binomial), la prueba perti-nente es la regresin logstica mltiple.

    Por ltimo, esperamos que el presente artculo permitaentender la razn de la seleccin de las pruebas estadsticasms empleadas en la investigacin en salud y que, de igualmanera, sirva de gua a quienes se inician en la estadstica.No es suficiente para definir si los resultados obtenidos sonreales, ser necesario tener en consideracin el diseo y eje-cucin del estudio y la estabilidad de los datos, pero este l-timo aspecto merece ser analizado en otro apartado.

    Bibliografa

    1. Armitage P, Berry G, Matthews JNS. Statistical methodsin medical research. 4th ed. Massachusetts, MA:Blackwell Publishing; 2002.

    2. Bland M. Introduction to medical statistics. 3rd ed. Oxford:Oxford University Press; 2003.

    3. Feinstein AR. Clinical epidemiology. The architecture ofclinical research. Philadelphia, PA: W.B. Saunders; 1985.

    4. Feinstein AR. Multivariable analysis: an introduction. NewHaven, CT: Yale University Press; 1996.

    5. Feinstein AR. Principles of medical statistics. New York,NY: Chapman and Hall/CRC; 2002.

    6. Le Chap T. Introductory biostatistics. Hoboken, NJ: NewJersey: John Wiley and Sons; 2003.

    7. Peat J, Barton B. Medical statistics. A guide to data analy-sis and critical appraisal. Malden, MA: Blackwell Publis-hing; 2005.

    8. Portney LG, Watkins MP. Foundations of clinical research:applications to practice. 3rd ed. Saddle River, NJ:Pearson/Prentice Hall; 2009.