Upload
independent
View
0
Download
0
Embed Size (px)
Citation preview
TAMAÑO DE MUESTRA EN ENSAYOS CLÍNICOS Martín Andrés, A. y Femia Marzo, P.
Bioestadística. Facultad de Medicina de Granada.
1. INTRODUCCIÓN: CONCEPTO DE ENSAYO CLÍNICO
Dado que este capítulo versa sobre tamaño de muestra en los Ensayos Clínicos (EC en
adelante), conviene comenzar definiendo lo que se entiende por tal. Un Ensayo Clínico es un
potente mecanismo para evaluar la eficacia de un tratamiento. Aunque la legislación española al
efecto da una definición más amplia (B.O.E. del 13-05-1993), aquí solo contemplamos lo que se
conoce como Ensayos Clínicos Comparativos (de Fase III ó IV en la legislación española):
comparación de unas técnicas, dosificaciones ó productos contra otros. La definición más
apropiada para ellos es la de Meinert (1986):
Un Ensayo Clínico es un diseño experimentalmente planificado para verificar la
eficacia de un tratamiento en humanos a través de la comparación de los
resultados obtenidos en dos grupos de pacientes que reciben, uno el tratamiento
problema, y otro un tratamiento alternativo (nuevo o clásico) o ningún
tratamiento, ambos grupos tomados, tratados y seguidos durante igual período
de tiempo y obtenidos por la partición al azar en dos de un grupo inicial único.
En la definición intervienen diferentes términos y conceptos que no son el objetivo
actual. En ella se ha resaltado el término “eficacia” pues sí es de interés actual. Para evaluar la
eficacia de un tratamiento es preciso determinar qué se va a medir con tal fin. Ello se conoce
como medida de la respuesta, la cual puede ser:
a) Un suceso clínico (como por ejemplo la curación del enfermo): es una cualidad y suele ser
lo preferible (aunque es más costoso en términos de tamaño de muestra).
b) Una medida indirecta (como por ejemplo la presión sanguínea): es una cantidad y suele no
ser preferible (por ser menos informativa clínicamente).
Sea cual sea el caso, el análisis de los datos finales suele llevar a tener que efectuar una
comparación de dos parámetros: dos proporciones (en las cualidades) ó dos medias (en las
cantidades). Pero el objetivo de la comparación es variado.
2
2. HIPÓTESIS A CONTRASTAR
2.1. Introducción
En lo que sigue se asume que los valores altos de la medida de la respuesta implican la
bondad de tratamiento. También los símbolos N, P, A, B ó C que siguen aluden indistintamente
a los parámetros “media poblacional (μ)” ó “proporción poblacional (p)”.
Las hipótesis que se contrastan en un EC comparativo dependen del objetivo perseguido
por el mismo. Pueden ser de dos tipos: Tradicionales (las habituales en estadística) ó de
Bioequivalencia (menos conocidas y propias de los EC).
2.2. Hipótesis tradicionales
Se corresponden con los típicos tests de una ó dos colas y pueden ser de tres tipos:
(T1) Si el objetivo es demostrar la efectividad de un tratamiento nuevo para el que no hay
alternativa:
N = Nuevo 0H : N ≤ P (1 COLA)
P = Placebo →
1H : N > P
⇒ N es efectivo
(T2) Si el objetivo es demostrar que un tratamiento nuevo es mejor que uno clásico:
N = Nuevo 0H : N ≤ C (1 COLA)
C = Clásico →
1H : N > C
⇒ N es mejor que C
(T3) Si el objetivo es elegir el mejor de entre dos tratamientos:
A = Tto. A 0H : A = B (2 COLAS)
B = Tto. B →
1H : A ≠ B
⇒ A es mejor que B (si A > B)
Cuando los parámetros son medias (μ) ello implica “comparar dos medias”. El tamaño de
muestra para esos casos no se verá aquí por ser poco frecuente en los EC y bien conocido en
estadística. Sí se verá en cambio el tamaño de muestra para “comparar dos proporciones”, por lo
habitual en los EC y porque es frecuente hacerlo mal.
3
2.3. Hipótesis de bioequivalencia
Menos clásicas en estadística y más frecuentes en EC son las hipótesis de bioequivalencia
(para medias) ó de equivalencia (para proporciones). Ellas surgen cuando un fármaco nuevo,
una nueva vía de administración de un fármaco clásico, una nueva dosificación de un fármaco
clásico, ... (pero con menores efectos adversos ó menor costo) pretende sustituir al tratamiento
clásico. Las posibilidades son de nuevo tres:
(E1) Si el objetivo es demostrar que el nuevo no es inferior al clásico:
N = Nuevo 0H : N ≤ C −Δ (1 COLA)
C = Clásico →
1H : N > C −Δ
⇒ N no es inferior a C
(Δ> 0 es una cantidad despreciable a efectos biológico-prácticos)
(E2) Si el objetivo es demostrar que el nuevo es sustancialmente superior al clásico:
N = Nuevo 0H : N ≤ C +Δ (1 COLA)
C = Clásico →
1H : N > C +Δ
⇒ N es sustancialmente superior a C
(Δ> 0 es una cantidad relevante a efectos biológico-prácticos)
(E3) Si el objetivo es demostrar que el nuevo es (bio)equivalente al clásico:
N = Nuevo 0H : |N – C| ≥ Δ (2 COLAS)
C = Clásico →
1H : |N – C| < Δ
⇒ N es equivalente a C
(Δ> 0 es una cantidad despreciable a efectos biológico-prácticos)
en donde, en todos los casos, la cantidad Δ es fijada por el investigador (no por el estadístico).
3. FÓRMULAS DE TAMAÑO DE MUESTRA.
3.1. Generalidades
Es bien conocido que, en estadística, una conclusión por H1 (la hipótesis alternativa) es
siempre fiable, pues su error α sí está controlado. Sin embargo una conclusión por H0 será solo
fiable si su error β está también controlado, lo que lleva a fijar de antemano el tamaño de las
muestras. Como la Administración exige que un EC dé siempre una conclusión fiable (a fin de
no descartar un tratamiento que pudiera ser efectivo), la conclusión es que en los EC siempre ha
4
de determinarse el tamaño de las muestras (n1 y n2). La fórmula precisa para determinarlos
depende de:
(1) El diseño utilizado: aquí 2 muestras independientes.
(2) El tipo de medida de la respuesta: aquí una cualidad ó una cantidad.
(3) La distribución estadística (exacta ó aproximada): aquí la normal.
(4) La hipótesis a probar: clásica ó de bioequivalencia.
Pero, conocida la fórmula, su aplicación requiere conocer también:
(5) La razón de asignación 1
1 2
nr=n +n
: usualmente r = 0,5.
ò la razón muestral 2
1
nK = n
: usualmente K =1. Si ci = “costo de cada unidad muestral”
entonces 2 1
1 2
n cK = = n c
.
(6) El número de colas del test: 1 ó 2.
(7) El error α: usualmente el 5%.
(8) La mínima diferencia δ a detectar: δ = μ1–μ2 ó p1−p2.
(9) El error β (=1 –Potencia) asociado a δ: usualmente el 10 ó 20%.
(10) Información sobre los valores reales de ciertos parámetros implicados (proporciones) ó
no (varianzas) en el test.
Además, si hay más de una respuesta en el EC, habrá que:
(11) Elegir la más relevante: usualmente un suceso clínico,
ó elegir el mayor de los ni determinados para cada pregunta.
3.2. La fórmula general para dos grupos
Suele ser frecuente efectuar una demostración individual (para cada problema) acerca de
la fórmula de tamaño de muestra cuando se comparan dos grupos. Sin embargo la demostración
base es la misma para todos los casos en que el estadístico de contraste sea asintóticamente
normal (unidimensional). De modo esquemático:
5
0 0H : θ = θ ( )1 1 1 0H : θ = θ θ > θ
( )20 0
ˆ N ; / nθ→ θ σ ( )21 1
ˆ N ; / nθ→ θ σ
0H
1H
L0θ 1θ
αβ
0H
1H
0 1
0 1 0
1 1 1 1 1
L / n (por causa de )
L / n (por causa de ) / n
z
z z−α
β −β
⎧ = θ + σ α⎪⎨
= θ + σ β = θ − σ⎪⎩
⇓ 2
1 0 1 1
1 0
z σ + z σn = −α −β⎛ ⎞
⎜ ⎟θ − θ⎝ ⎠
En donde para tests de 2 colas hay que cambiar 1−α por 1−α/2, y se sobreentiende que zx=X-
percentil de la N(0,1).
3.3. Particularización a los casos actuales
De la simple fórmula anterior se pueden extraer como caso particular todas las fórmulas
del capítulo actual. Por ejemplo, y de nuevo de modo esquemático, en el caso de la comparación
de dos proporciones (muestras independientes) será:
0 1 2H : p p 0 0− = θ = θ 1 1 2 1H : p p − = δ θ = θ
( ) ( ) ( )i i 1 1 2 2d di i 1 2 1 2
i 1 2
p 1 p p 1 p p 1 pˆ ˆ ˆp N p ; p p N p p ;n n n− − −⎛ ⎞ ⎛ ⎞
⎯⎯→ ⇒ − ⎯⎯→ − +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
⇓ ( )1 2
ˆˆ ˆp p − θ ( )1 2ˆˆ ˆp p − θ
0 1 2H : p p ( p)= =↓
1 2(si n n n )= = 1 1 2H : p p= + δ↓
( ) 202p 1 p
N 0;n n
⎛ ⎞− σ⎜ ⎟⎜ ⎟⎝ ⎠
( ) ( ) 2
1 1 2 2 1p 1 p p 1 p σN ;n n
⎛ ⎞− + −δ⎜ ⎟⎜ ⎟⎝ ⎠
⇓
6
( ) ( ) ( )
2
1 1 1 1 2 22p 1 p p 1 p p 1 pn
z z−α −β⎧ ⎫− + − + −⎪ ⎪= ⎨ ⎬δ⎪ ⎪⎩ ⎭
El problema con la expresión anterior es que p y p1 son desconocidos (pero 2 1p = p − δ ). En
el caso de p es frecuente argumentar que ( ) 1 1 2 2 1 20
1 2
n p n p p pˆp E p Hn n 2+ +
= | = =+
y así sólo p1 es
desconocido. Haciendo 1dn dp 0= puede probarse que los valores p1= 0,5±δ/2 ocasionan un
máximo de n (con lo que sobrará muestra y nunca faltará), y así p1 hay que elegirlo lo más
cercano a esos valores y compatible con la información que se posea sobre él.
4. TAMAÑO DE MUESTRA EN LOS TESTS CLÁSICOS PARA LA
COMPARACIÓN DE DOS PROPORCIONES INDEPENDIENTES
4.1. Preámbulo y planteamiento del ejemplo
El caso -que se corresponde con las hipótesis T1, T2, y T3- es bien conocido, pero casi
todo el mundo aplica mal la fórmula. El Cuadro I presenta un resumen del modo de actuar. Él va
a ser ilustrado con el siguiente ejemplo:
Un ensayo clínico tiene por fin comparar los porcentajes de éxitos de un
tratamiento nuevo (el nº 1) con uno clásico (el nº 2) a través de dos muestras
independientes. Se va a realizar el test al 5% de error y se desea una potencia
del 80% para la alternativa de que el nuevo tratamiento supera al clásico en un
10%. Del clásico se sabe que tiene éxito en un 70% a 80% de los casos. ¿Qué
tamaño de muestra debe tomarse de cada grupo? (a) Bajo el diseño óptimo;
(b) ¿Y si los individuos del tratamiento nuevo cuestan 4 veces más que los del
clásico?
Del enunciado se desprenden varios datos generales:
Hipótesis: 10 1 2 1 1 2
2
p NuevoH : p p vs H : p p 1 cola
p Clásico≡⎧
= > ⇒ ⎨ ≡⎩
Errores: 5%α = ,, 20%β =
Valor delta y primera alternativa de interés: 1 2p p 0,10− = δ =
⇒1ª alternativa de interés: 1 2p = p + 0,10
(1)
7
iInformación sobre las p : 20,7 p 0,8≤ ≤
4.2. Caso de tamaños de muestra iguales.
En general 1 2n n n= = es un diseño óptimo y de ahí que K=1. Ya se ha dicho que para
aplicar la expresión (1) debe sustituirse p1 y p2 por unos valores conservadores que
proporcionen más muestra de la precisa (es decir, un menor error β ó una mayor potencia de las
requeridas). Siguiendo paso a paso el Cuadro I (en su parte izquierda):
1) 1 2Valores conservadores de p y p :
a) Lo más cercanos a ip 0,5 / 2 0,5 0,1/ 2 0, 45 y 0,55,= ± δ = ± =
b) Compatibles con la información 20,7 p 0,8≤ ≤ 2p 0,7 ,⇒ =
c) Que difieran en δ ⇒ 1 2p p 0,10= + 1 1p 0,7 0,1 0,8 p .⇒ = + = =
2) Valor conservador de p: 1 2p +p 0,7 0,8p 0,75 p .2 2
+= = = =
3) Valores z: 15% 1,645z −αα = ⇒ = ,, 120% 0,842 .z −ββ = ⇒ =
4) Aproximado erróneo (clásico): 2
01,645 2 0,75 0,25 0,842 0,8 0,2 0,7 0,3n
0,1⎧ ⎫× × + × + ×⎪ ⎪= ⎨ ⎬⎪ ⎪⎩ ⎭
230,9 231.=
5) Aproximado correcto: (incluye la corrección por continuidad del test)
1 2n = n = n 2
230,9 4 1 1 250,5 251.4 230,9 0,1
⎧ ⎫⎪ ⎪= + + =⎨ ⎬×⎪ ⎪⎩ ⎭
Lo usual en la literatura es utilizar el valor n0=231. La mejor prueba de que es incorrecto
(por no incluir la corrección por continuidad) es que el valor exacto obtenido por las tablas de
Casagrande et al (1978) es ne=249 (muy superior al anterior). Sin embargo el valor correcto de
n=251 concuerda bastante bien con el exacto de 249.
4.3. Caso de tamaños de muestra distintos.
En ocasiones los elementos de uno de los grupos estudiados son más baratos de obtener que
los del otro, y así un diseño con n1≠n2 es el adecuado (menos individuos del grupo más caro).
Siguiendo de nuevo el Cuadro I (en su parte derecha):
1) Valor de K: 2 11 2
1 2
n cK con c 4c K 2n c
= = = ⇒ =
8
2) 1 2Valores conservadores de p y p :
a) Lo más cercanos a (para el caso de p1>p2, pues p1 = p2+0,10):
2= 0,5 0,1 3 = 0,47p − (pues aquí p1>p2 y la información es sobre p2)
b) Compatibles con la información 20,7 p 0,8≤ ≤ 2p 0,7 .⇒ =
c) Que difieran en δ: 1 2p p 0,10= + 1 1p 0,7 0,1 0,8 p .⇒ = + = =
3) Valor conservador de p: p = (0,8 + 2 0,7) / (1+2) = 0,733 = p .×
4) Valores z: 15% 1,645z −αα = ⇒ = ,, 120% 0,842 .z −ββ = ⇒ =
5) Aproximado erróneo (clásico):
2
01 1,645 0,733 0,267 3 0,842 0,8 0,2 2 0,7 0,3n2 0,1⎧ ⎫× × + × × + ×⎪ ⎪= ⎨ ⎬⎪ ⎪⎩ ⎭
=175,5 > 176 .
6) Aproximado correcto: 2
1 1
2 2
175,5 2 3n 1 1 190,2 n =191 ,4 2 175,5 0,1
n 2 191 382 n =382 .
⎧ ⎫×⎪ ⎪= + + = ⇒⎨ ⎬× ×⎪ ⎪⎩ ⎭
= × = ⇒
5. TAMAÑO DE MUESTRA EN LOS TESTS DE EQUIVALENCIA DE DOS
PROPORCIONES INDEPENDIENTES
5.1. Preámbulo y planteamiento del ejemplo
El caso actual -que se corresponde con las hipótesis E1, E2, y E3- es menos conocido. El
Cuadro II presenta un resumen del modo de actuar (aunque él también incluye el test -que no se
comenta aquí- por ser poco conocido). El cuadro II va a ser ilustrado con el siguiente ejemplo:
Cierto tipo de enfermedad requiere de unos cuidados especiales que
tradicionalmente realizan los médicos (por lo que son costosos
económicamente) y cuyo éxito se cifra entre el 60% y el 70% de los casos. Se
pretende que sean un grupo de enfermeros especialmente entrenados los que
realicen tales cuidados (lo que sería más barato). ¿Qué valor de 1 2n =n es
preciso? (Dunnett and Gent, 1977).
9
5.2. Caso de No-Inferioridad (NI)
Si las hipótesis son las E1 y se desea α=β=5% entonces, siguiendo paso a paso el
Cuadro II (en su parte izquierda) para K=1 (tamaños iguales):
1) Hipótesis:
0 2 11
2 1 2 1
H : p p 0,1p % de éxitos de los médicos0,1 + NI
p % de éxitos de los enfermeros H : p p 0,1= −= ⎧⎧
⇒ Δ =⎨ ⎨= > −⎩ ⎩
2) δ nulo y δ alternativo ( )0 2 1H : p p= + δ :
0 2 1 0
1 2 1 1
0,10 p p bajo H
0 p p bajo H (alternativa natural no explicitada)
⎧ δ = − = −⎪⎨δ = = −⎪⎩
3) Información: 10,6 p 0,7 .≤ ≤
4) 1 2Valores conservadores de p y p :
a) p1 lo más cercano a 11
Kδp 0,5K+1
= + (pues δ1≤0) = 0,5+0=0,5.
b) Compatible con la información: 10,6 p 0,7≤ ≤ 1p 0,6 .⇒ =
c) Que difieran en δ1: p2=p1+δ1 2 2p 0,6 0 0,6 p .⇒ = + = =
5) 1 2Valores conservadores de p y p
1 1p 0,6 1 (0 0,1) / 2 0,6 0,05 0,65 p= + × + = + = =
2 1 0 2p p 0,65 0,10 0,55 p= + δ = − = =
6) Valores z: 1 0,05 1 0,05 0,95z z z 1,645 .− −= = =
7) Tamaño erróneo:
2
01 1,645 1 0,65 0,35 0,55 0, 45 1,645 1 0,6 0, 4 0,6 0, 4n1 0 0,10⎧ ⎫× × + × + × × + ×⎪ ⎪= ⎨ ⎬+⎪ ⎪⎩ ⎭
= 516,85 517 (sin corrección por continuidad: incorrecto)
8) Tamaño correcto:
( )
2
1516,85 2 2n 1 1
4 1 516,85 0 0,10⎧ ⎫×⎪ ⎪= + +⎨ ⎬× × +⎪ ⎪⎩ ⎭
= 536,7 537 (con corrección por
10
continuidad: correcto) ⇒ 2 1 2 1n K n n n 537 .= ⇒ = =
5.3. Caso de Equivalencia (PE)
Si las hipótesis son las E3 y se desea α=5% y β=10% entonces, siguiendo paso a paso el
Cuadro II (en su parte derecha) para K=1 (tamaños iguales):
1) Hipótesis:
0 2 11
2 1 2 1
H : p p 0,10p % de éxitos de los médicos0,10 PE
p % de éxitos de los enfermeros H : p p 0,10
⎧ − ==⎧ ⎪⇒ Δ = +⎨ ⎨=⎩ − <⎪⎩
2) Δ nulo y Δ alternativo:
0 2 1 0
1 2 1 1 2 1
p p 0,10 bajo H
p p 0 bajo H : 0,10 p p 0,10 (alternativa natural).
⎧Δ = − = = Δ⎪⎨Δ = − = − < − < +⎪⎩
3) Información: 10,6 p 0,7 .≤ ≤
4) 1 2Valores conservadores de p (=p ):
a) p1 compatible con la información: 10,6 p 0,7 .≤ ≤
b) Lo más cercano posible a 0,5 fi 1p 0,6 .=
5) 1 2 0Valores conservadores de p y p (la H es doble) :
( ) ( )
( ) ( )
1 2 1
1 2 1
0,1p 0,6 0,55 p p 0,652
0,1p 0,6 0,65 p p 0,552
⎧ +Δ = − = → +Δ = + Δ =⎪⎪⎨⎪ −Δ = + = → −Δ = −Δ =⎪⎩
6) Valores z: 1 0,05 1 0,1/ 2 0,95z z z 1,645 .− −= = =
7) Tamaño erróneo: 2
0 0 01,645 1 0,55 0, 45 0,65 0,35 1,645 2 0,6 0, 4n ( ) n ( ) n
0,1⎧ ⎫× × + × + × ×⎪ ⎪+Δ = −Δ = = ⎨ ⎬⎪ ⎪⎩ ⎭
= 516,85 ( sin c.p.c.).
8) Tamaño correcto: 2
1516,85 2 2n 1 1
4 1 516,85 0,1⎧ ⎫×⎪ ⎪= + +⎨ ⎬× ×⎪ ⎪⎩ ⎭
= 536,7 (con c.p.c.) ⇒ 2 1 2 1n = K n n = n =537 .⇒
11
6. BIOEQUIVALENCIA DE DOS MEDIAS
6.1. Generalidades y ejemplo a estudiar
Cuando se administra una droga a un individuo, conviene conocer la proporción y
extensión en que se absorbe el ingrediente activo haciéndose disponible para el organismo: es lo
que se llama la biodisponibilidad. Para evaluarla se mide la concentración del fármaco antes y
después (a diferentes tiempos) de la administración de la droga:
0 1 2 K
0 1 2 K 0
Tiempos: t 0 t t t 3 vidas mediasConcentración: C C C C C
= ≥⎧⎨⎩
lo que proporciona la Curva de Concentración-Tiempo adjunta.
Los parámetros farmacocinéticos relevantes para evaluar la biodisponibilidad suelen ser:
tmax = Tiempo hasta alcanzar la concentración máxima.
Cmax = Concentración máxima alcanzada.
AUC = Área bajo la curva = Concentración media ( )K
i i 1i i 1
i 1
C C t t2
−−
=
+= −∑
obtenida por la fórmula trapezoidal;
en donde el parámetro AUC es el más habitual y relevante.
Dos drogas son terapéuticamente equivalentes cuando su biodisponibilidad es similar.
En términos de AUC, si:
( )( )
1 1 1
2 2 2
x AUC droga 1 N ;
x AUC droga 2 N ;
ESTÁNDAR
NUEVO
⎧ = → μ σ ≡⎪⎨
= → μ σ ≡⎪⎩
entonces puede hablarse de:
1 2
1 2
: Si , ,: Si
1 2μ μ σ ; σ⎧⎨ μ μ⎩
Bioequivalencia poblacionalBioequivalencia promedio
12
Para que 1 2μ μ es preciso definir la máxima diferencia permitida, pero es lógico que ella sea
relativa a la magnitud del estándar ( 1μ ). Por ello, la hipótesis alternativa para probar la
Bioequivalencia de Razón será:
( ) ( )11 I 2 1 IH / usualmenteS
−θ ≤ μ μ ≤ θ = θ
Con frecuencia las xi no siguen la distribución normal, pero ( )i i i i iy ln x N ln ; '= → η = μ σ , en
cuyo caso
I I 2 1 2 1 S S=ln ln ln ln δ θ ≤ μ − μ = η −η ≤ θ = δ
y así la hipótesis alternativa para probar la Bioequivalencia de Diferencia será:
( ) ( )1 I 2 1 S IH usualmenteδ ≤ η −η ≤ δ = −δ
Los dos tests anteriores son poco conocidos y de ahí que el Cuadro III los incluya
(aunque no los ejemplificamos). A los efectos de calcular el tamaño de muestra, el Cuadro III
indica los cálculos a realizar (que sí serán ilustrados). Al final del Cuadro III también se dan los
valores usuales en EEUU (FDA) y en Europa (CMPM) para los límites 1 S y θ θ : ellos son los
exigidos por la legislación sobre EC en cada ámbito. El Cuadro III va a ser ilustrado con el
siguiente ejemplo:
Un medicamento se administra tradicionalmente en suspensión oral de 5 ml
(estándar) y se desea cambiar a la más cómoda administración de tabletas de 5 mg (nuevo).
¿Qué tamaño de muestra habrá que tomar para demostrar la bioequivalencia de ambas
presentaciones bajo la regla del 80/125 y para el parámetro AUC? (a=5%; b=10%):
a) Por el método de razón, si se sabe que las AUC son normales y que el coeficiente de
variación del AUC del estándar es del orden del 10%; b) Por el método de diferencia, si se
sabe que las AUC son log-normales y que la desviación típica de ln(AUC) en un
experimento previo realizado con el estándar fue de 0,09 (10 g.l.).
6.2. Tamaño de muestra en el caso de la bioequivalencia de razón.
Siguiendo paso a paso el Cuadro III (en su parte derecha) y para K=1 (tamaños iguales):
1) Hipótesis:
( )
10 2 1 I S I 2
1 2 1 1
H : / 0,8 ó 1, 25 , ,
H : / 1 alternativa natural ,,
NUEVO
ESTÁNDAR
−⎧ μ μ = θ = θ = = θ μ =⎪⎨
μ μ = μ =⎪⎩
13
2) Datos:
1 1 / 2 0,95 1 15% ,, 10% = z = z =1,645 , CV / 0,1.z −α −βα = β = ⇒ = σ μ =
3) Tamaño de muestra:
( ) ( )( )
( ) ( )( )
22 2
1 I 2
1 222 2
1 S 2
1 1 0,8n 1,645 1,645 0,1 4, 41 1 0,8
n n 5 .1 1 1, 25n 1,645 1,645 0,1 4, 4
1 1 1, 25
⎧ + ×θ = + × × =⎪
× −⎪ ⇒ = =⎨+ ×⎪ θ = + × × =⎪ × −⎩
6.3. Tamaño de muestra en el caso de bioequivalencia de diferencia.
Siguiendo paso a paso el Cuadro III (en su parte izquierda) y para K=1 (tamaños iguales):
1) Hipótesis:
( )
0 2 1 I I
1 2 1
H : ln ln ln 0,8 ó ln 1, 25
ln 0,8 ln 1,25H : ln ln 0 alternativa natural2
S⎧ μ − μ = = δ = δ = −δ⎪⎨ +
μ − μ = =⎪⎩
2) Datos:
( ) 2 21 1 / 2 0,95t t = t 10 g.l. 1,812 , s 0,09 .−α −β= = =
3) Tamaño de muestra: 2
21 1 2
2 1,812 1,812n 4 0,09 4,3 n =n =5 .1 ln 1, 25 ln 0,8
+⎧ ⎫= × × × = ⇒⎨ ⎬−⎩ ⎭
Bibliografía y Referencias
CASAGRANDE, J.T.; PIKE, M.C. and SMITH, P.G. (1978). The power function of the exact test for comparing two binomial distribution. Applied Statistic 27 (2), 176-180.
DUNNETT, C.W. and GENT, M (1977). Significance testing to establish equivalence between treatments, with special reference to data en the form of 2×2 tables. Biometrics 33, 593-602.
MACHIN, D.; CAMPBELL, M.J; Fayers, P. and Pinol, A. (1997). Sample Size Tables for Clinical Studies. (2ª Edition). Blackwell Science. UK.
MEINERT, C.L. (1986). Clinical Trials: Desing, Conduct and Analysis. Oxford University Press. New York.
14
Cuadro I: TAMAÑO DE MUESTRA PARA DOS PROPORCIONES INDEPENDIENTES
DATOS PREVIOS A FIJAR
H1 * H1≡p1>p2 (una cola) ó H1≡p1≠p2 (dos colas).
* Es la hipótesis alternativa (la que se desea probar fuera de toda duda).
α * Es el error α (ó de Tipo I) asociado a una conclusión errónea por H1. * Usualmente se le elige del 1% ó del 5% (según la fiabilidad deseada en una conclusión por H1).
β * Es el error β (ó error de Tipo II) asociado a una conclusión errónea por H0≡p1=p2. * Usualmente se elige del 10% ó 20% según cómo de fiable se quiere que sea una conclusión por H0. * 1-β=θ es la potencia.
δ * Es la mínima diferencia de interés ó diferencia entre p1 y p2 que, de ocurrir, se desea detectar
(conclusión por H1) el θ% de las veces en que esta ocurra. * δ=p2−p1 en tests de una cola ; δ=⏐p2−p1⏐ en tests de dos colas.
K * Es el valor de n2/n1 ó cociente de los tamaños muestrales 1 2c /c(= con ci el costo de cada unidad muestral en cada muestra). Usualmente es K=1 (muestras de igual tamaño).
CÁLCULOS K = 1: 1 2n n n= = K ≠ 1: 1 2 1n n ,, n K n= =
a) Difieran en el δ previsto. Dos proporciones que: b) Sean compatibles con la información que se posea sobre ellas. c) Sean lo más cercanas posibles a las parejas de abajo. p1
p2
ip 0,5 / 2= ± δ 21 1 2
K= 0,5 , p = 0,5 + si <p p pK+1 K+1δ δ
−
21 1 2K= 0,5 + , p = 0,5 si >p p pK+1 K+1δ δ
−
1 2p = ( ) / 2p p+ 1 2p = ( ) /(1 K)K pp + +
2
1 1 1 1 2 20
2pq p q p qn
z z−α −β⎛ ⎞+ +
= ⎜ ⎟⎜ ⎟δ⎝ ⎠
{ }22 2
0 1 1Máx n 1 / 2z z−α −β= + − δ δ
( )2
1 1 1 1 2 20
pq K+1 p q K p q1nK
z z−α −β⎛ ⎞+ +⎜ ⎟=⎜ ⎟δ⎝ ⎠
( )( )
23
20 1 1 32
4 K 1K 1Máx n 14K K 1
z z−α −β
⎧ ⎫++ ⎪ ⎪= + − δ⎨ ⎬δ +⎪ ⎪⎩ ⎭
2
0
0
n 4n 1 14 n⎧ ⎫⎪ ⎪= + +⎨ ⎬δ⎪ ⎪⎩ ⎭
( )
2
0
0
2 K 1nn 1 14 Kn
⎧ ⎫+⎪ ⎪= + +⎨ ⎬δ⎪ ⎪⎩ ⎭
1) Las fórmulas son para el test de una cola. Para el test de dos colas cambiar 1−α por 1−α/2. 2) Por zx se alude al percentil X de una normal típica. Por ejemplo: z97,5%=1,96. 3) Cualquier valor q ó qi alude a 1−p ó 1−pi.
15
Cuadro II: EQUIVALENCIA DE DOS PROPORCIONES
GENERALIDADES
H1 ( ) ( )2 1 2 1 2 1 2 1NI: p p con 0 , , SS: p p ,, SG: p p con 0 , , PE: p p> −Δ Δ > > + Δ > + δ δ ≠ − < Δ
H0 La H1 puesta como igualdad (con p2=NUEVO y p1=ESTÁNDAR): en PE es doble.
Notación ( ) 2i i i 2 1 1 1 2 1 1 2 1 2 2 1 i i i 1 2ˆ ˆ ˆp x n , d p p , p a n N, a x x , N=n +n , p p , s p q n , c N 2n n= = − = − δ = + = +δ = =∑
TEST MUY APROXIMADO SG =NI ó SS PE
SG SG SGd δ c P {z }Z P Zs− −
= ⇒ = ≥
en NI,, z Normal típica
en SSδ = −Δ⎧
=⎨δ = +Δ⎩
{ } { }NI NI NIZ d c / s con s para P P z Z= +Δ− δ = −Δ⇒ = ≥
{ } { }SS SS SSZ d c / s con s para P P z Z= −Δ+ δ = +Δ⇒ = ≤
Método TOST: { }PE NI SSP Max P , P=
TAMAÑO DE MUESTRA (K=n2/n1) SG = NI ó SS PE
( )2 1 1 1 2 1 0 0 1 0p p bajo H ; p p bajo H− = δ − = δ δ > δ 2 1 1 2 1 0p p 0 bajo H ; p p bajo H− = − = ±Δ
p1 compatible con la información que se posea sobre el estándar y lo más cercano a 1p =0,5+(-)Kδ1/(K+1) si δ1≤(≥)0 ⇒ p2=p1+δ1.
p1 compatible con la información que se posea sobre el estándar y lo más cercano posible a 0,5.
( ) ( )1 1 1 0 2 1 0p p K / K 1 p p= + δ −δ + ⇒ = +δ ( )1 1 2 1p p K / K 1 p p
con ó (dos parejas)= − δ + ⇒ = + δ
δ = +Δ δ = −Δ
2
1 1 1 2 2 1 1 1 2 20
1 0
z Kp q p q z Kp q p q1nK
−α −β⎧ ⎫+ + +⎪ ⎪= ⎨ ⎬δ −δ⎪ ⎪⎩ ⎭
( ) ( )
2
1 1 1 2 2 1 /2 1 10
z Kp q p q z K 1 p q1nK
−α −β⎧ ⎫+ + +⎪ ⎪δ = ⎨ ⎬Δ⎪ ⎪⎩ ⎭
( ) ( ){ } ( )( )0 0 0 0n Max n , n n si K 1= +Δ −Δ = +Δ =
( )( )
2
01
0 1 0
2 K 1nn 1 14 Kn
⎧ ⎫+⎪ ⎪= + +⎨ ⎬δ − δ⎪ ⎪⎩ ⎭
( )2
01
0
2 K 1nn 1 14 Kn
⎧ ⎫+⎪ ⎪= + +⎨ ⎬Δ⎪ ⎪⎩ ⎭
NOTA: Cualquier valor q alude a 1−p
16
Cuadro III: BIOEQUIVALENCIA DE DOS MEDIAS
de Diferencia (si x→log-Normal) de Razón (si x→Normal)
H1 ( )I 2 1 S I usualmenteδ < μ −μ < δ = −δ ( )1I 2 1 S I/ usualmente−θ < μ μ < θ = θ
H0 Es doble: la H1 puesta como igualdad (con 2μ =NUEVO y 1μ =ESTÁNDAR)
Notación 1n = tamaños ,, ix =medias ,, 2s = varianza común (con 1 2f n n 2 g.l.)= + −
TEST TOST
Estadísticos I I2 1
S S
1 2
= t ( )x x tt ( ) = = t ( )1 1 ts
n n
⎧− − δ δδ ⎨ δ⎩+
I I2 12
S S
1 2
= t ( )x x tt ( ) = = t ( )t1s
n n
θ⎧−θθ ⎨ θθ ⎩+
Regla de test (TOST)
* Si ( ) ( )I 1 S 1 1t t f y t t f H al error −α −α≥ ≤ − ⇒ α .
* El valor P es el máximo entre los dos valores P de It y St .
* Xt (f) es el X−percentil de la distribución de Student con f g.l.
(σ2=varianza común) TAMAÑO DE MUESTRA ( )2 1K n /n=
H1 y H0 ( )2 1 I S 1
2 1 I S 0
/ 2 bajo Hó bajo H
μ −μ = δ + δ
μ −μ = δ δ 2 1 1
2 1 I S 0
/ 1 bajo H/ ó bajo H
μ μ =μ μ = θ θ
n1
21 1 / 2 2
1S I
z zK 1n 4K
−α −β+⎧ ⎫+= σ⎨ ⎬δ − δ⎩ ⎭
z se cambia por t(f) si σ2 es sustituido por s2 (f g.l.)
( ) ( )( )
2 22
1 1 1 / 2 21
1 Kn z zK 1
−α −β
⎛ ⎞σ + θθ = + ⎜ ⎟μ −θ⎝ ⎠
( ) ( ){ }( )
1 1 I 1 S
1S I
n Max n ; n
única si K 1 y −
= θ θ
= θ = θ
Otros 2 1n K n ,,= z = Normal típica ,, t(f)=Student con f g.l.
Reglas usuales: EMEA (+CMPM): http://www.eudra.org/
FDA: 80/125 ” Iθ =0,8 Sθ =1,25
CMPM: 70/143 ” Iθ =0,7 Sθ =1,43
Otras: 75/75 ” Iθ =0,75 Sθ =1,25
20% ” Iθ =0,8 Sθ =1,2
Los valores δ son el logaritmo neperiano de los anteriores valores θ.