16
TAMAÑO DE MUESTRA EN ENSAYOS CLÍNICOS Martín Andrés, A. y Femia Marzo, P. Bioestadística. Facultad de Medicina de Granada. 1. INTRODUCCIÓN: CONCEPTO DE ENSAYO CLÍNICO Dado que este capítulo versa sobre tamaño de muestra en los Ensayos Clínicos (EC en adelante), conviene comenzar definiendo lo que se entiende por tal. Un Ensayo Clínico es un potente mecanismo para evaluar la eficacia de un tratamiento. Aunque la legislación española al efecto da una definición más amplia (B.O.E. del 13-05-1993), aquí solo contemplamos lo que se conoce como Ensayos Clínicos Comparativos (de Fase III ó IV en la legislación española): comparación de unas técnicas, dosificaciones ó productos contra otros. La definición más apropiada para ellos es la de Meinert (1986): Un Ensayo Clínico es un diseño experimentalmente planificado para verificar la eficacia de un tratamiento en humanos a través de la comparación de los resultados obtenidos en dos grupos de pacientes que reciben, uno el tratamiento problema, y otro un tratamiento alternativo (nuevo o clásico) o ningún tratamiento, ambos grupos tomados, tratados y seguidos durante igual período de tiempo y obtenidos por la partición al azar en dos de un grupo inicial único. En la definición intervienen diferentes términos y conceptos que no son el objetivo actual. En ella se ha resaltado el término “eficacia ” pues sí es de interés actual. Para evaluar la eficacia de un tratamiento es preciso determinar qué se va a medir con tal fin. Ello se conoce como medida de la respuesta, la cual puede ser: a) Un suceso clínico (como por ejemplo la curación del enfermo): es una cualidad y suele ser lo preferible (aunque es más costoso en términos de tamaño de muestra). b) Una medida indirecta (como por ejemplo la presión sanguínea): es una cantidad y suele no ser preferible (por ser menos informativa clínicamente). Sea cual sea el caso, el análisis de los datos finales suele llevar a tener que efectuar una comparación de dos parámetros: dos proporciones (en las cualidades) ó dos medias (en las cantidades). Pero el objetivo de la comparación es variado.

Tamaño de muestra en ensayos clínicos (Sample size in clinical trials)

Embed Size (px)

Citation preview

TAMAÑO DE MUESTRA EN ENSAYOS CLÍNICOS Martín Andrés, A. y Femia Marzo, P.

Bioestadística. Facultad de Medicina de Granada.

1. INTRODUCCIÓN: CONCEPTO DE ENSAYO CLÍNICO

Dado que este capítulo versa sobre tamaño de muestra en los Ensayos Clínicos (EC en

adelante), conviene comenzar definiendo lo que se entiende por tal. Un Ensayo Clínico es un

potente mecanismo para evaluar la eficacia de un tratamiento. Aunque la legislación española al

efecto da una definición más amplia (B.O.E. del 13-05-1993), aquí solo contemplamos lo que se

conoce como Ensayos Clínicos Comparativos (de Fase III ó IV en la legislación española):

comparación de unas técnicas, dosificaciones ó productos contra otros. La definición más

apropiada para ellos es la de Meinert (1986):

Un Ensayo Clínico es un diseño experimentalmente planificado para verificar la

eficacia de un tratamiento en humanos a través de la comparación de los

resultados obtenidos en dos grupos de pacientes que reciben, uno el tratamiento

problema, y otro un tratamiento alternativo (nuevo o clásico) o ningún

tratamiento, ambos grupos tomados, tratados y seguidos durante igual período

de tiempo y obtenidos por la partición al azar en dos de un grupo inicial único.

En la definición intervienen diferentes términos y conceptos que no son el objetivo

actual. En ella se ha resaltado el término “eficacia” pues sí es de interés actual. Para evaluar la

eficacia de un tratamiento es preciso determinar qué se va a medir con tal fin. Ello se conoce

como medida de la respuesta, la cual puede ser:

a) Un suceso clínico (como por ejemplo la curación del enfermo): es una cualidad y suele ser

lo preferible (aunque es más costoso en términos de tamaño de muestra).

b) Una medida indirecta (como por ejemplo la presión sanguínea): es una cantidad y suele no

ser preferible (por ser menos informativa clínicamente).

Sea cual sea el caso, el análisis de los datos finales suele llevar a tener que efectuar una

comparación de dos parámetros: dos proporciones (en las cualidades) ó dos medias (en las

cantidades). Pero el objetivo de la comparación es variado.

2

2. HIPÓTESIS A CONTRASTAR

2.1. Introducción

En lo que sigue se asume que los valores altos de la medida de la respuesta implican la

bondad de tratamiento. También los símbolos N, P, A, B ó C que siguen aluden indistintamente

a los parámetros “media poblacional (μ)” ó “proporción poblacional (p)”.

Las hipótesis que se contrastan en un EC comparativo dependen del objetivo perseguido

por el mismo. Pueden ser de dos tipos: Tradicionales (las habituales en estadística) ó de

Bioequivalencia (menos conocidas y propias de los EC).

2.2. Hipótesis tradicionales

Se corresponden con los típicos tests de una ó dos colas y pueden ser de tres tipos:

(T1) Si el objetivo es demostrar la efectividad de un tratamiento nuevo para el que no hay

alternativa:

N = Nuevo 0H : N ≤ P (1 COLA)

P = Placebo →

1H : N > P

⇒ N es efectivo

(T2) Si el objetivo es demostrar que un tratamiento nuevo es mejor que uno clásico:

N = Nuevo 0H : N ≤ C (1 COLA)

C = Clásico →

1H : N > C

⇒ N es mejor que C

(T3) Si el objetivo es elegir el mejor de entre dos tratamientos:

A = Tto. A 0H : A = B (2 COLAS)

B = Tto. B →

1H : A ≠ B

⇒ A es mejor que B (si A > B)

Cuando los parámetros son medias (μ) ello implica “comparar dos medias”. El tamaño de

muestra para esos casos no se verá aquí por ser poco frecuente en los EC y bien conocido en

estadística. Sí se verá en cambio el tamaño de muestra para “comparar dos proporciones”, por lo

habitual en los EC y porque es frecuente hacerlo mal.

3

2.3. Hipótesis de bioequivalencia

Menos clásicas en estadística y más frecuentes en EC son las hipótesis de bioequivalencia

(para medias) ó de equivalencia (para proporciones). Ellas surgen cuando un fármaco nuevo,

una nueva vía de administración de un fármaco clásico, una nueva dosificación de un fármaco

clásico, ... (pero con menores efectos adversos ó menor costo) pretende sustituir al tratamiento

clásico. Las posibilidades son de nuevo tres:

(E1) Si el objetivo es demostrar que el nuevo no es inferior al clásico:

N = Nuevo 0H : N ≤ C −Δ (1 COLA)

C = Clásico →

1H : N > C −Δ

⇒ N no es inferior a C

(Δ> 0 es una cantidad despreciable a efectos biológico-prácticos)

(E2) Si el objetivo es demostrar que el nuevo es sustancialmente superior al clásico:

N = Nuevo 0H : N ≤ C +Δ (1 COLA)

C = Clásico →

1H : N > C +Δ

⇒ N es sustancialmente superior a C

(Δ> 0 es una cantidad relevante a efectos biológico-prácticos)

(E3) Si el objetivo es demostrar que el nuevo es (bio)equivalente al clásico:

N = Nuevo 0H : |N – C| ≥ Δ (2 COLAS)

C = Clásico →

1H : |N – C| < Δ

⇒ N es equivalente a C

(Δ> 0 es una cantidad despreciable a efectos biológico-prácticos)

en donde, en todos los casos, la cantidad Δ es fijada por el investigador (no por el estadístico).

3. FÓRMULAS DE TAMAÑO DE MUESTRA.

3.1. Generalidades

Es bien conocido que, en estadística, una conclusión por H1 (la hipótesis alternativa) es

siempre fiable, pues su error α sí está controlado. Sin embargo una conclusión por H0 será solo

fiable si su error β está también controlado, lo que lleva a fijar de antemano el tamaño de las

muestras. Como la Administración exige que un EC dé siempre una conclusión fiable (a fin de

no descartar un tratamiento que pudiera ser efectivo), la conclusión es que en los EC siempre ha

4

de determinarse el tamaño de las muestras (n1 y n2). La fórmula precisa para determinarlos

depende de:

(1) El diseño utilizado: aquí 2 muestras independientes.

(2) El tipo de medida de la respuesta: aquí una cualidad ó una cantidad.

(3) La distribución estadística (exacta ó aproximada): aquí la normal.

(4) La hipótesis a probar: clásica ó de bioequivalencia.

Pero, conocida la fórmula, su aplicación requiere conocer también:

(5) La razón de asignación 1

1 2

nr=n +n

: usualmente r = 0,5.

ò la razón muestral 2

1

nK = n

: usualmente K =1. Si ci = “costo de cada unidad muestral”

entonces 2 1

1 2

n cK = = n c

.

(6) El número de colas del test: 1 ó 2.

(7) El error α: usualmente el 5%.

(8) La mínima diferencia δ a detectar: δ = μ1–μ2 ó p1−p2.

(9) El error β (=1 –Potencia) asociado a δ: usualmente el 10 ó 20%.

(10) Información sobre los valores reales de ciertos parámetros implicados (proporciones) ó

no (varianzas) en el test.

Además, si hay más de una respuesta en el EC, habrá que:

(11) Elegir la más relevante: usualmente un suceso clínico,

ó elegir el mayor de los ni determinados para cada pregunta.

3.2. La fórmula general para dos grupos

Suele ser frecuente efectuar una demostración individual (para cada problema) acerca de

la fórmula de tamaño de muestra cuando se comparan dos grupos. Sin embargo la demostración

base es la misma para todos los casos en que el estadístico de contraste sea asintóticamente

normal (unidimensional). De modo esquemático:

5

0 0H : θ = θ ( )1 1 1 0H : θ = θ θ > θ

( )20 0

ˆ N ; / nθ→ θ σ ( )21 1

ˆ N ; / nθ→ θ σ

0H

1H

L0θ 1θ

αβ

0H

1H

0 1

0 1 0

1 1 1 1 1

L / n (por causa de )

L / n (por causa de ) / n

z

z z−α

β −β

⎧ = θ + σ α⎪⎨

= θ + σ β = θ − σ⎪⎩

⇓ 2

1 0 1 1

1 0

z σ + z σn = −α −β⎛ ⎞

⎜ ⎟θ − θ⎝ ⎠

En donde para tests de 2 colas hay que cambiar 1−α por 1−α/2, y se sobreentiende que zx=X-

percentil de la N(0,1).

3.3. Particularización a los casos actuales

De la simple fórmula anterior se pueden extraer como caso particular todas las fórmulas

del capítulo actual. Por ejemplo, y de nuevo de modo esquemático, en el caso de la comparación

de dos proporciones (muestras independientes) será:

0 1 2H : p p 0 0− = θ = θ 1 1 2 1H : p p − = δ θ = θ

( ) ( ) ( )i i 1 1 2 2d di i 1 2 1 2

i 1 2

p 1 p p 1 p p 1 pˆ ˆ ˆp N p ; p p N p p ;n n n− − −⎛ ⎞ ⎛ ⎞

⎯⎯→ ⇒ − ⎯⎯→ − +⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

⇓ ( )1 2

ˆˆ ˆp p − θ ( )1 2ˆˆ ˆp p − θ

0 1 2H : p p ( p)= =↓

1 2(si n n n )= = 1 1 2H : p p= + δ↓

( ) 202p 1 p

N 0;n n

⎛ ⎞− σ⎜ ⎟⎜ ⎟⎝ ⎠

( ) ( ) 2

1 1 2 2 1p 1 p p 1 p σN ;n n

⎛ ⎞− + −δ⎜ ⎟⎜ ⎟⎝ ⎠

6

( ) ( ) ( )

2

1 1 1 1 2 22p 1 p p 1 p p 1 pn

z z−α −β⎧ ⎫− + − + −⎪ ⎪= ⎨ ⎬δ⎪ ⎪⎩ ⎭

El problema con la expresión anterior es que p y p1 son desconocidos (pero 2 1p = p − δ ). En

el caso de p es frecuente argumentar que ( ) 1 1 2 2 1 20

1 2

n p n p p pˆp E p Hn n 2+ +

= | = =+

y así sólo p1 es

desconocido. Haciendo 1dn dp 0= puede probarse que los valores p1= 0,5±δ/2 ocasionan un

máximo de n (con lo que sobrará muestra y nunca faltará), y así p1 hay que elegirlo lo más

cercano a esos valores y compatible con la información que se posea sobre él.

4. TAMAÑO DE MUESTRA EN LOS TESTS CLÁSICOS PARA LA

COMPARACIÓN DE DOS PROPORCIONES INDEPENDIENTES

4.1. Preámbulo y planteamiento del ejemplo

El caso -que se corresponde con las hipótesis T1, T2, y T3- es bien conocido, pero casi

todo el mundo aplica mal la fórmula. El Cuadro I presenta un resumen del modo de actuar. Él va

a ser ilustrado con el siguiente ejemplo:

Un ensayo clínico tiene por fin comparar los porcentajes de éxitos de un

tratamiento nuevo (el nº 1) con uno clásico (el nº 2) a través de dos muestras

independientes. Se va a realizar el test al 5% de error y se desea una potencia

del 80% para la alternativa de que el nuevo tratamiento supera al clásico en un

10%. Del clásico se sabe que tiene éxito en un 70% a 80% de los casos. ¿Qué

tamaño de muestra debe tomarse de cada grupo? (a) Bajo el diseño óptimo;

(b) ¿Y si los individuos del tratamiento nuevo cuestan 4 veces más que los del

clásico?

Del enunciado se desprenden varios datos generales:

Hipótesis: 10 1 2 1 1 2

2

p NuevoH : p p vs H : p p 1 cola

p Clásico≡⎧

= > ⇒ ⎨ ≡⎩

Errores: 5%α = ,, 20%β =

Valor delta y primera alternativa de interés: 1 2p p 0,10− = δ =

⇒1ª alternativa de interés: 1 2p = p + 0,10

(1)

7

iInformación sobre las p : 20,7 p 0,8≤ ≤

4.2. Caso de tamaños de muestra iguales.

En general 1 2n n n= = es un diseño óptimo y de ahí que K=1. Ya se ha dicho que para

aplicar la expresión (1) debe sustituirse p1 y p2 por unos valores conservadores que

proporcionen más muestra de la precisa (es decir, un menor error β ó una mayor potencia de las

requeridas). Siguiendo paso a paso el Cuadro I (en su parte izquierda):

1) 1 2Valores conservadores de p y p :

a) Lo más cercanos a ip 0,5 / 2 0,5 0,1/ 2 0, 45 y 0,55,= ± δ = ± =

b) Compatibles con la información 20,7 p 0,8≤ ≤ 2p 0,7 ,⇒ =

c) Que difieran en δ ⇒ 1 2p p 0,10= + 1 1p 0,7 0,1 0,8 p .⇒ = + = =

2) Valor conservador de p: 1 2p +p 0,7 0,8p 0,75 p .2 2

+= = = =

3) Valores z: 15% 1,645z −αα = ⇒ = ,, 120% 0,842 .z −ββ = ⇒ =

4) Aproximado erróneo (clásico): 2

01,645 2 0,75 0,25 0,842 0,8 0,2 0,7 0,3n

0,1⎧ ⎫× × + × + ×⎪ ⎪= ⎨ ⎬⎪ ⎪⎩ ⎭

230,9 231.=

5) Aproximado correcto: (incluye la corrección por continuidad del test)

1 2n = n = n 2

230,9 4 1 1 250,5 251.4 230,9 0,1

⎧ ⎫⎪ ⎪= + + =⎨ ⎬×⎪ ⎪⎩ ⎭

Lo usual en la literatura es utilizar el valor n0=231. La mejor prueba de que es incorrecto

(por no incluir la corrección por continuidad) es que el valor exacto obtenido por las tablas de

Casagrande et al (1978) es ne=249 (muy superior al anterior). Sin embargo el valor correcto de

n=251 concuerda bastante bien con el exacto de 249.

4.3. Caso de tamaños de muestra distintos.

En ocasiones los elementos de uno de los grupos estudiados son más baratos de obtener que

los del otro, y así un diseño con n1≠n2 es el adecuado (menos individuos del grupo más caro).

Siguiendo de nuevo el Cuadro I (en su parte derecha):

1) Valor de K: 2 11 2

1 2

n cK con c 4c K 2n c

= = = ⇒ =

8

2) 1 2Valores conservadores de p y p :

a) Lo más cercanos a (para el caso de p1>p2, pues p1 = p2+0,10):

2= 0,5 0,1 3 = 0,47p − (pues aquí p1>p2 y la información es sobre p2)

b) Compatibles con la información 20,7 p 0,8≤ ≤ 2p 0,7 .⇒ =

c) Que difieran en δ: 1 2p p 0,10= + 1 1p 0,7 0,1 0,8 p .⇒ = + = =

3) Valor conservador de p: p = (0,8 + 2 0,7) / (1+2) = 0,733 = p .×

4) Valores z: 15% 1,645z −αα = ⇒ = ,, 120% 0,842 .z −ββ = ⇒ =

5) Aproximado erróneo (clásico):

2

01 1,645 0,733 0,267 3 0,842 0,8 0,2 2 0,7 0,3n2 0,1⎧ ⎫× × + × × + ×⎪ ⎪= ⎨ ⎬⎪ ⎪⎩ ⎭

=175,5 > 176 .

6) Aproximado correcto: 2

1 1

2 2

175,5 2 3n 1 1 190,2 n =191 ,4 2 175,5 0,1

n 2 191 382 n =382 .

⎧ ⎫×⎪ ⎪= + + = ⇒⎨ ⎬× ×⎪ ⎪⎩ ⎭

= × = ⇒

5. TAMAÑO DE MUESTRA EN LOS TESTS DE EQUIVALENCIA DE DOS

PROPORCIONES INDEPENDIENTES

5.1. Preámbulo y planteamiento del ejemplo

El caso actual -que se corresponde con las hipótesis E1, E2, y E3- es menos conocido. El

Cuadro II presenta un resumen del modo de actuar (aunque él también incluye el test -que no se

comenta aquí- por ser poco conocido). El cuadro II va a ser ilustrado con el siguiente ejemplo:

Cierto tipo de enfermedad requiere de unos cuidados especiales que

tradicionalmente realizan los médicos (por lo que son costosos

económicamente) y cuyo éxito se cifra entre el 60% y el 70% de los casos. Se

pretende que sean un grupo de enfermeros especialmente entrenados los que

realicen tales cuidados (lo que sería más barato). ¿Qué valor de 1 2n =n es

preciso? (Dunnett and Gent, 1977).

9

5.2. Caso de No-Inferioridad (NI)

Si las hipótesis son las E1 y se desea α=β=5% entonces, siguiendo paso a paso el

Cuadro II (en su parte izquierda) para K=1 (tamaños iguales):

1) Hipótesis:

0 2 11

2 1 2 1

H : p p 0,1p % de éxitos de los médicos0,1 + NI

p % de éxitos de los enfermeros H : p p 0,1= −= ⎧⎧

⇒ Δ =⎨ ⎨= > −⎩ ⎩

2) δ nulo y δ alternativo ( )0 2 1H : p p= + δ :

0 2 1 0

1 2 1 1

0,10 p p bajo H

0 p p bajo H (alternativa natural no explicitada)

⎧ δ = − = −⎪⎨δ = = −⎪⎩

3) Información: 10,6 p 0,7 .≤ ≤

4) 1 2Valores conservadores de p y p :

a) p1 lo más cercano a 11

Kδp 0,5K+1

= + (pues δ1≤0) = 0,5+0=0,5.

b) Compatible con la información: 10,6 p 0,7≤ ≤ 1p 0,6 .⇒ =

c) Que difieran en δ1: p2=p1+δ1 2 2p 0,6 0 0,6 p .⇒ = + = =

5) 1 2Valores conservadores de p y p

1 1p 0,6 1 (0 0,1) / 2 0,6 0,05 0,65 p= + × + = + = =

2 1 0 2p p 0,65 0,10 0,55 p= + δ = − = =

6) Valores z: 1 0,05 1 0,05 0,95z z z 1,645 .− −= = =

7) Tamaño erróneo:

2

01 1,645 1 0,65 0,35 0,55 0, 45 1,645 1 0,6 0, 4 0,6 0, 4n1 0 0,10⎧ ⎫× × + × + × × + ×⎪ ⎪= ⎨ ⎬+⎪ ⎪⎩ ⎭

= 516,85 517 (sin corrección por continuidad: incorrecto)

8) Tamaño correcto:

( )

2

1516,85 2 2n 1 1

4 1 516,85 0 0,10⎧ ⎫×⎪ ⎪= + +⎨ ⎬× × +⎪ ⎪⎩ ⎭

= 536,7 537 (con corrección por

10

continuidad: correcto) ⇒ 2 1 2 1n K n n n 537 .= ⇒ = =

5.3. Caso de Equivalencia (PE)

Si las hipótesis son las E3 y se desea α=5% y β=10% entonces, siguiendo paso a paso el

Cuadro II (en su parte derecha) para K=1 (tamaños iguales):

1) Hipótesis:

0 2 11

2 1 2 1

H : p p 0,10p % de éxitos de los médicos0,10 PE

p % de éxitos de los enfermeros H : p p 0,10

⎧ − ==⎧ ⎪⇒ Δ = +⎨ ⎨=⎩ − <⎪⎩

2) Δ nulo y Δ alternativo:

0 2 1 0

1 2 1 1 2 1

p p 0,10 bajo H

p p 0 bajo H : 0,10 p p 0,10 (alternativa natural).

⎧Δ = − = = Δ⎪⎨Δ = − = − < − < +⎪⎩

3) Información: 10,6 p 0,7 .≤ ≤

4) 1 2Valores conservadores de p (=p ):

a) p1 compatible con la información: 10,6 p 0,7 .≤ ≤

b) Lo más cercano posible a 0,5 fi 1p 0,6 .=

5) 1 2 0Valores conservadores de p y p (la H es doble) :

( ) ( )

( ) ( )

1 2 1

1 2 1

0,1p 0,6 0,55 p p 0,652

0,1p 0,6 0,65 p p 0,552

⎧ +Δ = − = → +Δ = + Δ =⎪⎪⎨⎪ −Δ = + = → −Δ = −Δ =⎪⎩

6) Valores z: 1 0,05 1 0,1/ 2 0,95z z z 1,645 .− −= = =

7) Tamaño erróneo: 2

0 0 01,645 1 0,55 0, 45 0,65 0,35 1,645 2 0,6 0, 4n ( ) n ( ) n

0,1⎧ ⎫× × + × + × ×⎪ ⎪+Δ = −Δ = = ⎨ ⎬⎪ ⎪⎩ ⎭

= 516,85 ( sin c.p.c.).

8) Tamaño correcto: 2

1516,85 2 2n 1 1

4 1 516,85 0,1⎧ ⎫×⎪ ⎪= + +⎨ ⎬× ×⎪ ⎪⎩ ⎭

= 536,7 (con c.p.c.) ⇒ 2 1 2 1n = K n n = n =537 .⇒

11

6. BIOEQUIVALENCIA DE DOS MEDIAS

6.1. Generalidades y ejemplo a estudiar

Cuando se administra una droga a un individuo, conviene conocer la proporción y

extensión en que se absorbe el ingrediente activo haciéndose disponible para el organismo: es lo

que se llama la biodisponibilidad. Para evaluarla se mide la concentración del fármaco antes y

después (a diferentes tiempos) de la administración de la droga:

0 1 2 K

0 1 2 K 0

Tiempos: t 0 t t t 3 vidas mediasConcentración: C C C C C

= ≥⎧⎨⎩

lo que proporciona la Curva de Concentración-Tiempo adjunta.

Los parámetros farmacocinéticos relevantes para evaluar la biodisponibilidad suelen ser:

tmax = Tiempo hasta alcanzar la concentración máxima.

Cmax = Concentración máxima alcanzada.

AUC = Área bajo la curva = Concentración media ( )K

i i 1i i 1

i 1

C C t t2

−−

=

+= −∑

obtenida por la fórmula trapezoidal;

en donde el parámetro AUC es el más habitual y relevante.

Dos drogas son terapéuticamente equivalentes cuando su biodisponibilidad es similar.

En términos de AUC, si:

( )( )

1 1 1

2 2 2

x AUC droga 1 N ;

x AUC droga 2 N ;

ESTÁNDAR

NUEVO

⎧ = → μ σ ≡⎪⎨

= → μ σ ≡⎪⎩

entonces puede hablarse de:

1 2

1 2

: Si , ,: Si

1 2μ μ σ ; σ⎧⎨ μ μ⎩

Bioequivalencia poblacionalBioequivalencia promedio

12

Para que 1 2μ μ es preciso definir la máxima diferencia permitida, pero es lógico que ella sea

relativa a la magnitud del estándar ( 1μ ). Por ello, la hipótesis alternativa para probar la

Bioequivalencia de Razón será:

( ) ( )11 I 2 1 IH / usualmenteS

−θ ≤ μ μ ≤ θ = θ

Con frecuencia las xi no siguen la distribución normal, pero ( )i i i i iy ln x N ln ; '= → η = μ σ , en

cuyo caso

I I 2 1 2 1 S S=ln ln ln ln δ θ ≤ μ − μ = η −η ≤ θ = δ

y así la hipótesis alternativa para probar la Bioequivalencia de Diferencia será:

( ) ( )1 I 2 1 S IH usualmenteδ ≤ η −η ≤ δ = −δ

Los dos tests anteriores son poco conocidos y de ahí que el Cuadro III los incluya

(aunque no los ejemplificamos). A los efectos de calcular el tamaño de muestra, el Cuadro III

indica los cálculos a realizar (que sí serán ilustrados). Al final del Cuadro III también se dan los

valores usuales en EEUU (FDA) y en Europa (CMPM) para los límites 1 S y θ θ : ellos son los

exigidos por la legislación sobre EC en cada ámbito. El Cuadro III va a ser ilustrado con el

siguiente ejemplo:

Un medicamento se administra tradicionalmente en suspensión oral de 5 ml

(estándar) y se desea cambiar a la más cómoda administración de tabletas de 5 mg (nuevo).

¿Qué tamaño de muestra habrá que tomar para demostrar la bioequivalencia de ambas

presentaciones bajo la regla del 80/125 y para el parámetro AUC? (a=5%; b=10%):

a) Por el método de razón, si se sabe que las AUC son normales y que el coeficiente de

variación del AUC del estándar es del orden del 10%; b) Por el método de diferencia, si se

sabe que las AUC son log-normales y que la desviación típica de ln(AUC) en un

experimento previo realizado con el estándar fue de 0,09 (10 g.l.).

6.2. Tamaño de muestra en el caso de la bioequivalencia de razón.

Siguiendo paso a paso el Cuadro III (en su parte derecha) y para K=1 (tamaños iguales):

1) Hipótesis:

( )

10 2 1 I S I 2

1 2 1 1

H : / 0,8 ó 1, 25 , ,

H : / 1 alternativa natural ,,

NUEVO

ESTÁNDAR

−⎧ μ μ = θ = θ = = θ μ =⎪⎨

μ μ = μ =⎪⎩

13

2) Datos:

1 1 / 2 0,95 1 15% ,, 10% = z = z =1,645 , CV / 0,1.z −α −βα = β = ⇒ = σ μ =

3) Tamaño de muestra:

( ) ( )( )

( ) ( )( )

22 2

1 I 2

1 222 2

1 S 2

1 1 0,8n 1,645 1,645 0,1 4, 41 1 0,8

n n 5 .1 1 1, 25n 1,645 1,645 0,1 4, 4

1 1 1, 25

⎧ + ×θ = + × × =⎪

× −⎪ ⇒ = =⎨+ ×⎪ θ = + × × =⎪ × −⎩

6.3. Tamaño de muestra en el caso de bioequivalencia de diferencia.

Siguiendo paso a paso el Cuadro III (en su parte izquierda) y para K=1 (tamaños iguales):

1) Hipótesis:

( )

0 2 1 I I

1 2 1

H : ln ln ln 0,8 ó ln 1, 25

ln 0,8 ln 1,25H : ln ln 0 alternativa natural2

S⎧ μ − μ = = δ = δ = −δ⎪⎨ +

μ − μ = =⎪⎩

2) Datos:

( ) 2 21 1 / 2 0,95t t = t 10 g.l. 1,812 , s 0,09 .−α −β= = =

3) Tamaño de muestra: 2

21 1 2

2 1,812 1,812n 4 0,09 4,3 n =n =5 .1 ln 1, 25 ln 0,8

+⎧ ⎫= × × × = ⇒⎨ ⎬−⎩ ⎭

Bibliografía y Referencias

CASAGRANDE, J.T.; PIKE, M.C. and SMITH, P.G. (1978). The power function of the exact test for comparing two binomial distribution. Applied Statistic 27 (2), 176-180.

DUNNETT, C.W. and GENT, M (1977). Significance testing to establish equivalence between treatments, with special reference to data en the form of 2×2 tables. Biometrics 33, 593-602.

MACHIN, D.; CAMPBELL, M.J; Fayers, P. and Pinol, A. (1997). Sample Size Tables for Clinical Studies. (2ª Edition). Blackwell Science. UK.

MEINERT, C.L. (1986). Clinical Trials: Desing, Conduct and Analysis. Oxford University Press. New York.

14

Cuadro I: TAMAÑO DE MUESTRA PARA DOS PROPORCIONES INDEPENDIENTES

DATOS PREVIOS A FIJAR

H1 * H1≡p1>p2 (una cola) ó H1≡p1≠p2 (dos colas).

* Es la hipótesis alternativa (la que se desea probar fuera de toda duda).

α * Es el error α (ó de Tipo I) asociado a una conclusión errónea por H1. * Usualmente se le elige del 1% ó del 5% (según la fiabilidad deseada en una conclusión por H1).

β * Es el error β (ó error de Tipo II) asociado a una conclusión errónea por H0≡p1=p2. * Usualmente se elige del 10% ó 20% según cómo de fiable se quiere que sea una conclusión por H0. * 1-β=θ es la potencia.

δ * Es la mínima diferencia de interés ó diferencia entre p1 y p2 que, de ocurrir, se desea detectar

(conclusión por H1) el θ% de las veces en que esta ocurra. * δ=p2−p1 en tests de una cola ; δ=⏐p2−p1⏐ en tests de dos colas.

K * Es el valor de n2/n1 ó cociente de los tamaños muestrales 1 2c /c(= con ci el costo de cada unidad muestral en cada muestra). Usualmente es K=1 (muestras de igual tamaño).

CÁLCULOS K = 1: 1 2n n n= = K ≠ 1: 1 2 1n n ,, n K n= =

a) Difieran en el δ previsto. Dos proporciones que: b) Sean compatibles con la información que se posea sobre ellas. c) Sean lo más cercanas posibles a las parejas de abajo. p1

p2

ip 0,5 / 2= ± δ 21 1 2

K= 0,5 , p = 0,5 + si <p p pK+1 K+1δ δ

21 1 2K= 0,5 + , p = 0,5 si >p p pK+1 K+1δ δ

1 2p = ( ) / 2p p+ 1 2p = ( ) /(1 K)K pp + +

2

1 1 1 1 2 20

2pq p q p qn

z z−α −β⎛ ⎞+ +

= ⎜ ⎟⎜ ⎟δ⎝ ⎠

{ }22 2

0 1 1Máx n 1 / 2z z−α −β= + − δ δ

( )2

1 1 1 1 2 20

pq K+1 p q K p q1nK

z z−α −β⎛ ⎞+ +⎜ ⎟=⎜ ⎟δ⎝ ⎠

( )( )

23

20 1 1 32

4 K 1K 1Máx n 14K K 1

z z−α −β

⎧ ⎫++ ⎪ ⎪= + − δ⎨ ⎬δ +⎪ ⎪⎩ ⎭

2

0

0

n 4n 1 14 n⎧ ⎫⎪ ⎪= + +⎨ ⎬δ⎪ ⎪⎩ ⎭

( )

2

0

0

2 K 1nn 1 14 Kn

⎧ ⎫+⎪ ⎪= + +⎨ ⎬δ⎪ ⎪⎩ ⎭

1) Las fórmulas son para el test de una cola. Para el test de dos colas cambiar 1−α por 1−α/2. 2) Por zx se alude al percentil X de una normal típica. Por ejemplo: z97,5%=1,96. 3) Cualquier valor q ó qi alude a 1−p ó 1−pi.

15

Cuadro II: EQUIVALENCIA DE DOS PROPORCIONES

GENERALIDADES

H1 ( ) ( )2 1 2 1 2 1 2 1NI: p p con 0 , , SS: p p ,, SG: p p con 0 , , PE: p p> −Δ Δ > > + Δ > + δ δ ≠ − < Δ

H0 La H1 puesta como igualdad (con p2=NUEVO y p1=ESTÁNDAR): en PE es doble.

Notación ( ) 2i i i 2 1 1 1 2 1 1 2 1 2 2 1 i i i 1 2ˆ ˆ ˆp x n , d p p , p a n N, a x x , N=n +n , p p , s p q n , c N 2n n= = − = − δ = + = +δ = =∑

TEST MUY APROXIMADO SG =NI ó SS PE

SG SG SGd δ c P {z }Z P Zs− −

= ⇒ = ≥

en NI,, z Normal típica

en SSδ = −Δ⎧

=⎨δ = +Δ⎩

{ } { }NI NI NIZ d c / s con s para P P z Z= +Δ− δ = −Δ⇒ = ≥

{ } { }SS SS SSZ d c / s con s para P P z Z= −Δ+ δ = +Δ⇒ = ≤

Método TOST: { }PE NI SSP Max P , P=

TAMAÑO DE MUESTRA (K=n2/n1) SG = NI ó SS PE

( )2 1 1 1 2 1 0 0 1 0p p bajo H ; p p bajo H− = δ − = δ δ > δ 2 1 1 2 1 0p p 0 bajo H ; p p bajo H− = − = ±Δ

p1 compatible con la información que se posea sobre el estándar y lo más cercano a 1p =0,5+(-)Kδ1/(K+1) si δ1≤(≥)0 ⇒ p2=p1+δ1.

p1 compatible con la información que se posea sobre el estándar y lo más cercano posible a 0,5.

( ) ( )1 1 1 0 2 1 0p p K / K 1 p p= + δ −δ + ⇒ = +δ ( )1 1 2 1p p K / K 1 p p

con ó (dos parejas)= − δ + ⇒ = + δ

δ = +Δ δ = −Δ

2

1 1 1 2 2 1 1 1 2 20

1 0

z Kp q p q z Kp q p q1nK

−α −β⎧ ⎫+ + +⎪ ⎪= ⎨ ⎬δ −δ⎪ ⎪⎩ ⎭

( ) ( )

2

1 1 1 2 2 1 /2 1 10

z Kp q p q z K 1 p q1nK

−α −β⎧ ⎫+ + +⎪ ⎪δ = ⎨ ⎬Δ⎪ ⎪⎩ ⎭

( ) ( ){ } ( )( )0 0 0 0n Max n , n n si K 1= +Δ −Δ = +Δ =

( )( )

2

01

0 1 0

2 K 1nn 1 14 Kn

⎧ ⎫+⎪ ⎪= + +⎨ ⎬δ − δ⎪ ⎪⎩ ⎭

( )2

01

0

2 K 1nn 1 14 Kn

⎧ ⎫+⎪ ⎪= + +⎨ ⎬Δ⎪ ⎪⎩ ⎭

NOTA: Cualquier valor q alude a 1−p

16

Cuadro III: BIOEQUIVALENCIA DE DOS MEDIAS

de Diferencia (si x→log-Normal) de Razón (si x→Normal)

H1 ( )I 2 1 S I usualmenteδ < μ −μ < δ = −δ ( )1I 2 1 S I/ usualmente−θ < μ μ < θ = θ

H0 Es doble: la H1 puesta como igualdad (con 2μ =NUEVO y 1μ =ESTÁNDAR)

Notación 1n = tamaños ,, ix =medias ,, 2s = varianza común (con 1 2f n n 2 g.l.)= + −

TEST TOST

Estadísticos I I2 1

S S

1 2

= t ( )x x tt ( ) = = t ( )1 1 ts

n n

⎧− − δ δδ ⎨ δ⎩+

I I2 12

S S

1 2

= t ( )x x tt ( ) = = t ( )t1s

n n

θ⎧−θθ ⎨ θθ ⎩+

Regla de test (TOST)

* Si ( ) ( )I 1 S 1 1t t f y t t f H al error −α −α≥ ≤ − ⇒ α .

* El valor P es el máximo entre los dos valores P de It y St .

* Xt (f) es el X−percentil de la distribución de Student con f g.l.

(σ2=varianza común) TAMAÑO DE MUESTRA ( )2 1K n /n=

H1 y H0 ( )2 1 I S 1

2 1 I S 0

/ 2 bajo Hó bajo H

μ −μ = δ + δ

μ −μ = δ δ 2 1 1

2 1 I S 0

/ 1 bajo H/ ó bajo H

μ μ =μ μ = θ θ

n1

21 1 / 2 2

1S I

z zK 1n 4K

−α −β+⎧ ⎫+= σ⎨ ⎬δ − δ⎩ ⎭

z se cambia por t(f) si σ2 es sustituido por s2 (f g.l.)

( ) ( )( )

2 22

1 1 1 / 2 21

1 Kn z zK 1

−α −β

⎛ ⎞σ + θθ = + ⎜ ⎟μ −θ⎝ ⎠

( ) ( ){ }( )

1 1 I 1 S

1S I

n Max n ; n

única si K 1 y −

= θ θ

= θ = θ

Otros 2 1n K n ,,= z = Normal típica ,, t(f)=Student con f g.l.

Reglas usuales: EMEA (+CMPM): http://www.eudra.org/

FDA: 80/125 ” Iθ =0,8 Sθ =1,25

CMPM: 70/143 ” Iθ =0,7 Sθ =1,43

Otras: 75/75 ” Iθ =0,75 Sθ =1,25

20% ” Iθ =0,8 Sθ =1,2

Los valores δ son el logaritmo neperiano de los anteriores valores θ.