:: Edición Impresa
Buscar
 
  :: Publicidad



 Revista


  Normas de publicación
 Organización
  Objetivos
  Directiva
  Delegados
 Libro de visitas
 Contacte
 
 Sitios interesantes
   
 
:: Artículo
Manejo práctico de los estadísticos para la medida de la eficacia de los tratamientos farmacológicos
2006,16;1:49-60

Monzón Moreno A*, Guerrero Aznar MD**, Cameán Fernández M*, López Pérez R***, Ramirez Soto G*, Baños Roldán U*, Beltrán García M*, Marcos Rodríguez JA*
*Adjunto del Servicio de Farmacia
**Jefa del Servicio de Farmacia
***Colaboradora Licenciada en matemáticas. Servicio de Farmacia. Hospital Universitario Vírgen Macarena. Sevilla (España)


Palabras clave: Eficacia, equivalentes terapéuticos, riesgo relativo, reducción del riesgo relativo, reducción del riesgo absoluto, razón de odds, ¿número necesario a tratar?, NNT

         

Resumen

Para evaluar la eficacia de los tratamientos farmacológicos podemos basarnos en los resultados obtenidos de los ensayos clínicos doble ciego randomizados, estos resultados pueden agruparse en forma de estadísticos (riesgo relativo, reducción del riesgo relativo, reducción del riesgo absoluto, razón de odds y ¿número necesario a tratar?) para que tengan más sentido para los profesionales sanitarios y los pacientes. En esta publicación mostramos una descripción razonada de su uso, su aplicación práctica y la forma correcta de presentarlos, su interpretación adecuada y por último su utilidad para poder considerar a dos fármacos como ?equivalentes terapéuticos?


Artículo Completo

Introducción

Los ensayos clínicos doble ciego randomizados nos proporcionan los datos más válidos en los que basar los beneficios y los riesgos de los tratamientos (1-3). Los resultados de estos ensayos se pueden presentar como datos ”crudos”, o bien, agrupados en forma de estadísticos, de manera, que tengan más sentido para los profesionales sanitarios y los pacientes y por tanto, sean más útiles a la hora de la toma de decisiones (1-4). En la literatura médica actualmente se suelen utilizar los siguientes estadísticos: riesgo, riesgo relativo, reducción del riesgo relativo, reducción del riesgo absoluto, odds, razón de odds y “número necesario a tratar”. Cada estadístico debe ir acompañado de su intervalo de confianza, el cual nos va a proporcionar el rango de valores en los cuales podemos tener una determinada certeza de que se contenga el verdadero valor de la población (4-6).
Para calcular los estadísticos partiendo de los datos “crudos”, se aplican fórmulas de forma automática, que a menudo, pueden llevarnos a cometer errores en el cálculo y en su interpretación. En esta publicación pretendemos mostrar un desarrollo razonado del empleo de estas fórmulas para facilitar su interpretación y a través de algunos ejemplos, comprobar su aplicabilidad en la comparación la eficacia entre dos tratamientos farmacológicos.
La recopilación de datos de esta publicación se ha realizado a través de una búsqueda en las bases de datos Medline, Embase, Cochrane, MDConsult y ProQuest, en las que se usaron las palabras clave y como texto libre y como término MeSH, sin limitación de idiomas ni fechas. Además se realizó una búsqueda manual en libros relacionados con los términos clave.

1. Intervalo de confianza (IC):
Los análisis estadísticos de los ensayos clínicos están basados en las observaciones que hacemos de una muestra de sujetos de una población y a partir de ellos, obtenemos una conclusión, o un punto de estimación, para todos los sujetos de la población. Pero, debido a la variabilidad aleatoria de nuestra muestra, un ensayo bien diseñado tan sólo nos dará una idea del verdadero valor de la población. Así los resultados que obtengamos de una única muestra estarán sujetos a una incertidumbre estadística, la cual está estrechamente relacionada con el tamaño de la muestra. Los resultados que obtendremos, por tanto, serán estimaciones imprecisas del verdadero valor de la población. Afortunadamente esta imprecisión puede ser estimada e incluida junto con los resultados que se obtengan.
Los investigadores suelen utilizar de una manera arbitraria intervalos de confianza del 95% ó del 99%, aunque el más ampliamente utilizado es el del 95%. Un intervalo de confianza del 95% (IC95%) indica que hay un 95% de probabilidad de que el rango de valores incluya el verdadero valor de la población, o sea, que si el ensayo fuera repetido muchas veces, el 95% de estas, el intervalo contendría al verdadero valor del parámetro (7). De esta manera, la imprecisión está indicada por la anchura del IC, cuanto más ancho sea, menor precisión se tendrá. La anchura del IC depende de tres factores, del tamaño de la muestra, de la variabilidad de las características que se estudien y del grado de confianza que se requiera. El presentar los resultados de un estudio indicando su IC, tiene ventajas sobre el simple valor de p, en el que sólo se indica si hay o no significación estadística.
Para obtener el IC calculamos los límites superior e inferior de este intervalo (8). Para el cálculo de los intervalos de confianza en los ejemplos que veremos a continuación se ha utilizado una hoja de cálculo que se puede encontrar en una página web (9), en la cual:
– El IC para una proporción se calcula a través del “Wilson score method” sin correción de continuidad (10).
– El IC para la diferencia entre dos medias se calcula con un método que asume iguales varianzas para las dos poblaciones (11).
– El IC para la diferencia entre dos proporciones se calcula a través del método de Newcombe-Wilson sin corrección continuidad (12).
– El IC para el “número necesario a tratar” se calcula a través del inverso de los límites de la reducción del riesgo absoluto (13).
– El IC para el riesgo relativo y la razón de odds se calcula a través del método descrito por Armitage y Berry (11).
– El IC para la reducción del riesgo relativo es 1 menos los límites de confianza del riesgo relativo (14).

2. Estadísticos útiles para comparar la eficacia entre dos tratamientos:
Riesgo (R): El riesgo es una expresión de la frecuencia con que se produce un determinado evento adverso respecto de su población (4-6) (aunque el cálculo del riesgo se puede realizar también para eventos no adversos o beneficiosos). Supongamos que realizamos un ensayo con dos grupos paralelos de 150 pacientes con hipertensión, unos tratados con el fármaco A (o grupo experimental) y otros con el fármaco B (o grupo control), donde, al cabo de un año, en el grupo experimental 45 pacientes presentan un determinado evento adverso (fallo cardíaco) debido a la hipertensión y en el grupo control 75 pacientes presentan el citado evento adverso, entonces, el riesgo de este evento adverso en el grupo experimental (Rt), sería 45/150 = 0,3 ó del 30% y el riesgo en el grupo control (Rc), sería 75/150 = 0,5 ó 50%. En la tabla 1 podemos ver la tabla de contingencia de este estudio.
El intervalo de confianza del 95% para el riesgo en el grupo experimental va desde 0,23 a 0,37 y el intervalo de confianza del 95% para el riesgo en el grupo control va desde 0,42 a 0,57. Aunque existe la tendencia de algunos autores a comprobar si existe o no diferencia estadística en el riesgo de eventos adversos entre ambos tratamientos observando si los intervalos de confianza se solapan, debemos tener en cuenta, que dicho método no es exacto y que el método correcto, como veremos más adelante, consiste en calcular el intervalo de confianza de la diferencia o la razón entre parámetros.

Odds: El odds define la probabilidad de experimentar un evento respecto a la probabilidad de no experimentarlo4-6. En nuestro ejemplo, el odds de presentar el evento adverso en el grupo experimental, se obtiene dividiendo la probabilidad de experimentar el evento (45/150 = 0,3) por la probabilidad de no experimentarlo ((150-45)/150 = 0,7)), o sea, 0,3/0,7 = 0,42 y el odds de presentar el evento en el grupo control sería (75/150) / (75/150) = 1.
El riesgo y el odds son formas distintas de expresar el mismo resultado. Si lanzamos una moneda al aire, la probabilidad de que salga cara es: 1 (cara) dividido por el total de posibilidades 2 (cara + cruz), de manera que el resultado es 1/2 = 0,5, este sería el riesgo. Pero si lo que queremos calcular es el odds, entonces dividimos la probabilidad de que salga cara (1 cara) por la probabilidad de que salga lo contrario (1 cruz), el resultado es 1/1 = 1. De manera que mientras el riesgo hace referencia a la probabilidad respecto del total, el odds hace referencia a la probabilidad de un resultado respecto al contrario.
El intervalo de confianza del 95% para el odds del grupo experimental va desde 0,30 a 0,60 y el intervalo de confianza del 95% para el odds del grupo control va desde 0,72 a 1,37. Al igual que en el apartado anterior, existe la tendencia de algunos autores a comprobar si existe o no diferencia estadística en el odds de los eventos adversos entre ambos tratamientos observando si los intervalos de confianza se solapan, debemos tener en cuenta, que dicho método no es exacto y que el método correcto, como veremos más adelante, consiste en calcular el intervalo de confianza de la diferencia o razón entre parámetros.
Riesgo relativo (RR): Para combinar los riesgos de dos tratamientos en un solo estadístico, podemos calcular el riesgo relativo (o razón de riesgos), el cual nos indica cuanto más probable es que ocurra el evento adverso de un grupo respecto a otro grupo, matemáticamente se obtiene dividiendo el riesgo en un grupo por el riesgo en el otro grupo, en nuestro caso lo calculamos para el grupo experimental respecto del control (4-6). Continuando con el ejemplo anterior, el RR del grupo en tratamiento con el fármaco A respecto del grupo en tratamiento con el fármaco B o control, sería Rt/Rc = 0,3/0,5 = 0,6 ó del 60%. Esto nos indica que, el riesgo en el grupo experimental es de 0,6 veces por cada 1 en el grupo control. Cuando el RR tiene valor 1, indica que el riesgo del evento adverso es idéntico en ambos grupos.
Podemos comprobar si existe diferencia estadísticamente significativa entre los riesgos de eventos adversos de ambos tratamientos al observar el IC del RR que hemos calculado. El intervalo de confianza del 95% para el RR del grupo experimental respecto del grupo control de nuestro ejemplo, va desde 0,44 a 0,80, debido a que este intervalo de confianza no incluye el valor 1, podemos decir que existe diferencia estadísticamente significativa entre ambos tratamientos (4,15), ya que en el RR al consistir en un quebrado, el valor 1 representa una diferencia nula entre el efecto de dos tratamientos.

Razón de odds (odds ratio): Al igual que con el RR, para comparar dos grupos entre si, podemos hacer uso de la razón de odds, que consiste en dividir el odds del grupo experimental por el odds del grupo control (4-6,15). La razón de odds para el evento adverso en el grupo experimental respecto del grupo control es (0,42/1) = 0,42. Y se leería, el odds de presentar fallo cardíaco para los pacientes tratados con el fármaco experimental es 0,42 veces el de los tratados con el fármaco control, indicando por tanto, que hay un menor riesgo en el primer grupo. Cuando el odds ratio tiene valor 1, indica que el odds del evento adverso es el mismo en ambos grupos.
Podemos comprobar si existe diferencia estadísticamente significativa entre el odds de eventos adversos de ambos tratamientos al observar el IC del odds ratio que hemos calculado. El intervalo de confianza del 95% para el odds ratio del grupo experimental respecto del control va desde 0,26 a 0,68, debido a que este intervalo de confianza no incluye el valor 1, podemos decir que existe diferencia estadísticamente significativa entre ambos tratamientos (4,15), ya que en el odds ratio, al consistir en un quebrado, el valor 1 representa una diferencia nula entre el efecto de dos tratamientos.

Reducción del riesgo relativo (RRR): Una comparación entre grupos también puede expresarse mediante la reducción del riesgo relativo, que es la razón entre la diferencia de riesgos entre el grupo control y el grupo experimental (Rc-Rt) y el riesgo en el grupo control (4-6). En nuestro ejemplo el RRR sería (Rc-Rt)/Rc = (0,5-0,3)/0,5 = 0,4 ó del 40%. Y se leería, el fármaco A presenta una reducción en el riesgo relativo del 40% respecto del fármaco B. Cuando el RRR tiene valor 0, indica que el riesgo es el mismo en ambos grupos. El RRR también puede calcularse como 1-RR.
Podemos comprobar si existe diferencia estadísticamente significativa entre el riesgo de eventos adversos de ambos tratamientos al observar el IC del RRR que hemos calculado. El intervalo de confianza del 95% para la RRR del grupo experimental respecto del control va desde 0,17 a 0,60, debido a que este intervalo de confianza no incluye el valor 0, podemos decir que existe diferencia estadísticamente significativa entre ambos tratamientos, ya que en el RRR, al consistir en una diferencia, el valor 0 representa una diferencia nula entre el efecto de dos tratamientos.
Aunque el significado clínico del RR y del RRR es razonablemente claro, tienen la desventaja de que aportan un resultado relativo, con lo cual no conocemos la magnitud de los riesgos, ya que si los riesgos en ambos grupos fueran 100 veces menores, el valor del RR sería igualmente 0,003/0,005 = 0,6 y el valor del RRR también sería (0,005-0,003)/0,005 = 0,4.

Reducción del riesgo absoluto (RRA): El problema que presentan los resultados relativos puede solucionarse utilizando estadísticos absolutos, un ejemplo de ellos es la reducción del riesgo absoluta, que se obtiene al sustraer el riesgo del grupo de tratamiento (Rt) del riesgo del grupo control (Rc)4-6. En nuestro ejemplo, el RRA sería Rc-Rt = 0,5-0,3 = 0,2 ó del 20%. Y se leería, el fármaco A presenta una reducción del riesgo absoluta de un 20% sobre el fármaco B. O dicho de otro modo, de cada 100 pacientes que se traten con el fármaco A, previenen el evento adverso 20 pacientes adicionales sobre los tratados con el fármaco B. Cuando el RRA tiene valor 0, indica que el riesgo es el mismo en ambos grupos.
Podemos comprobar si existe diferencia estadísticamente significativa entre el riesgo de eventos adversos de ambos tratamientos al observar IC del RRA que hemos calculado. El intervalo de confianza del 95% para el RRA del grupo experimental respecto del control va desde 0,08 a 0,30, debido a que este intervalo de confianza no incluye el valor 0, podemos decir que existe diferencia estadísticamente significativa entre ambos tratamientos (16), e inversamente si el IC contiene el 0 indica que no hay diferencia significativa (15,17), ya que en el RRA, al consistir en una diferencia, el valor 0 representa una diferencia nula entre el efecto de dos tratamientos.
Número necesario a tratar (number needed to treat) (NNT): Otro estadístico que podemos utilizar para comparar la eficacia de dos tratamientos, es el “número necesario a tratar, que en 1998, Laupacis definió como el número de pacientes que necesitan ser tratados para prevenir un evento adverso (1).
El NNT puede obtenerse de dos formas relacionadas entre sí:
a) A partir del RRA con una simple regla de tres (18):
Siguiendo con nuestro ejemplo, si el RRA es el número de pacientes por cada 100, que previenen el evento adverso con el fármaco A sobre el fármaco B, el responder a la pregunta: ¿cuantos habría que tratar para prevenir el evento adverso en 1 sólo paciente?, nos proporciona el valor del NNT. En nuestro ejemplo:
De 100 tratados con A, previenen el evento adverso.........................20 adicionales sobre B
¿Cuántos debemos tratar con A? para prevenir el evento adverso....en 1 adicional sobre B?
X= 100/20 = 5, éste es el valor del NNT
b) A través del recíproco del RRA (4,19,20):
Cuando el valor del RRA nos viene dado en tanto por uno, podemos utilizar la fórmula: NNT = 1/Rc-Rt = 1/0,20=5
Cuando el valor del RRA nos viene dado en tanto por cien, podemos utilizar la fórmula: NNT = 100/Rc-Rt = 100/20 = 5
El NNT del fármaco A sobre el B para un determinado evento adverso, se leería, es necesario tratar a 5 pacientes con el fármaco A, para prevenir un evento adverso adicional, sobre el fármaco B. Observemos que es muy importante indicar que éste es un “efecto adicional del fármaco A sobre el B” ya que el valor de NNT de un fármaco se establece respecto de la eficacia de un determinado fármaco control sobre el que se compara y no de cualquier otro fármaco control y del tiempo transcurrido de aplicación del tratamiento, ya que el efecto puede variar con el tiempo.
A la hora de aplicar la fórmula anterior, debemos tener la precaución de observar si estamos midiendo eventos adversos o eventos beneficiosos, ya que la fórmula a aplicar será diferente según cada caso:
– En el caso de que midamos eventos adversos, la fórmula a aplicar debe ser: NNT = 1/(Rc-Rt), si la frecuencia de eventos adversos en el grupo control es mayor que en el grupo experimental, el NNT será un número positivo, indicando un beneficio en el grupo experimental, que también podemos expresarlo como “numero necesario a tratar para beneficiar” ó NNTB. Pero si la frecuencia de eventos en el grupo control es menor que en el grupo experimental, el NNT será un número negativo, indicando un daño en el grupo experimental, y también podemos expresarlo como “número necesario a tratar para dañar” ó NNTH (del inglés harm), en este segundo caso obviamos el signo negativo (21,22).
- En el caso de que midamos eventos beneficiosos, la fórmula a aplicar debe ser: NNT = 1/(Rt-Rc), al igual que en el caso anterior podemos utilizar igualmente la nomenclatura de los NNTB y NNTH (21,22) para expresar beneficio o daño en el grupo experimental comparado con el grupo control, respectivamente.
– Aunque, si queremos seguir utilizando la fórmula para eventos adversos (NNT=1/(Rc-Rt)) cuando los resultados que nos aportan están referidos a eventos beneficiosos o a prevención de eventos adversos, debemos calcular previamente los eventos adversos a partir de los eventos beneficiosos (22), restándolos del número de pacientes de cada brazo de población. De esta manera, si en un ensayo nos indican que de 150 pacientes en tratamiento con un antihipertensivo, se disminuyó la hipertensión (evento beneficioso) en 100 pacientes, podemos deducir que fueron 50 pacientes los que presentaron la hipertensión (evento adverso).
Podemos comprobar si existe diferencia estadísticamente significativa entre el riesgo de eventos adversos de ambos tratamientos al observar el IC del NNT que hemos calculado. En nuestro ejemplo, el intervalo de confianza del 95% para el NNT del grupo experimental respecto del control va desde 3 a 11, debido a que este intervalo no incluye 8, podemos decir que existe diferencia estadísticamente significativa entre ambos tratamientos, e inversamente cuando el valor de NNT incluye el infinito indica que no hay diferencia estadísticamente significativa. El valor 8 para el NNT significa que habría que tratar a infinitos pacientes para prevenir un evento en uno de ellos, lo que indica ausencia de efecto respecto del grupo control. Igualmente, como veremos más adelante, cuando el IC del NNT pasa de valores positivos a negativos, puede que tampoco haya diferencia estadísticamente significativa, ya que sus valores incluyen el 8 (21).
Es interesante comentar que el intervalo de confianza del NNT no es simétrico respecto de su punto de estimación (23), o dicho de otro modo, el valor de NNT o punto de estimación, no se encuentra en un punto central dentro de su intervalo de confianza, en nuestro ejemplo lo podemos comprobar, donde el punto de estimación NNT=5 se encuentra más cerca del límite inferior (valor 3) que del límite superior (valor 11), esto es debido a la naturaleza inversa del NNT (23).
3. Posibles valores de NNT y su representación gráfica:
Al ser el NNT el inverso del RRA, le confiere unas propiedades inversas al RRA, de manera que, si el rango de posibles valores del RRA va desde (-1 a 1), entonces, el rango de posibles valores que puede alcanzar el NNT se extiende en dos áreas, desde 1 a +8 y desde –8 a -1 (incluyendo el 1 y el -1) (24). Por tanto, existen valores que el NNT nunca podrá alcanzar, desde el 0 a unos valores próximos a 1 y a -1, pero sin incluir ni el 1, ni el –1. El valor de NNT más óptimo es 1 y el peor valor de NNT es +8, los valores de NNT negativos indican que un fármaco produce daño en vez de beneficio comparado con otro fármaco (21,25). En la figura 1 y 2 podemos ver la representación gráfica de los posibles valores de RRA y NNT, respectivamente, ambos respecto del porcentaje de curaciones adicionales.
El intervalo de posibles valores de NNT se representaría matemáticamente (26) de la siguiente forma: NNT [1 a +8) y (-8 a –1], donde [a,b] indica intervalo cerrado que incluye la a y la b, (a,b) indica intervalo abierto que no incluye ni a, ni b y [a,b) es el intervalo semi-abierto, que incluye a, pero no b (26).

4. Limitaciones del NNT:
1) El valor del NNT no nos informa del destino de todos los pacientes.
Aunque el NNT tiene la ventaja de expresar la eficacia de una forma que incorpora el riesgo en el grupo control y el riesgo en el grupo experimental (1), sin embargo, no nos informa sobre el destino de todos los pacientes sometidos al estudio (19). Veámoslo con un ejemplo: supongamos dos fármacos, A y B:
El fármaco A previene 144 eventos adversos en un grupo de 150 pacientes.
El fármaco B previene 135 eventos adversos en un grupo de 150 pacientes.
Entonces: RRA=Rt-Rc= (144/150)–(135/150) = 0,96-0,90 = 0,06; NNT= 1/0,06 = 16,6.
El valor del NNT para el fármaco A respecto del B es 16,6, significa que, hay que tratar a 16,6 pacientes para prevenir un evento adverso adicional sobre los que se prevendrían si fueran tratados con el fármaco B, pero, ¿qué ocurre realmente con los 16,6 que hay que tratar?, si como sabemos, el fármaco A previene 144 eventos adversos en un grupo de 150 pacientes, entonces al tratar a 16,6 se prevendría el evento adverso en 15,9, de los cuales, 1 es adicional sobre el fármaco B y 14,9 también se beneficiarían tanto del fármaco A como del B. De esta manera conocemos el destino de los pacientes que se han tratado.
Los valores de NNT deben expresarse con números enteros y redondeando, en su caso, al número entero superior, ya que representa un número de pacientes, el cual es un dato indivisible. En nuestro ejemplo hemos utilizado valores de NNT con decimales para facilitar la compresión de los cálculos.
2) El valor de NNT expresa tan sólo la diferencia de eficacia entre dos terapias en valores absolutos.
Siguiendo con el ejemplo anterior, supongamos que los mismos fármacos A y B se utilizan para tratar otra patología diferente, donde:
El fármaco A previene 12 eventos adversos en un grupo de 150 pacientes.
El fármaco B previene 3 eventos adversos en un grupo de 150 pacientes.
Entonces: RRA=Rt-Rc= (12/150)-(3/150) = 0,08-0,02 = 0,06; NNT= 1/0,06 = 16,6.
En este segundo caso, el valor del NNT para el fármaco A respecto del B, también es 16,6, de manera que, hay que tratar a 16,6 pacientes para prevenir un evento adverso adicional sobre los que se prevendrían si fueran tratados con el fármaco B, pero, ¿qué ocurre realmente con los 16,6 que hay que tratar?, si como sabemos, el fármaco A previene 12 eventos adversos en un grupo de 150 pacientes, entonces al tratar a 16,6 se prevendría el evento adverso en 1,3 pacientes, de los cuales, 1 es adicional sobre el fármaco B y 0,3 también se beneficiarían tanto del fármaco A como del B.
Como podemos observar en ambos casos el valor de NNT es el mismo, aunque en el primer caso, ambos fármacos son muy eficaces y en el segundo, ambos fármacos son poco eficaces, algo que se debe tener en cuenta a la hora de valorar los fármacos, ya que con el valor del NNT sólo observamos diferencia de eficacia entre ellos y no la eficacia de cada uno de ellos por separado.
3) El valor de NNT presenta problemas a la hora de comparar diferentes ensayos.
El valor de NNT para una determinada intervención en el entorno de un ensayo está ligado a las condiciones en las que se ha desarrollado dicho ensayo, es por ello que si queremos comparar los valores de NNT obtenidos en dos ensayos diferentes, debemos procurar que ambos tengan características similares en cuanto a la duración del tratamiento, el estado basal de los pacientes, el nivel de riesgo de los pacientes para el evento que se mida y que el tratamiento control haya sido el mismo o similar, porque, de lo contrario, nos encontraremos con valores de NNT que no serán comparables (26-29). Esta misma precaución se debe tener también cuando queramos evaluar si dos fármacos pueden considerarse equivalentes terapéuticos.
En el caso especial de los meta-análisis, podemos cometer errores al combinar los NNT de diferentes ensayos (30,31), es por ello que es aconsejable que el NNT vaya acompañado de la situación clínica en que se determinó, el período de tiempo de aplicación del tratamiento, el tiempo de seguimiento, el parámetro que se midió y el riesgo basal de los pacientes. Igualmente, debemos conocer que para poder combinar los resultados de distintos ensayos en un mismo estadístico, estos deben incluir pacientes con las mismas características, mismo pronóstico y que se les haya administrado los mismos tratamientos (32,33).
4) Expresión del IC del NNT cuando este alcanza valores negativos.
Supongamos que realizamos un estudio con dos grupos paralelos de 70 pacientes con hipertensión, unos tratados con el fármaco A (o grupo experimental) y otros tratados con el fármaco B (o grupo control), donde al cabo de un año, en el grupo experimental 20 pacientes presentan el evento adverso fallo cardíaco y en el grupo control, 30 pacientes presentan el citado evento adverso. En la tabla 2 podemos ver la tabla de contingencia de este estudio.
Los puntos de estimación de los estadísticos y sus correspondientes intervalos de confianza, para el evento adverso fallo cardíaco, calculados por los métodos anteriormente descritos son los siguientes:
–IC95% del R del fármaco A = 0,28 (de 0,19 a 0,40)
–IC95% del odds del fármaco A = 0,40 (de 0,23 a 0,66)
–IC95% del R del fármaco B = 0,42 (de 0,31 a 0,54)
–IC95% del odds del fármaco B = 0,75 (de 0,46 a 1,19)
–IC95% del odds ratio del fármaco A respecto del fármaco B = 0,53 (de 0,26 a 1,07)
–IC95% del RR del fármaco A respecto del fármaco B = 0,66 (de 0,42 a 1,05)
–IC95% del RRA del fármaco A respecto del fármaco B = 0,14 (de -0,0156 a 0,2917)
–IC95% del NNT del fármaco A respecto del fármaco B = 7 (de 4 a –64)
Debido a que el NNT es el inverso del RRA, el IC del NNT se obtiene calculando el inverso de los límites del RRA, en nuestro ejemplo, el valor del NNT o punto de estimación sería 7 y los límites superior e inferior del IC95% del NNT irían (de -64 a 4), este intervalo nos presenta dos dificultades para su interpretación, primero, dicho intervalo cubre valores negativos, cuando el número de pacientes sólo puede ser un número positivo, y segundo, el punto de estimación (valor 7) no se encuentra dentro del intervalo. De manera que, en este caso, el intervalo de confianza incluye valores numéricos que deberían excluirse, pero excluye el punto de estimación que debería estar incluido (24). Tenemos diversas opciones para solucionarlo:
a) Debido a que el NNT es el inverso del RRA, las áreas que deben cubrir también son inversas, por tanto, el intervalo de confianza puede consistir en la unión de dos intervalos medio-abiertos, que serían en este caso (de -8 a -64) U (de 4 a +8). Pero, la presentación de los resultados de esta forma resulta algo compleja de entender (13).
b) Podemos aplicar un artificio matemático que consiste en que al calcular los límites de los IC del NNT a partir de los del RRA, los intercambiamos, así, el límite superior del IC del NNT se obtendría a partir del inverso del límite inferior del RRA y el límite inferior del NNT a partir del límite superior del RRA (20,21). Observemos que el signo negativo del límite inferior del RRA pasa a estar en el límite superior del NNT, ahora el intervalo de confianza va desde 4 a -64. Y podría expresarse de la siguiente forma, que resulta más clara y en la que sí se incluye el punto de estimación (valor 7):
–IC95% del NNT= 7 (de 4 a +8) y (de -8 a –64)
Cuando el límite inferior cae por debajo del 0, el intervalo de confianza no es un intervalo, sino que en realidad son dos intervalos. En estos casos o cuando el NNT contiene valores positivos y negativos, significa que su intervalo pasa por valores que llegan al infinito, donde no existe diferencia estadísticamente significativa entre los tratamientos que se comparan.
c) Una tercera forma de expresión de este tipo de intervalos (21) consiste en utilizar una nomenclatura antes comentada del “número necesario a tratar para beneficiar” y “número necesario a tratar para dañar” con lo cual evitamos utilizar los números negativos que hemos visto antes:
–IC95% del NNT= 7 (NNTB 4 a 8 a NNTH 64)
d) Por último, existe una simple y lógica solución para evitar este tipo de problemas: si el límite inferior del IC del RRA cae por debajo del 0, podemos cambiar este límite inferior por 0 sin causar pérdida en la cobertura de la probabilidad. Observemos que si el límite de confianza del RRA fuera negativo y lo cambiásemos por un 0, obtendríamos un límite superior del NNT correspondiente a infinito, esto indicaría que los datos proporcionados no son lo suficientemente precisos como para aportar un resultado concluyente sobre el NNT, valores de NNT cuyo intervalo contengan el 0 indican que no existe diferencia estadísticamente significativa. De esta manera la representación gráfica en una escala del rango de valores probables para el NNT sería más sencilla, sin el problema de la distorsión que significa representar el infinito (24).
5) Equivalentes terapéuticos y el método de la inspección visual del solapamiento de los intervalos de confianza:
Se entiende por equivalente terapéutico aquel fármaco de una familia que difiere en su composición o entidad química del original, pero que se considera con actividad farmacológica y terapéutica similar. Para considerar dos fármacos equivalentes terapéuticos en una determinada indicación, se recurre a la bibliografía, preferentemente en ensayos clínicos doble ciego randomizados de comparación directa, donde se evalúan las variables duras de eficacia (morbilidad, mortalidad o supervivencia…) (34) y la seguridad, aunque, en ocasiones, la ausencia de este tipo de estudios, nos obliga a recurrir a ensayos clínicos respecto a placebo o a otro comparador.
Para comprobar si existe diferencia estadísticamente significativa entre las variables duras de eficacia de dos tratamientos, en ocasiones se recurre a la inspección visual del solapamiento entre los intervalos de confianza del 95% de dichas variables, de forma que, si no existe solapamiento, la diferencia se juzga significativa (con un nivel de confianza del 95%) y si existe solapamiento, la diferencia se juzga como no significativa (35,36), debemos observar que este método es técnicamente incorrecto y puede llevarnos a conclusiones erróneas (35,37,38,39,40).
Un método estándar adecuado para comprobar si existe diferencia estadísticamente significativa entre dos puntos de estimación debe basarse en un parámetro combinado en el que se incluyan ambos puntos de estimación (por ejemplo la diferencia o la razón entre ambos), si el intervalo de confianza del 95% no contiene el valor nulo para este parámetro combinado indica que existe diferencia estadísticamente significativa entre ambos puntos de estimación (valor cero para la diferencia o valor uno para la razón) (39).
Volviendo al método del solapamiento, debemos tener en cuenta, que cuando los intervalos de confianza de dos puntos de estimación no se solapan, entonces el intervalo de confianza de la diferencia entre los puntos de estimación no contendrá el valor nulo, pero, cuando los intervalos de confianza se solapan, el intervalo de confianza de la diferencia entre los puntos de estimación puede o no contener el valor nulo (40,41). El hecho de rechazar la hipótesis nula por el método del solapamiento implica rechazarla por el método estándar, pero, no rechazar la hipótesis nula por el método del solapamiento no implica que no se rechace por el método estándar. O dicho de otra forma, el método del solapamiento puede no rechazar la hipótesis nula cuando el método estándar la rechaza (40,41). El método del solapamiento es, por tanto, más conservador y menos potente que el método estándar (35).
Por tanto, desde un punto de vista práctico, es aconsejable que en estudios comparativos, se calculen los intervalos de confianza de la diferencia entre los grupos y no para los resultados de cada grupo independientemente (36,38,39). De cualquier manera, cuando sólo disponemos de los intervalos de confianza de los puntos de estimación de cada grupo, la inspección visual del solapamiento puede ser un método válido, aunque como hemos visto, conservador (40,41).
A modo de ejemplo, para comprobar lo anteriormente explicado, si comparamos dos grupos, cada uno de 150 pacientes, donde 110 pacientes en el grupo experimental presentan un evento adverso y 125 pacientes en el grupo control también lo presentan, podemos observar, que los IC95% de los Riesgos y los odds de ambos grupos se solapan, indicando por el método de la inspección visual del solapamiento, que no existe diferencia estadísticamente significativa, pero, el IC95% del RRR y el RRA calculado entre ambos grupos no contienen el cero y el IC95% del RR y del odds ratio calculado entre ambos grupos, no contienen el valor 1, indicando por el método estándar, que existe diferencia estadísticamente significativa.
Adjuntamos los cálculos para los odds y odds ratio del ejemplo anterior:
Odds grupo experimental= 2,75 (1,91 a 3,94)
Odds grupo control= 5 (3,26 a 7,65)
Odds Ratio= 0,55 (0,31 a 0,96)
Demostrando que el método de la inspección visual del solapamiento puede no rechazar la hipótesis nula cuando el método estándar la rechaza.



Bibliografía

1. Laupacis A, Sackett DL, Roberts RS. An assessment of clinically useful measures of the consequences of treatmen. N Engl J Med 1988;318:1728-1733.
2. Gardner M, Altman D. Estimation and confidence intervals. En: Gardner M, Altman D, eds. Statistics with confidence. Confidence intervals and statistical guidelines, 1ª ed. London. British Medical Journal Publishing Group, 1989:3-82.
3. Colton T. Statistical inference. En: Colton T, ed. Statistics in medicine, 1ª ed. Boston. Little, Brown and company, 1974:99-252.
4. Bowers D, House A, Owens D. Establishing more of the facts: some common ways of describing results. En: Bowers D, House A, Owens D, eds. Understanding clinical papers, 1ª ed. Chinchester: John Wiley and sons, Ltd. Chinchester, 2003:87-114.
5. Ahlbom A, Norell S. Introduction to modern epidemiology, 2ª ed. Newton Lower Falls: Epidemiology Resources Inc., 1990:1-102.
6. Rothman K. Medidas del efecto. En: Rothman K, ed. Epidemiología moderna. 1ª ed. Madrid. Ediciones Díaz de Santos, S.A., 1987:43-49.
7. Bigby M. Confidence intervals. Arch Dermatol 2000;136(3):386-387.
8. Bigby M. Evidence-based medicine in a nutshell. Arch Dermatol 1998;134(12):1609-1618.
9. Página web: www.pedro.fhs.usyd.edu. au/Utilities/CIcalculator.xls.
10. Newcombe RG. Two-sided confidence intervals for the single proportion: comparison of seven methods. Stat Med 1998;17:857-872.
11. Armitage P and Berry G. 1994. Statistical methods in medical research (3ª ed.). London: Blackwell, pág. 108-109.
12. Newcombe RG. Interval estimation for the difference between independent proportions: comparison of eleven methods. Stat Med 1998;17:873-890.
13. Altman DG. Confidence intervals for the number needed to treat. BMJ 1998;317: 1309-1312.
14. Doval H, Tajer C. Introducción a las medidas utilizadas para evaluar el efecto del tratamiento. En: Doval H, Tajer C, eds. Evidencias en cardiología III. De los ensayos clínicos a las conductas terapéuticas, 3ª ed. Buenos Aires: Atlante, 2004: 1-10.
15. Grieve A. The number needed to treat: a useful clinical measure or a case of the emperor´s new clothes?. Pharmaceutical statistics 2003;2:87-102.
16. Leung W-C. Balancing statistical and clinical significance in evaluating treatment effects. Postgrad Med J 2001;77:201-204.
17. Schechtman E. Odds ratio, relative risk, absolute risk reduction, and the number needed to treat-Which of theses should we use?. Value Health 2002;5(5):431-436.
18. Pita Fernández S, Pértega Díaz S. Significación estadística y relevancia clínica. Cad Aten Primaria 2001;8:191-195.
19. Cook R, Sackett D. The number needed to treat: a clinical useful measure of treatment effect. BMJ 1995;310:452-454.
20. Barrowman N. Missing the point (estimate)? Confidence intervals for the number needed to treat. CMAJ 2002;166(13):1676-1677.
21. Altman DG, Andersen PK. Calculating the number needed to treat for trials where the outcome is time to an event. BMJ 1999;319:1492-1495.
22. Bandolier Extra, Evidence-based health care. Calculating and using NNTs. February 2003. En www.ebandolier.com.
23. Dalton GW y Keating J. Number hended to treta: a statistic relevant for physical therapists. Phys Ther 2000;80:1214-1219.
24. Lui K. A simple logical solution to eliminate the limitations of using the number needed to treat. Eval Health Prof 2004;27 (2):206-214.
25. Hutton J. Number needed to treat: properties and problems. J R Stat Soc Ser A Stat Soc 2000;163(3):403-419.
26. Lesaffre E, Pledger G. A note on the number needed to treat. Control Clin Trials 1999;20:439-447.
27. Elferink A, Zwieten-Boot B. Analysis based on number needed to treat shows differences between drugs studied. BMJ 1997; 314:603.
28. McQuay H, Moore R. Using numerical results from systematic reviews in clinical practice. Ann Intern Med 1997;126:712-720.
29. Wu LA, Kottke TE. Number needed to treat: caveat emptor. J Clin Epidemiol 2001;54: 111-116.
30. Smeeth L, Haines A, Ebrahim S. Numbers needed to treat derived from meta-analyses-sometimes informative, usually misleading. BMJ 1999;318:1548-1551.
31. Bigby M, Williams H. Appraising systematic reviews and meta-analyses. Arch Dermatol 2003;139:795-798.
32. Moore A, McQuay H. Numbers needed to treat derived from meta analysis. NNT is a tool, to be used appropriately (letter). BMJ 1999;319:1199.
33. Newcombe RG. Confidence intervals for the number needed to treat. BMJ 1999;318:1764-1765.
34. Delgado O, Puigventós F, Llodrá V, Comas F, Cervera M, Sánchez A et al. Programa para la sustitución de equivalentes terapéuticos en el medio hospitalario. Farm Hosp 2000;200(5):261-270.
35. Schenker N and Gentleman JF. On judging of differences by examining the overlap between confidence intervals. Am Stat 2001;55(3):182-186.
36. Bigby M and Gadenne AS. Understanding and evaluating clinical trials. J Am Acad Dermatol 1996;34(4):555-590.
37. Payton ME, Greenstone MH and Schenker N. Overlapping confidence interval or standard error intervals: what do they mean in terms of statistical significance?. J Insect Sci 2003;3(34):1-6.
38. Bigby M and Gadenne AS. Understanding and evaluating clinical trials (letter reply). J Am Acad Dermatol 1997;37(5):804-805.
39. Rahfs VW. Understanding and evaluating clinical trials. J Am Acad Dermatol 1997; 37(5):803-804.
40. Cole SR and Blair RC. Overlapping confidence intervals (letter). J Am Acad Dermatol 1999;41(6):1051-1052.
41. Mulla ZD, Cole SR. Replay: Epidemiology of salmonellosis in California, 1990-1991: morbidity, mortality and hospitalization costs (letter). Am J Epidemiol 2004;159: 104-105.

< Volver al Sumario          ^ Subir



© 2004  Revista de la OFIL     Todos los derechos reservados
Organización de Farmacéuticos Ibero-Latinoamericanos