De la evidencia a la recomendación. GRADE
Transcripción
De la evidencia a la recomendación. GRADE
C A P Í T U L O 11 De la evidencia a la recomendación. GRADE Juan Bautista Cabello López y Jaime Latour Pérez OBJETIVOS DEL CAPÍTULO • Reflexionar sobre la metodología GRADE y su contexto de uso: desarrollo e interpretación de las revisiones sistemáticas y de las guías de práctica clínica. • Describir la escala GRADE con su doble dimensión: su parte valorativa relacionada con la calidad de la evidencia y su parte la aplicativa relacionada con la fuerza de la recomendación. • Evaluar la «calidad» de la evidencia. • Ajustar la dirección y fuerza de la recomendación. INTRODUCCIÓN En capítulos precedentes hemos abordado la lectura crítica de los estudios o piezas elementales de evidencia (estudios de tratamiento o prevención, diagnóstico, pronóstico, etc.), y hemos identificado los elementos para rea lizar un juicio de valor sobre su validez, sobre la importancia y precisión del efecto, así como unas reflexiones sobre su aplicabilidad. Asimismo, hemos hecho lectura crítica de las síntesis, que responden a una pregunta clínica estructurada PICO y que incluyen un grupo de estudios que han sido seleccionados, evaluados y sintetizados de modo explícito y sistemático. También en capítulos previos hemos introducido los diferentes tipos de documentos de evidencia y, entre ellos, las GPC y otros sumarios de evidencias. © 2015. Elsevier España, S.L.U. Reservados todos los derechos Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 182 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA Tanto las RS como las guías de práctica y otros sumarios comparten el hecho de que las piezas de evidencia que las constituyen (los estudios) no son directamente accesibles al lector y, por tanto, no es posible una lectura crítica «directa» del modo en que hemos practicado. Sin embargo, necesi tamos un modo de saber si podemos confiar en la calidad de la evidencia contenida en esos documentos y, en el caso de las guías, si podemos confiar en las recomendaciones. ¿QUÉ ES GRADE? GRADE es el acrónimo de Grading of Recommendations, Assessment, Development, and Evaluations, que es un método para valorar la calidad de la evidencia y para señalar la dirección y fuerza de las recomendacio nes de uso en las GPC. El interés por la jerarquización de la evidencia se inicia en Canadá en 1979 (1). Desde entonces se han usado múltiples instrumentos para este propósito, generando con ello una cierta confusión. Una RS de 2002 (2), ampliada en 2008 (3), identificó hasta 50 instrumentos usados para este fin, que, puntuados por los expertos metodólogos, produjeron una destacada ventaja en las puntuaciones de los de GRADE y SIGN (Scottish Interco llegiate Guidelines Network). Finamente, el panel propuso usar el primero, y estimular su desarrollo y difusión, tarea que actualmente continúa el grupo de trabajo GRADE (www.gradeworkinggroup.org). El método ha sido adoptado por múltiples organizaciones produc toras de evidencia y/o de guías de práctica, de modo que su uso se ha extendido con extraordinaria rapidez (4). Actualmente, GRADE es un instrumento esencial para quienes realizan RS, e imprescindible para las personas involucradas en la formulación de recomendaciones en el contexto de GPC. Por extensión, su conocimiento es clave para los clínicos y profesionales de la salud, que como usuarios de evidencia preevaluada han de com prender las revisiones y los sumarios de evidencia, y como decisores clínicos han de interpretar las guías de práctica e integrar sus recomendaciones con los valores y preferencias de los pacientes. DESCRIPCIÓN DE LA ESCALA GRADE La escala separa explícitamente la calidad de la evidencia (5) del grado de recomendación (6) (cuadro 11-1), y lo hace así porque asume que los procesos son diferentes y los criterios que se usan en cada una de las es calas son esencialmente distintos. No obstante, plantea una relación de dependencia de ambos procesos, y así la calidad de la evidencia resul tante es usada como un elemento determinante en la formulación de las recomendaciones. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 11. De la evidencia a la recomendación. GRADE 183 CUADRO 11-1 E S C A L A G R A D E PA R A L A C A L I D A D DE LA EVIDENCIA Y EL GRADO DE RECOMENDACIÓN Calidad de la evidencia • Alta calidad (⊕⊕⊕⊕ o A): estamos seguros de que el efecto mostrado en los estudios refleja el efecto real existente • Moderada calidad (⊕⊕⊕⊝ o B): estamos bastante seguros de que el efecto mostrado en los estudios está cerca del auténtico efecto real • Baja calidad (⊕⊕⊝⊝ o C): creemos que el auténtico efecto puede diferir significativamente del estimado en estos estudios • Muy baja calidad (⊕⊝⊝⊝ o D): es casi seguro que el auténtico efecto difiere del que ofrecen estos estudios Grado de recomendación • • • • Fuerte a favor (↑↑ o 1) Débil a favor (↑? o 2) Débil en contra (↓? o 2) Fuerte en contra (↓↓ o 1) © Elsevier. Fotocopiar sin autorización es un delito. Para expresar la calidad de la evidencia GRADE, usa una escala con cuatro categorías decrecientes, que se representa con los símbolos o letras que se muestran en el cuadro 11-1, y cuyo significado describimos: • Alta calidad: significa que es poco probable que nuevos estudios cambien el efecto estimado, es decir, confiamos bastante en esta estimación del efecto, es evidencia prácticamente cerrada. • Moderada calidad: aunque confiamos que nuestra estimación está cerca del auténtico efecto, es posible que nuevos estudios puedan cambiar de modo sustancial la estimación del efecto, es decir, aunque estamos relativamente seguros, aún es evidencia abierta. • Baja calidad: creemos que el auténtico efecto puede ser muy distinto del que hemos observado o, en términos de futuro, es probable que nueva investigación tenga gran impacto y cambie nuestra estimación de la evidencia. • Muy baja calidad: estamos realmente inseguros sobre estos resultados o, de otro modo, es casi seguro que nueva investigación cambie por completo los resultados de la estimación. Dicho en términos prácticos, carecemos de evidencia. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 184 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA En relación con la recomendación, la escala tiene dos componentes: uno es la dirección, que podrá ser a favor o en contra de la alternativa estudiada; y el otro es la fuerza de la recomendación, que tiene, a su vez, dos categorías, fuerte o débil (llamada también discrecional o condicional). Combinando fortaleza y dirección, se obtiene una escala ordinal, como se muestra en la figura 11-2 (v. más adelante) y en el cuadro 11-1. CARACTERÍSTICAS ESENCIALES DE ESTA METODOLOGÍA • El método se ha desarrollado, fundamentalmente, para comparaciones entre alternativas terapéuticas o preventivas, y a ello nos circunscribiremos en este capítulo. Hay desarrollos GRADE para estudios de diagnóstico, salud pública o sistemas de salud que tienen sus especificidades y retos particulares, y que no abordaremos aquí. No existe, sin embargo, desarrollo adecuado para el pronóstico (aunque el pronóstico tenga clara relación con la elección de opciones). • El proceso tiene dos partes diferenciadas para cumplimentar las escalas mencionadas: una relacionada con la evaluación de la calidad de la evidencia relativa a una determinada pregunta PICO; y una segunda que es una recomendación de uso, que se realiza sopesando los efectos positivos y negativos de la intervención comparada, considerando la calidad de la evidencia, e incorporando valores del paciente y de la colectividad (fig. 11-1). • Sin duda, la característica más destacable de GRADE es que el proceso se centra en los desenlaces y, a diferencia de otras jerarquías de evidencia, GRADE no se limita a valorar un solo desenlace, sino que considera todos los desenlaces relevantes, tanto los beneficiosos como los indeseados. Ya señalamos en capítulos previos la existencia de tres tipos de desenlaces clínicos (críticos para la decisión, importantes, pero no críticos, y no importantes); pues bien, GRADE incorpora los desenlaces críticos e importantes no críticos, y no toma en consideración los no importantes. Asimismo, comentamos previamente que la arquitectura de estudio (definida por los detalles del diseño y conducción) permite probar simultáneamente el efecto de la intervención sobre varios desenlaces. Sin embargo, la influencia de esos detalles del diseño y conducción sobre la validez del estudio es diferente para cada desenlace (p. ej., la ausencia de cegamiento puede ser esencial si consideramos un desenlace subjetivo como los síntomas, pero será menos relevante si analizamos un desenlace como mortalidad o infarto de miocardio). Por tanto, la calidad de la evidencia no puede predicarse de un diseño en general, sino que debe valorarse para cada desenlace específico. • GRADE no se aplica habitualmente a estudios individuales (no es un modo de leer críticamente un artículo), sino que valora el cuerpo de evidencia sobre una cuestión PICO para sus diversos desenlaces Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. © Elsevier. Fotocopiar sin autorización es un delito. 11. De la evidencia a la recomendación. GRADE 185 FIGURA 11-1 Proceso de evaluación de la evidencia y realización de recomendaciones. ECA, ensayo clínico aleatorio. posibles, y ello tiene dos consecuencias distintas, según el contexto. En cada caso será preciso determinar cuál es la evidencia incorporable para cada conjunto «PICO-desenlace», y cabe esperar que las RS del futuro aborden todos los desenlaces importantes y críticos. Dichas consecuencias son las siguientes: • Si se trata de RS, es posible que algunos estudios incluidos no hayan estudiado desenlaces críticos o importantes no críticos y, por tanto, esos estudios no contribuirán a la estimación combinada de ese particular desenlace. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 186 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA • Si se trata de GPC (que contendrán múltiples preguntas PICO, cada una de las cuales con diversos desenlaces, cuya importancia clínica es pactada al comienzo del proceso), es posible que algunos de los desenlaces críticos o importantes no críticos no hayan sido objeto de estudio en la RS seleccionada. En tal caso, puede ser necesario usar otra revisión, realizar su propia RS ad hoc o usar estudios observacionales (esto puede ocurrir para desenlaces como efectos adversos, especialmente si son raros o tardíos). • El método tras analizar cada uno de los desenlaces separadamente condensa el proceso en el llamado perfil de evidencia, que ofrece para cada desenlace una información explícita de la calidad de la evidencia y de los resultados de los estudios agregados, llamado este último resumen de datos. Ese perfil es útil para hacer una valoración global del conjunto de la evidencia sobre esa pregunta PICO considerando todos los desenlaces. Por tanto, es una herramienta de interés para clínicos lectores de revisiones y panelistas o usuarios de GPC. • Una característica final es que el método ofrece un marco flexible y explícito para la incorporación de los valores y preferencias de los pacientes en las recomendaciones y en el uso de ellas. Veamos, pues, cómo se evalúa la calidad de la evidencia y cómo se formulan las recomendaciones. ¿CÓMO EVALUAR LA CALIDAD DE LA EVIDENCIA? El método propone realizar un juicio o calificación inicial y un ajuste pos terior En cada caso será preciso determinar cuál es la evidencia incorporable para cada conjunto «PICO-desenlace», y cabe esperar que las RS del futuro aborden todos los desenlaces importantes y críticos, teniendo en cuenta características metodológicas y otras reflexiones de contexto. Dado que nos referimos a comparaciones terapéuticas o preventivas, el diseño adecuado será el ECA y, en nuestro caso, la RS de ensayos aleatorios. Sin embargo, no siempre dispondremos de la revisión y, en algunas circuns tancias, será necesario incluir estudios observacionales. Como la unidad de valoración es el desenlace, para cada desenlace enjuiciaremos su calidad, considerando las características de los estudios de la revisión: • Juicio inicial: basándonos en la asunción descrita y si se trata de ECA, calificaremos la evidencia de alta calidad y, si procede de estudios observacionales, la calificaremos de baja calidad. • Ajuste posterior: aunque en general esa calidad inicial responde a la superioridad conocida de los ECA sobre los observacionales, hay detalles particulares del diseño o reflexiones de contexto que en el caso de los ECA harán bajar la calificación en la escala 4 (una o dos Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 11. De la evidencia a la recomendación. GRADE 187 categorías por cada defecto), o en el caso de los observacionales subir (una o dos categorías) la puntuación. Este es un punto distintivo esencial con respecto a otros sistemas de jerarquización de la evidencia que equiparan de forma automática tipo de diseño y grado de evidencia. GRADE reconoce la importancia del diseño del estudio para establecer el grado de evidencia, pero también que un ensayo de baja calidad proporcione evidencia baja, o que un estudio observacional proporcione evidencia moderada. Veamos, pues, cuáles son esos ajustes. AJUSTES A LA BAJA A PARTIR DE ENSAYOS CLÍNICOS ALEATORIOS (ALTA CALIDAD INICIAL) Son cinco los factores que pueden restar puntuación de calidad a la es timación del efecto para ese desenlace. RIESGO DE SESGO O la existencia de defectos en el diseño o conducción de los estudios que compromete su validez (la clásicamente llamada validez interna). Tales problemas, comentados en los capítulos 4 y 5, son: • • • • • • No ocultación de la secuencia de aleatorización. Ausencia de cegamiento. Pérdidas excesivas en el seguimiento. Ausencia de análisis por intención de tratar. Detención precoz por supuesto beneficio. Comunicación selectiva de desenlaces, particularmente los que no muestran efecto. © Elsevier. Fotocopiar sin autorización es un delito. EVIDENCIA INDIRECTA Puede adoptar, típicamente, dos formas. En unos casos, la evidencia proviene de una comparación indirecta, es decir, A es mejor que B, y B mejor que C, luego A es mejor que C, o alternativamente A y B comparadas con placebo, pero no entre sí. En otros casos se trata de ligeros cambios en el PICO: las poblaciones son muy diferentes (diferente gravedad de la enfermedad o distintos tratamien tos asociados), o las intervenciones o comparaciones son algo diferentes (diferente dosis de una u otra droga) y, en ocasiones, son diferentes modos de medir el desenlace, o se miden algunos a través de una variable subrogada. En esos casos se generan dudas respecto de la calidad de la evidencia y por ello se baja una o dos categorías la puntuación. IMPRECISIÓN Cuando los estudios incluyen relativamente pocos pacientes, y es pecialmente si ocurren pocos eventos los intervalos de confianza son muy Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 188 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA amplios, baja la puntuación, porque esa evidencia podría cambiar si nuevos estudios con más efectivos tuvieran otros resultados. Por ello, un IC am plio, especialmente cuando incluye al umbral de decisión, disminuye su credibilidad y sugiere reducir la calidad de la evidencia en al menos un escalón. Adicionalmente, GRADE considera que puede haber imprecisión con IC estrechos, cuando estos se basan en un número muy reducido de eventos: en estos casos, el resultado es estadísticamente significativo a expensas de un efecto implausible, exageradamente grande (efecto de es tudios pequeños) y debe ser contemplado con escepticismo. INCONSISTENCIA La existencia de diferentes estimados del efecto entre los distintos estudios requiere estudiar la heterogeneidad, especialmente si el (los) es tudio(s) inconsistente(s) puede(n) cambiar la dirección del efecto. Cuando no encontramos una explicación satisfactoria para ello, hay que poner en duda la estimación y bajar uno o dos puntos la puntuación de calidad. SESGO DE PUBLICACIÓN Si existen dudas al respecto, la calidad de la evidencia se resiente; es particularmente probable cuando hay pocos estudios y también en los es tudios financiados por la industria. AJUSTES AL ALZA A PARTIR DE ESTUDIOS OBSERVACIONALES (BAJA CALIDAD) Aun cuando ya hemos comentado su interés para algunos desenlaces concretos, los estudios observacionales son considerados de baja cali dad por su propensión a los sesgos (generalmente la sobreestimación del efecto); sin embargo, en circunstancias excepcionales, y siempre que no tengan defectos metodológicos, su evidencia puede calificarse de moderada (y quizá de alta); tales circunstancias son: • Cuando el efecto estimado es muy grande y es consistente entre estudios, se puede aumentar a moderada o incluso a alta calidad la evidencia. Por ejemplo, en una RS observacional (7) de la profilaxis del tromboembolismo con anticoagulantes orales en pacientes con sustitución valvular, la OR fue de 0,17 (IC 95%: 0,13-0,24), que es tan intensa y plausible que debe considerarse evidencia de alta calidad. • Existencia de relación dosis-respuesta. Por ejemplo, el riesgo de sangrado en pacientes con sobredosificación de anticoagulantes orales procede de estudios observacionales, pero el hecho de que cuanto mayor es la sobredosificación más riesgo de sangrado existe, aumenta nuestra confianza en la evidencia sobre ese efecto adverso de la anticoagulación. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 11. De la evidencia a la recomendación. GRADE 189 • Plausibilidad de un factor de confusión. A veces, la existencia de factores de confusión cuyo efecto va en contra del efecto detectado hace más creíble el efecto detectado. CONCEPTUALIZANDO LA CALIDAD DE LA EVIDENCIA Durante todo el capítulo hemos tratado la calidad de la evidencia, y conviene realizar alguna precisión sobre ese concepto. El concepto va más allá de la tradicional validez (interna) de la epidemiologia clínica, y supone más bien la confianza en la estimación basada en una red argumental que incluye la validez interna, pero también otros argumentos vinculados a la precisión, a la consistencia o al sesgo de publicación. En nuestro capítulo hay un matiz adicional según contexto. Así, para el caso de las RS, la calidad de la evidencia significa en qué medida confiamos que un efecto estimado es correcto, y en el contexto de las guías, refleja en qué medida un efecto estimado es adecuado para justificar una recomen dación determinada. El concepto, además, debe diferenciarse de otros de áreas próximas y, en particular, del de la calidad de una RS, y también del de la calidad de una GPC, conceptos que incluyen diferentes componentes y para los que disponemos de instrumentos específicos, como AMSTAR (8) y AGREE (9), respectivamente. © Elsevier. Fotocopiar sin autorización es un delito. PRODUCTOS GRÁFICOS DE GRADE Un objetivo de GRADE es ofrecer un sistema transparente y explícito para la presentación de la calidad de la evidencia disponible que pueda ser usado para su eventual aplicación clínica o para su uso por los panelistas de las GPC. En la tabla 11-1 se muestra el denominado perfil de evidencia para alguno de los ejemplos que introduciremos (anticoagulación frente a antiagregación como prevención secundaria en pacientes con ictus no car dioembólico). En la tabla se puede apreciar la ordenación por desenlaces y la separación entre la valoración de la calidad (columnas de la izquierda) y los resultados resumidos (columnas de la derecha). CÓMO SE REALIZA LA RECOMENDACIÓN Como señalábamos, hay dos dimensiones en la recomendación que analizaremos de modo separado. DIRECCIÓN DE LA RECOMENDACIÓN La formulación de una recomendación a favor o en contra de una inter vención depende del balance global entre los desenlaces beneficiosos y los indeseados del tratamiento o intervención frente a una alternativa concreta. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. TABLA 11-1 Perfil de evidencia para anticoagulación frente a antiagregación como prevención secundaria en pacientes con ictus no cardioembólico Calidad estimada Resumen de los resultados N.° de participantes (n estudios) Riesgo Evidencias Sesgo de Años de seguimiento de sesgo Inconsistencia indirectas Imprecisión publicación Calidad de la evidencia en general Índice de eventos en el estudio (%) Riesgo relativo (IC 95%) Diferencia del riesgo con Riesgo con anticoagulante antiagregantes oral (IC 95%) Con Con anticoagulante antiagregantes oral Mortalidad en general (desenlace importante) Riesgo de Severa 5.400 (5 estudios) 0-5 años sesgo no severo No severo Moderada No 127 de 2.707 debido a la encontrado (4,7) inconsistencia 172 de 2.693 (6,4) 1,36 (1,09-1,7) No Alta encontrado 253 de 2.707 (9,3) 260 de 2.693 (9,7) Moderado 1,03 (0,88-1,22) 106 apoplejías 3 apoplejías más por cada por cada 1.000 1.000 (de menos de 13 a 23 más) Severa Moderada No debido a la encontrado imprecisión 40 de 812 (4,9) 37 de 825 (4,5) 0,91 (0,59-1,4) No severa No Alta encontrado 23 de 1.604 (1,4) No severa Ictus recurrente no letal (isquémico o/y hemorrágico) (desenlace crítico) 5.400 (5 estudios) Riesgo de No severa No severo No severa 0-5 años sesgo no severo Infarto de miocardio no letal (desenlace importante) 1.637 (2 estudios) Riesgo de No severa No severo 3-5 años sesgo no severo Hemorragia extracraneal mayor, no letal (desenlace crítico) 3.194 (4 estudios) Riesgo de No severa No severo 0-5 años sesgo no severo Riesgo basal asumido En negrita, calidad general de la evidencia estimada en función de las observaciones anteriores. IC 95%, intervalo de confianza al 95%; IM, infarto de miocardio. Modificada de (10). 82 de 1.590 (5,2) Moderado 50 muertes por 18 muertes más cada 1.000 por cada 1.000 (de 5 más a 35 más) Moderado 13 IM por cada 1 IM menos por 1.000 cada 1.000 (de 5 menos a 5 más) Moderado RR 3,6 (2,29-5,66) 10 episodios 26 episodios más de sangrado de sangrado por cada por cada 1.000 1.000 (de 13 más a 47 más) 11. De la evidencia a la recomendación. GRADE 191 Si, considerados en su conjunto, los primeros superan a los segundos, se debe establecer una recomendación a favor; en caso contrario, se es tablecerá una recomendación en contra de la intervención. Entre los efectos deseados de la intervención podemos citar la reducción de la mortalidad, la prevención de eventos morbosos, la mejoría de los síntomas, la mejoría de la calidad de vida o la reducción del consumo de recursos. Por el contrario, entre los efectos indeseados se encuentran la reducción de la longevidad, la aparición de complicaciones graves o de efectos colaterales, la reducción de la calidad de vida, las molestias asociadas a su uso o el aumento de los costes. Por ejemplo, en el caso de la anticoagulación oral frente a antiagregan tes en pacientes con antecedentes de ictus isquémico no cardioembólico, se valoró su efecto sobre la mortalidad global, la aparición de un nuevo ictus (isquémico o hemorrágico) no letal, el infarto de miocardio no letal y las hemorragias extracraneales no letales (v. tabla 11-1). El metaanálisis mostró que la warfarina apenas influyó en nuevos ictus cardioembólicos (RR: 1,03; 0,86-1,22) o infartos de miocardio (RR: 0,91; 0,59-1,4) y, en cambio, se encontró un exceso de muertes (RR: 1,35; 1,09-1,7) y de hemorragias extracraneales (RR: 3,6; 2,29-5,66) en los pacientes tratados con anticoa gulantes, por lo que la dirección de la recomendación es en contra de la anticoagulación oral en estos pacientes. FUERZA DE LA RECOMENDACIÓN © Elsevier. Fotocopiar sin autorización es un delito. Aunque la relación riesgo-beneficio es un continuo, GRADE establece cuatro categorías de recomendación: fuerte a favor, débil a favor, débil en contra y fuerte en contra (fig. 11-2). FIGURA 11-2 Categorías de recomendación. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 192 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La fuerza de la recomendación depende del grado de confianza que se tiene en la relación entre las consecuencias deseables e indeseables de la intervención. Si estamos muy convencidos de que los beneficios esperados superan a los efectos adversos (o viceversa), deberemos establecer una recomendación fuerte a favor (o, en su caso, en contra). Por el contrario, si la confianza sobre la relación riesgo-beneficio es menor, se formulará una recomendación débil. En cualquier caso, el grado de recomendación debe ir acompañado del grupo de comparación. Por ejemplo, en el caso del ictus isquémico no cardioembólico, el enunciado de la recomendación debe especificar que se refiere al uso de anticoagulantes orales en comparación con los antia gregantes. DETERMINANTES DE LA FUERZA DE LA RECOMENDACIÓN El grado de confianza en el balance entre riesgos y beneficios depende de varios factores. Los más importantes son la magnitud estimada de los efectos beneficiosos y los efectos adversos, el grado de evidencia sobre los efectos importantes, las preferencias del paciente y los costes. En prin cipio, una diferencia importante entre los efectos beneficiosos y los efectos adversos, y una alta calidad de evidencia apoyan el establecimiento de una recomendación fuerte, especialmente si hay una escasa variabilidad de las preferencias y un coste favorable. Por el contrario, un beneficio neto de escasa magnitud o una calidad de evidencia baja favorecerían una reco mendación débil, más aún si hay variabilidad importante o incertidumbre en las preferencias de los pacientes, o los costes asociados a la intervención son elevados (tabla 11-2). Sin embargo, no hay reglas fijas, y hay que integrar todos los factores. Así, puede haber recomendaciones fuertes respaldadas por evidencias de baja calidad. Ello ocurre, por ejemplo, cuando la evidencia de un efecto adverso es muy baja en un tratamiento protector y cómodo frente a una alternativa más segura, igualmente efectiva, pero más incómoda. Por ejem plo, en gestantes de entre 6-12 semanas con trombosis venosas profundas, TABLA 11-2 Principios generales para las recomendaciones Dominio Recomendación según escenario Equilibrio entre efectos deseables y adversos Calidad de la evidencia Cuanto mayor equilibrio, menor fuerza de recomendación Cuanta menor confianza en la calidad de la evidencia, menor fuerza de recomendación Cuanta más variabilidad entre personas y cuanta menor confianza en la estimación de los valores y preferencias, menor fuerza de recomendación Cuanto mayor coste, menor fuerza de recomendación Valores y preferencias Uso de recursos (costes) Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 11. De la evidencia a la recomendación. GRADE 193 los anticoagulantes orales frente a heparina tienen similar efectividad; esta última es más costosa y más molesta y, aunque el riego de malformaciones por los anticoagulantes es ciertamente pequeño, casi todas las mujeres preferían la heparina. Las GPC deben ser explícitas sobre la forma en que se cuantifican estas dimensiones, y en especial las preferencias. Por ejemplo, las recomendacio nes respecto a un tratamiento antitrombótico pueden ser diferentes según el peso que se le dé a los desenlaces favorables (infartos o ictus evitados) y a los efectos adversos (hemorragias extracraneales). Así, en las guías de ictus anteriormente citadas, se asume explícitamente que, como promedio, los pacientes consideran un ictus (isquémico o hemorrágico) como tres veces más desfavorable que una hemorragia mayor extracraneal. De igual forma, es importante especificar la población a la que se aplica; por ejemplo, la relación riesgo-beneficio puede ser favorable en pacientes con alto riesgo, pero desfavorable en pacientes con bajo riesgo de eventos. En el caso de la anticoagulación frente a la antiagregación a largo plazo en pacientes con ictus no cardioembólico, los anticoagulantes añadieron 18 muertes (entre 5 y 35) y 26 hemorragias extracraneales (entre 13 y 47) por cada 1.000 pacientes tratados, sin diferencias claras en la incidencia de un nuevo ictus o de infarto de miocardio. Aunque la calidad de la evidencia del aumento de las hemorragias fue alta, la calidad de la evidencia del aumento de la mortalidad fue solo moderada, debido a inconsistencia (I2: 62%). En consecuencia, los panelistas propusieron una recomendación 1B en contra de los anticoagulantes en estos pacientes. © Elsevier. Fotocopiar sin autorización es un delito. SIGNIFICADO DE LA FUERZA DE LA RECOMENDACIÓN PARA PACIENTES Y CLÍNICOS Desde el punto de vista del paciente, una recomendación fuerte es aque lla que adoptaría la práctica totalidad de los pacientes bien informados. Por el contrario, si una parte sustancial de pacientes discrepara respecto a la decisión que hay que elegir, entonces la recomendación sería débil. Aunque comentar las decisiones con el paciente es siempre necesario, en el caso de las recomendaciones débiles es especialmente importante que el clínico le dedique un tiempo a la decisión compartida, para asegurarse de que la decisión basada en la recomendación es coherente con las prefe rencias del paciente. SIGNIFICADO DE LA FUERZA DE LA RECOMENDACIÓN PARA LOS DECISORES POLÍTICOS Desde el punto de vista de los decisores políticos, una recomendación fuerte significa que puede ser adoptada en la mayoría de las situaciones, y que una variación en la práctica clínica en este caso es inaceptable, por lo que podría utilizarse como criterio de calidad. Por el contrario, las va riaciones poblacionales relacionadas con recomendaciones débiles pueden Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados. 194 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA ser apropiadas y, por tanto, su uso como criterio de calidad no estaría jus tificado. El hecho de que una recomendación sea fuerte no significa que debe ser implantada de forma prioritaria. Para los decisores políticos, la prioridad de la implantación de una intervención debe tener en cuenta otros factores, como la prevalencia de la enfermedad, la facilidad de implementación, los costes sociales, el impacto potencial o la equidad. El lector interesado en profundizar puede obtener más información en: • Serie de artículos en BMJ (v. http://www.gradeworkinggroup.org/ publications/). • Serie de Journal of Clinical Epidemiology (v. en http://www.jclinepi. com/content/jce-GRADE-Series). Bibliografía 1.The periodic health examination. Canadian Task Force on the Periodic Health Examination. Can Med Assoc J. 1979;121:1193-1254. 2.West S, King V, Carey T, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength of Scientific Evidence. Rockville: Agency for Healthcare Research and Quality (US); 2002 [20/07/2014]. Disponible en: http://www.ncbi.nlm.nih.gov/books/NBK11930/#A86871. ref82. 3.Shukla V, Bai A, Milne S, Wells G. Systematic review of the evidence grading system for grading level of evidence. German J Evidence and Quality in Health Care. 2008;102:43. 4.Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, GRADE Working Group. et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ. 2008;336:24-26. 5.Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ. GRADE Working Group, GRADE: what is «quality of evidence» and why is it important to clinicians? BMJ. 2008;336:995-998. 6.Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al.; GRADE Working Group. GRADE: going from evidence to recommendations. BMJ. 2008;336:1049-1051. 7.Cannegieter SC, Rosendaal FR, Briet E. Thromboembolic and bleeding complications in patients with mechanical heart valve prostheses. Circulation. 1994;89:635-641. 8.Shea BJ, Grimshaw JM, Wells GA. Development of AMSTAR: a measurement tool to assess the methodological quality of systematic reviews. BMC Med Res Methodol. 2007;7:10. 9.Brouwers M, Kho ME, Browman GP, Cluzeau F, Feder G, Fervers B, et al.; AGREE Next Steps Consortium. AGREE II: Advancing guideline development, reporting and evaluation in healthcare. Can Med Assoc J. 2010;182:E839-E842. 10.Lansberg MG, O’Donnell MJ, Khatri P, Lang ES, Nguyen-Huynh MN, Schwartz NE, et al.; American College of Chest Physicians. Antithrombotic and thrombolytic therapy for is chemic stroke: Antithrombotic Therapy and Prevention of Thrombosis, 9th ed: American College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest. 2012;141 (2 Suppl):e601S-e636S. Cómo citar este capítulo: Cabello JB, Latour J. De la evidencia a la recomendación. GRADE. En: Cabello Juan B, editor. Lectura crítica de la evidencia clínica. Barcelona: Elsevier; 2015. p. 181-194. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 16, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.