Variabilidad interobservador de tres clasificaciones radiográficas para fractura de húmero proximal, entre residentes de ortopedia en el Centro Médico ABC

Variabilidad interobservador de tres clasificaciones radiográficas para fractura de húmero proximal, entre residentes de ortopedia en el Centro Médico ABC

Daniela del Río-González 1 , Eira Santiago-Balmaseda 1 , Luis Ochoa-Olvera 1 , Carlos F. Gutiérrez-Toledano 1 , Jorge A. Ascencio-Aragón 1 , Alejandro G. Gallegos-Tejeda 1

1 Servicio de Traumatología y Ortopedia, Centro Médico ABC, Ciudad de México, México

*Correspondencia: Daniela del Río-González. Email: danieladr.gonzalez@gmail.com

Fecha de recepción: 14-05-2024

Fecha de aceptación: 29-08-2024

DOI: 10.24875/AMH.24000013

Disponible en internet: 07-11-2024

An Med ABC. 2024;69(4):265-269

Resumen

Antecedentes: Actualmente, la reproducibilidad y confiabilidad de las clasificaciones radiológicas para fracturas de húmero proximal no han sido demostradas. La clasificación de Neer es la más utilizada, a pesar de mostrar una alta variabilidad interobservador.

Objetivo: Evaluar la variabilidad interobservador de tres clasificaciones radiográficas para fracturas de húmero proximal (Neer, Hertel y Mayo-FJD) entre residentes de ortopedia del Centro Médico ABC.

Método: Cuatro observadores evaluaron 100 radiografías anteroposteriores de húmero proximal, asignando un grado a la fractura según las clasificaciones Neer, Hertel y Mayo-FJD. La concordancia interobservador se evaluó mediante el coeficiente de correlación kappa.

Resultados: Del total de radiografías, el 70% correspondió a pacientes de sexo femenino y el 30% a pacientes de sexo masculino, con una edad promedio de 67 años. La clasificación de Neer mostró la mayor concordancia interobservador (0.350). La clasificación Hertel presentó una concordancia de 0.265, mientras que la clasificación Mayo-FJD mostró una concordancia de 0.345, siendo esta última más consistente entre residentes de mayor jerarquía.

Conclusiones: Las clasificaciones evaluadas no proporcionan confiabilidad para describir fracturas de húmero proximal en radiografías anteroposteriores de hombro. Se recomienda analizar la confiabilidad de estas clasificaciones para estudios de tomografía computarizada.

Palabras clave:  Clasificación. Húmero proximal. Fractura.

Contenido

Id previo:  94

Introducción

El húmero proximal representa uno de los sitios de fractura más frecuente en adultos mayores, ubicándose como la tercera región en incidencia después de las fracturas de radio distal y cadera en este grupo demográfico1. Con una incidencia global cercana al 6%2, esta fractura afecta principalmente a mujeres y suele estar vinculada a caídas desde el propio plano de sustentación, especialmente en individuos de edad avanzada3.

A pesar de su relevancia clínica, hasta la fecha no se ha logrado consensuar el uso de una única clasificación que exhiba suficiente reproducibilidad entre observadores. Entre las clasificaciones más empleadas se encuentran la de Neer, la de AO (Arbeitsgemeinschaft für Osteosynthesefragen) y la de Hertel4. La clasificación de AO, aunque ampliamente reconocida, se caracteriza por su complejidad y dificultad de aplicación, omitiendo consideraciones cruciales como el daño vascular y los riesgos de necrosis en la cabeza humeral para distintos patrones de fractura5.

En la literatura se han planteado discrepancias sobre la efectividad relativa de los tratamientos conservador y quirúrgico, sin que exista un consenso claro6. La falta de uniformidad en las clasificaciones complica la toma de decisiones quirúrgicas. Por ende, antes de abordar los tratamientos, resulta fundamental determinar cuál clasificación posee mayor utilidad y si ofrecería un algoritmo de tratamiento que pueda servir como guía para las decisiones clínicas.

Este estudio se centra en el análisis de tres sistemas de clasificación en uso actualmente: Neer, Hertel y una nueva clasificación fundamentada en el patrón de fractura denominada Mayo-JDF. El objetivo es evaluar su aplicabilidad con la perspectiva de proponer en el futuro un algoritmo de tratamiento basado en la clasificación más idónea.

Método

Se llevó a cabo un estudio analítico y longitudinal de concordancia retrospectiva, en el cual participaron residentes de ortopedia de tercer y cuarto año. Estos residentes evaluaron un total de 100 radiografías anteroposteriores de hombro correspondientes a fracturas de húmero proximal en pacientes de ambos sexos, con edades comprendidas entre 18 y 99 años.

Los cuatro observadores fueron previamente instruidos durante una sesión de capacitación de una hora sobre el uso de las clasificaciones de Mayo-FJD, Neer y Hertel. Posteriormente, se les solicitó evaluar de manera independiente las imágenes, categorizando las radiografías con las tres clasificaciones en una única ocasión. Se permitió el uso de representaciones pictográficas de las clasificaciones, y no se impuso límite de tiempo para la evaluación. La recopilación de los datos se llevó a cabo mediante una plataforma de captura electrónica.

La evaluación de la concordancia interobservador se realizó mediante el coeficiente de correlación kappa (κ) para las clasificaciones de Hertel, Neer y Mayo-FJD. Se establecieron los siguientes puntos de corte para interpretar la concordancia: nula (κ = 0.0-0.20), mínima (κ = 0.21-0.39), leve (κ = 0.40-0.59), moderada (κ = 0.60-0.79), fuerte (κ = 0.80-0.90) y casi perfecta (κ ≥ 0.90). La significancia de los resultados se determinó mediante un valor de p < 0.05.

En cuanto al manejo de los datos, se empleó Microsoft® Excel® para la creación de la base de datos inicial, seguido por el procesamiento de los datos mediante el paquete estadístico Statistical Package for the Social Sciences (SPSS)® v.26.

Resultados

Para el desarrollo de esta investigación se utilizaron cuatro observadores, dos de tercer año de residencia (observadores 1 y 2) y dos de cuarto año de residencia (observadores 3 y 4). Se evaluaron 100 sujetos, el 70% (n = 70) de sexo femenino y el 30% (n = 30) de sexo masculino, con una mediana para edad de 67.00 años (intervalo intercuartílico [RIC]: 24.00; p = 0.005).

Se realizaron medidas de concordancia interobservador a partir del coeficiente κ para cada clasificación utilizada. En las tres clasificaciones se obtuvieron coeficientes κ < 0.40, lo que se significa un nivel de concordancia mínimo (Tablas 13).

Tabla 1. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Hertel

Clasificación Hertel
κ p
Observador 1-2 0.256 < 0.001
Observador 1-3 0.199 < 0.001
Observador 1-4 0.400 < 0.001
Observador 2-3 0.157 < 0.001
Observador 2-4 0.369 < 0.001
Observador 3-4 0.209 < 0.001
Promedio 0.265 < 0.001

Tabla 2. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Neer

Clasificación NEER
κ p
Observador 1-2 0.290 < 0.001
Observador 1-3 0.432 < 0.001
Observador 1-4 0.421 < 0.001
Observador 2-3 0.268 < 0.001
Observador 2-4 0.329 < 0.001
Observador 3-4 0.362 < 0.001
Promedio 0.350 < 0.001

Tabla 3. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Mayo-FJD

Clasificación Mayo-FJD
κ p
Observador 1-2 0.261 < 0.001
Observador 1-3 0.316 < 0.001
Observador 1-4 0.359 < 0.001
Observador 2-3 0.352 < 0.001
Observador 2-4 0.310 < 0.001
Observador 3-4 0.473 < 0.001
Promedio 0.345 < 0.001

Con respecto a la clasificación Hertel, el mayor nivel de concordancia se encontró entre los observadores 1 y 4 (κ = 0.400), mientras que la menor concordancia se presentó entre los observadores 2 y 3 (κ = 0.157). Esta clasificación presentó un rango de 0.243 en los coeficientes de correlación. Todos los resultados presentaron p < 0.001 (Tabla 1).

En la clasificación Neer, el mayor nivel de concordancia se encontró entre los observadores 1 y 3 (κ = 0.432), mientras que la menor concordancia se presentó entre los observadores 2 y 3 (κ = 0.268). Esta clasificación presentó el menor rango en los resultados (0.164). Todos los resultados presentaron p < 0.001 (Tabla 2).

En la clasificación Mayo-FJD, el mayor nivel de concordancia se encontró entre los observadores 3 y 4 (κ = 0.473), siendo este el resultado más alto de concordancia en todas las clasificaciones evaluadas, mientras que la menor concordancia se presentó entre los observadores 1 y 2 (κ = 0.261). Esta clasificación presentó un rango de 0.212. Igualmente, todos los resultados presentaron p < 0.001 (Tabla 3).

De manera general, la clasificación Hertel presentó la menor concordancia interobservador (κ = 0.265), la clasificación de Neer presentó la mejor concordancia interobservador (κ = 0.350) y la clasificación Mayo-FJD presentó una concordancia de κ = 0.345.

Cuando se habla de los resultados de la clasificación de Neer se encontró que la mayoría de los resultados se clasificaron como dos partes (cuello quirúrgico) y tres partes (tuberosidad mayor). En los resultados de la clasificación de Hertel la mayoría de las respuestas se clasificaron como tipo 1 (cuello quirúrgico), tipo 3 (tuberosidad mayor aislada), tipo 7 (cuello quirúrgico asociado a tuberosidad mayor) y tipo 12 (en cuatro partes).

Mientras que en la clasificación de Mayo-FJD la mayoría de resultados se registraron en las categorías I, VIII y IX, siendo estos patrones: fractura aislada de tuberosidad mayor, cuello quirúrgico aislado y cuello quirúrgico asociado a tuberosidad mayor. Por tanto, es posible notar cierta homogeneidad en la descripción de los trazos más identificados independientemente de la clasificación utilizada.

Discusión

El abordaje de las fracturas de húmero proximal sigue careciendo de estandarización en la literatura médica. Las clasificaciones internacionalmente reconocidas han demostrado una amplia variabilidad interobservador, a pesar de la abundancia de estudios de imagen disponibles, lo que potencialmente impacta en las decisiones terapéuticas7,8.

Se ha destacado que el empleo de tomografías y reconstrucciones en 3D puede mejorar la confiabilidad interobservador en clasificaciones como AO y Neer9. Este hallazgo sugiere que la calidad de las imágenes evaluadas en nuestro estudio podría haber influido en la baja concordancia interobservador.

En un estudio reciente de Rocío Martínez-Solas et al. (2021) que evaluó la variabilidad interobservador en radiografías en proyección anteroposterior de hombro utilizando las clasificaciones Neer, Hertel y AO, se obtuvieron resultados similares a los nuestros, con un valor kappa de 0.29 para Neer y 0.34 para Hertel10.

El predominio de respuestas de la clasificación de Hertel como tipo 1, 3, 7 y 12, similar a los resultados del estudio de Majed et al.11, resalta la consistencia en la frecuencia de tipos de fracturas entre diferentes estudios.

Es crucial señalar que al limitarnos a radiografías anteroposteriores de hombro en este estudio, observamos una mayor variabilidad en comparación con la literatura que incorpora otros estudios complementarios. Por ejemplo, el estudio de Antonio M. Foruria et al. (2022) sobre la clasificación Mayo-FJD, que incluyó radiografías y tomografías simples de fracturas de húmero proximal, informó valores kappa de 0.69 para radiografías y 0.81 para tomografías simples en una evaluación, superando nuestras cifras12.

Las limitaciones de nuestro estudio incluyen la falta de estandarización en la toma de proyecciones radiográficas dentro del Centro Hospitalario, con variabilidad en la posición del brazo que podría afectar la calidad de las imágenes. Además, la evaluación basada en una única proyección radiográfica puede no ser suficiente, considerando la estática de la imagen y la dificultad para discernir patrones de fractura debido a la superposición de fragmentos e imágenes. Se sugiere estandarizar el uso de dos proyecciones radiográficas y la incorporación de tomografía simple en la evaluación de pacientes con fracturas de húmero proximal.

Conclusión

La mayor concordancia interobservador entre los residentes del Centro Médico ABC con una sola radiografía anteroposterior utilizando la clasificación de Neer puede deberse a una mayor familiaridad con dicha clasificación. Sin embargo, a pesar de los informes en la literatura sobre la variabilidad interobservador en las clasificaciones de húmero proximal, la dependencia exclusiva de una proyección anteroposterior no es suficiente para lograr una clasificación homogénea entre residentes. Para obtener una evaluación más fiable de los patrones de fractura, se sugiere continuar el estudio mediante mediciones intraobservador e interobservador utilizando tomografía simple computarizada.

Financiamiento

Los autores declaran no haber recibido financiamiento para este estudio.

Conflicto de intereses

Los autores declaran no tener conflicto de intereses.

Responsabilidades éticas

Protección de personas y animales. Los autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.

Confidencialidad de los datos. Los autores declaran que en este artículo no aparecen datos de pacientes.

Derecho a la privacidad y consentimiento informado. Los autores declaran que en este artículo no aparecen datos de pacientes.

Uso de inteligencia artificial para generar textos. Los autores declaran que no han utilizado ningún tipo de inteligencia artificial generativa en la redacción de este manuscrito ni para la creación de figuras, gráficos, tablas o sus correspondientes pies o leyendas.

Bibliografía

1. Relvas Silva M, Linhares D, Leite MJ, Nunes B, Torres J, Neves N, et al. Proximal humerus fractures:epidemiology and trends in surgical management of hospital-admitted patients in Portugal. JSES Int. 2022;6(3):380-84.

2. Court-Brown CM, Caesar B. Epidemiology of adult fractures:A review. Injury. 2006;37(8):691-7.

3. GPC IMSS. Guías de práctica clínica- Diagnóstico y Tratamiento de la fractura cerrada de húmero proximal en el adulto [Internet]. Ciudad de México:Instituto Mexicano del Seguro Social;2010. Disponible en:https://www.imss.gob.mx/sites/all/statics/guiasclinicas/576GER.pdf

4. Muller ME. Nazarian S, Koch P, Schatzker J. The Comprehensive Classification of Fractures of Long Bones/AO Classification of Fractures. Springer-Verlag;1990.

5. Russo R, Cautiero F, Della Rotonda G. The classification of complex 4-part humeral fractures revisited:the missing fifth fragment and indications for surgery. Musculoskelet Surg. 2012;96(Suppl 1):S13-9.

6. Rangan A, Handoll H, Brealey S, Jefferson L, Keding A, Martin BC, et al. Surgical vs nonsurgical treatment of adults with displaced fractures of the proximal humerus:the PROFHER randomized clinical trial. JAMA. 2015;313(10):1037-47.

7. Jakob RP, Ganz R. Proximale humerusfrakturen. Helv Chir Acta. 1982;48(5):595-610.

8. Burstein AH. Fracture classification systems:do they work and are they useful?J Bone Joint Surg Am. 1993;75(12):1743-4.

9. Brunner A, Honigmann P, Treumann T, Babst R. The impact of stereo-visualisation of three-dimensional CT datasets on the inter- and intraobserver reliability of the AO/OTA and Neer classifications in the assessment of fractures of the proximal humerus. J Bone Joint Surg Br. 2009;91(6):766-71.

10. Martínez-Sola R, León-Muñoz VJ, Najem-Rizk AN, Soler-Vasco B, Arrieta-Martínez CJ, López-Sorroche E, et al. ´Absolute´inter-observer classifications agreement for proximal humeral fractures with a single shoulder anteroposterior X-ray. J Orthop Surg (Hong Kong). 2021(2):23094990211010520.

11. Majed A, Macleod I, Bull AM, Zyto K, Resch H, Hertel R, et al. Proximal humeral fracture classification systems revisited. J Shoulder Elbow Sur. 2011;20(7):1125-32.

12. Foruria AM, Martinez-Catalan N, Pardos B, Larson D, Barlow J, Sanchez-Sotelo J. Classification of proximal humerus fractures according to pattern recognition is associated with high intraobserver and interobserver agreement. JSES Int. 2022;6(4):563-68.