Introducción
El húmero proximal representa uno de los sitios de fractura más frecuente en adultos mayores, ubicándose como la tercera región en incidencia después de las fracturas de radio distal y cadera en este grupo demográfico1. Con una incidencia global cercana al 6%2, esta fractura afecta principalmente a mujeres y suele estar vinculada a caídas desde el propio plano de sustentación, especialmente en individuos de edad avanzada3.
A pesar de su relevancia clínica, hasta la fecha no se ha logrado consensuar el uso de una única clasificación que exhiba suficiente reproducibilidad entre observadores. Entre las clasificaciones más empleadas se encuentran la de Neer, la de AO (Arbeitsgemeinschaft für Osteosynthesefragen) y la de Hertel4. La clasificación de AO, aunque ampliamente reconocida, se caracteriza por su complejidad y dificultad de aplicación, omitiendo consideraciones cruciales como el daño vascular y los riesgos de necrosis en la cabeza humeral para distintos patrones de fractura5.
En la literatura se han planteado discrepancias sobre la efectividad relativa de los tratamientos conservador y quirúrgico, sin que exista un consenso claro6. La falta de uniformidad en las clasificaciones complica la toma de decisiones quirúrgicas. Por ende, antes de abordar los tratamientos, resulta fundamental determinar cuál clasificación posee mayor utilidad y si ofrecería un algoritmo de tratamiento que pueda servir como guía para las decisiones clínicas.
Este estudio se centra en el análisis de tres sistemas de clasificación en uso actualmente: Neer, Hertel y una nueva clasificación fundamentada en el patrón de fractura denominada Mayo-JDF. El objetivo es evaluar su aplicabilidad con la perspectiva de proponer en el futuro un algoritmo de tratamiento basado en la clasificación más idónea.
Método
Se llevó a cabo un estudio analítico y longitudinal de concordancia retrospectiva, en el cual participaron residentes de ortopedia de tercer y cuarto año. Estos residentes evaluaron un total de 100 radiografías anteroposteriores de hombro correspondientes a fracturas de húmero proximal en pacientes de ambos sexos, con edades comprendidas entre 18 y 99 años.
Los cuatro observadores fueron previamente instruidos durante una sesión de capacitación de una hora sobre el uso de las clasificaciones de Mayo-FJD, Neer y Hertel. Posteriormente, se les solicitó evaluar de manera independiente las imágenes, categorizando las radiografías con las tres clasificaciones en una única ocasión. Se permitió el uso de representaciones pictográficas de las clasificaciones, y no se impuso límite de tiempo para la evaluación. La recopilación de los datos se llevó a cabo mediante una plataforma de captura electrónica.
La evaluación de la concordancia interobservador se realizó mediante el coeficiente de correlación kappa (κ) para las clasificaciones de Hertel, Neer y Mayo-FJD. Se establecieron los siguientes puntos de corte para interpretar la concordancia: nula (κ = 0.0-0.20), mínima (κ = 0.21-0.39), leve (κ = 0.40-0.59), moderada (κ = 0.60-0.79), fuerte (κ = 0.80-0.90) y casi perfecta (κ ≥ 0.90). La significancia de los resultados se determinó mediante un valor de p < 0.05.
En cuanto al manejo de los datos, se empleó Microsoft® Excel® para la creación de la base de datos inicial, seguido por el procesamiento de los datos mediante el paquete estadístico Statistical Package for the Social Sciences (SPSS)® v.26.
Resultados
Para el desarrollo de esta investigación se utilizaron cuatro observadores, dos de tercer año de residencia (observadores 1 y 2) y dos de cuarto año de residencia (observadores 3 y 4). Se evaluaron 100 sujetos, el 70% (n = 70) de sexo femenino y el 30% (n = 30) de sexo masculino, con una mediana para edad de 67.00 años (intervalo intercuartílico [RIC]: 24.00; p = 0.005).
Se realizaron medidas de concordancia interobservador a partir del coeficiente κ para cada clasificación utilizada. En las tres clasificaciones se obtuvieron coeficientes κ < 0.40, lo que se significa un nivel de concordancia mínimo (Tablas 1–3).
Tabla 1. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Hertel
Clasificación Hertel | ||
---|---|---|
κ | p | |
Observador 1-2 | 0.256 | < 0.001 |
Observador 1-3 | 0.199 | < 0.001 |
Observador 1-4 | 0.400 | < 0.001 |
Observador 2-3 | 0.157 | < 0.001 |
Observador 2-4 | 0.369 | < 0.001 |
Observador 3-4 | 0.209 | < 0.001 |
Promedio | 0.265 | < 0.001 |
Tabla 2. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Neer
Clasificación NEER | ||
---|---|---|
κ | p | |
Observador 1-2 | 0.290 | < 0.001 |
Observador 1-3 | 0.432 | < 0.001 |
Observador 1-4 | 0.421 | < 0.001 |
Observador 2-3 | 0.268 | < 0.001 |
Observador 2-4 | 0.329 | < 0.001 |
Observador 3-4 | 0.362 | < 0.001 |
Promedio | 0.350 | < 0.001 |
Tabla 3. Niveles de coeficiente kappa (κ) para concordancia interobservadores en la clasificación Mayo-FJD
Clasificación Mayo-FJD | ||
---|---|---|
κ | p | |
Observador 1-2 | 0.261 | < 0.001 |
Observador 1-3 | 0.316 | < 0.001 |
Observador 1-4 | 0.359 | < 0.001 |
Observador 2-3 | 0.352 | < 0.001 |
Observador 2-4 | 0.310 | < 0.001 |
Observador 3-4 | 0.473 | < 0.001 |
Promedio | 0.345 | < 0.001 |
Con respecto a la clasificación Hertel, el mayor nivel de concordancia se encontró entre los observadores 1 y 4 (κ = 0.400), mientras que la menor concordancia se presentó entre los observadores 2 y 3 (κ = 0.157). Esta clasificación presentó un rango de 0.243 en los coeficientes de correlación. Todos los resultados presentaron p < 0.001 (Tabla 1).
En la clasificación Neer, el mayor nivel de concordancia se encontró entre los observadores 1 y 3 (κ = 0.432), mientras que la menor concordancia se presentó entre los observadores 2 y 3 (κ = 0.268). Esta clasificación presentó el menor rango en los resultados (0.164). Todos los resultados presentaron p < 0.001 (Tabla 2).
En la clasificación Mayo-FJD, el mayor nivel de concordancia se encontró entre los observadores 3 y 4 (κ = 0.473), siendo este el resultado más alto de concordancia en todas las clasificaciones evaluadas, mientras que la menor concordancia se presentó entre los observadores 1 y 2 (κ = 0.261). Esta clasificación presentó un rango de 0.212. Igualmente, todos los resultados presentaron p < 0.001 (Tabla 3).
De manera general, la clasificación Hertel presentó la menor concordancia interobservador (κ = 0.265), la clasificación de Neer presentó la mejor concordancia interobservador (κ = 0.350) y la clasificación Mayo-FJD presentó una concordancia de κ = 0.345.
Cuando se habla de los resultados de la clasificación de Neer se encontró que la mayoría de los resultados se clasificaron como dos partes (cuello quirúrgico) y tres partes (tuberosidad mayor). En los resultados de la clasificación de Hertel la mayoría de las respuestas se clasificaron como tipo 1 (cuello quirúrgico), tipo 3 (tuberosidad mayor aislada), tipo 7 (cuello quirúrgico asociado a tuberosidad mayor) y tipo 12 (en cuatro partes).
Mientras que en la clasificación de Mayo-FJD la mayoría de resultados se registraron en las categorías I, VIII y IX, siendo estos patrones: fractura aislada de tuberosidad mayor, cuello quirúrgico aislado y cuello quirúrgico asociado a tuberosidad mayor. Por tanto, es posible notar cierta homogeneidad en la descripción de los trazos más identificados independientemente de la clasificación utilizada.
Discusión
El abordaje de las fracturas de húmero proximal sigue careciendo de estandarización en la literatura médica. Las clasificaciones internacionalmente reconocidas han demostrado una amplia variabilidad interobservador, a pesar de la abundancia de estudios de imagen disponibles, lo que potencialmente impacta en las decisiones terapéuticas7,8.
Se ha destacado que el empleo de tomografías y reconstrucciones en 3D puede mejorar la confiabilidad interobservador en clasificaciones como AO y Neer9. Este hallazgo sugiere que la calidad de las imágenes evaluadas en nuestro estudio podría haber influido en la baja concordancia interobservador.
En un estudio reciente de Rocío Martínez-Solas et al. (2021) que evaluó la variabilidad interobservador en radiografías en proyección anteroposterior de hombro utilizando las clasificaciones Neer, Hertel y AO, se obtuvieron resultados similares a los nuestros, con un valor kappa de 0.29 para Neer y 0.34 para Hertel10.
El predominio de respuestas de la clasificación de Hertel como tipo 1, 3, 7 y 12, similar a los resultados del estudio de Majed et al.11, resalta la consistencia en la frecuencia de tipos de fracturas entre diferentes estudios.
Es crucial señalar que al limitarnos a radiografías anteroposteriores de hombro en este estudio, observamos una mayor variabilidad en comparación con la literatura que incorpora otros estudios complementarios. Por ejemplo, el estudio de Antonio M. Foruria et al. (2022) sobre la clasificación Mayo-FJD, que incluyó radiografías y tomografías simples de fracturas de húmero proximal, informó valores kappa de 0.69 para radiografías y 0.81 para tomografías simples en una evaluación, superando nuestras cifras12.
Las limitaciones de nuestro estudio incluyen la falta de estandarización en la toma de proyecciones radiográficas dentro del Centro Hospitalario, con variabilidad en la posición del brazo que podría afectar la calidad de las imágenes. Además, la evaluación basada en una única proyección radiográfica puede no ser suficiente, considerando la estática de la imagen y la dificultad para discernir patrones de fractura debido a la superposición de fragmentos e imágenes. Se sugiere estandarizar el uso de dos proyecciones radiográficas y la incorporación de tomografía simple en la evaluación de pacientes con fracturas de húmero proximal.
Conclusión
La mayor concordancia interobservador entre los residentes del Centro Médico ABC con una sola radiografía anteroposterior utilizando la clasificación de Neer puede deberse a una mayor familiaridad con dicha clasificación. Sin embargo, a pesar de los informes en la literatura sobre la variabilidad interobservador en las clasificaciones de húmero proximal, la dependencia exclusiva de una proyección anteroposterior no es suficiente para lograr una clasificación homogénea entre residentes. Para obtener una evaluación más fiable de los patrones de fractura, se sugiere continuar el estudio mediante mediciones intraobservador e interobservador utilizando tomografía simple computarizada.
Financiamiento
Los autores declaran no haber recibido financiamiento para este estudio.
Conflicto de intereses
Los autores declaran no tener conflicto de intereses.
Responsabilidades éticas
Protección de personas y animales. Los autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.
Confidencialidad de los datos. Los autores declaran que en este artículo no aparecen datos de pacientes.
Derecho a la privacidad y consentimiento informado. Los autores declaran que en este artículo no aparecen datos de pacientes.
Uso de inteligencia artificial para generar textos. Los autores declaran que no han utilizado ningún tipo de inteligencia artificial generativa en la redacción de este manuscrito ni para la creación de figuras, gráficos, tablas o sus correspondientes pies o leyendas.