Skip to content

Evaluación de características para la detección de sibilancias en sonidos respiratorios

Las enfermedades respiratorias crónicas (ERC), como el asma y la enfermedad pulmonar obstructiva crónica (EPOC), son problemas de salud importantes a nivel mundial. El manejo eficaz de estas afecciones a menudo requiere un monitoreo continuo de los síntomas, particularmente las sibilancias. Las sibilancias son indicativas de obstrucción de las vías respiratorias y su detección temprana es crucial para prevenir exacerbaciones. Este estudio evalúa la eficacia de varias características para distinguir las sibilancias de los sonidos respiratorios normales, empleando un clasificador lineal para evaluar su desempeño en múltiples métricas (1).

deteccion-sibilancias-sonidos-respiratorios

El estudio revisó la literatura existente para seleccionar 105 características utilizadas en investigaciones previas para clasificar sibilancias y sonidos respiratorios normales. Estas características abarcan los dominios temporal, espectral, wavelet y cefstral. Los datos comprendieron 38 grabaciones de diferentes repositorios, que contenían eventos respiratorios tanto con sibilancias como normales. Después del preprocesamiento para estandarizar las grabaciones, se aislaron un total de 425 eventos respiratorios, con 223 etiquetados como sibilancias y 202 como sonidos normales. Se aplicó un filtro pasa banda para eliminar frecuencias irrelevantes y las grabaciones se remuestrearon a 8000 Hz para garantizar la consistencia. El objetivo del estudio fue identificar las características más efectivas para la detección automática de sibilancias. La evaluación se basó en varias métricas, incluida la prueba estadística de suma de rangos, el área bajo la curva de sensibilidad-especificidad (AUC), la puntuación F1, el coeficiente de correlación de Matthews (MCC) y el tiempo de cómputo. Entre las características, el índice de tonalidad se destacó con el mayor tamaño del efecto (87,95%) y el valor p más bajo, lo que indica su fuerte poder discriminatorio. El tercer coeficiente cefstral de frecuencia mel (MFCC) logró el AUC más alto (0.8919) y la puntuación F1 óptima (82.67%), mientras que el primer coeficiente de una codificación lineal predictiva (LPC) de sexto orden exhibió el MCC más alto. El estudio también exploró combinaciones de características para mejorar el rendimiento de la clasificación. Al emparejar características en un modelo de regresión logística, se obtuvieron los mejores resultados al combinar el índice de tonalidad con la característica de pendiente espectral, logrando la puntuación F1 más alta. Cuando se usaron tres características juntas, la combinación de MFCC-3, índice de tonalidad y tasa de cruce por cero (ZCR) produjo el mejor rendimiento. Estas combinaciones ilustran que, si bien las características individuales pueden ser muy efectivas, su desempeño puede mejorarse aún más mediante combinaciones estratégicas. La eficiencia computacional de las características es un factor crítico, especialmente para dispositivos de monitoreo portátiles que funcionan con baterías. El estudio encontró que, si bien las características simples del dominio del tiempo como la energía RMS eran computacionalmente eficientes, su rendimiento de clasificación era bajo. Por el contrario, las características más complejas como MFCC-3, LPC coef-1 e índice de tonalidad, a pesar de sus mayores demandas computacionales, ofrecían un rendimiento superior en la detección de sibilancias. Esta compensación destaca la necesidad de equilibrar la precisión y la carga computacional en el diseño de sistemas de monitoreo en tiempo real. Los hallazgos sugieren que un clasificador de umbral lineal simple que use algunas características cuidadosamente seleccionadas puede discriminar eficazmente entre sibilancias y sonidos respiratorios normales. Este enfoque es particularmente ventajoso para desarrollar dispositivos de monitoreo compactos, livianos y de bajo consumo para uso a largo plazo. Para aplicaciones con menos restricciones en los recursos computacionales, la incorporación de clasificadores más avanzados y características adicionales podría mejorar el rendimiento, aunque a costa de una mayor complejidad y consumo de energía. Este estudio subraya la importancia de la selección de características en la detección automática de sibilancias para el manejo de las ERC. Identifica características clave como MFCC-3, índice de tonalidad y LPC coef-1 como altamente efectivas para esta tarea. Si bien los clasificadores más simples son adecuados para aplicaciones con pocos recursos, es posible que se necesiten algoritmos más sofisticados para entornos donde los recursos computacionales son menos preocupantes. Los resultados brindan información valiosa para desarrollar algoritmos de detección de sibilancias eficientes y confiables, lo que contribuye a un mejor manejo del asma y la EPOC a través del monitoreo continuo de los síntomas.