Modelo A +B
Predicción de indicadores depresivos y
Cclasificación segun su categoria.
Texto a analizar
Introduce aqui tu post:
Modelo de clasificación binaria para la detección de indicadores depresivos en texto.
Indicadores depresivos: Sí / No
Categoria:
Adolecentes.
Probabilidad: 0 - 1
Información del Modelo A
Algoritmo
Se ha utilizado un modelo de Regresión Logística como clasificador binario. Este algoritmo aprende a partir de ejemplos etiquetados y calcula la probabilidad de que un texto pertenezca a la clase “depresivo” o “no depresivo”, en función de las características extraídas del texto.
Representación del texto
Los textos se transforman en vectores numéricos utilizando la técnica TF-IDF, que permite representar la importancia de cada palabra en un texto en relación con el conjunto total de documentos. De este modo, se destacan términos relevantes y se reduce el peso de palabras muy frecuentes pero poco informativas.
Tipo de problema
El problema abordado es una clasificación binaria, donde el sistema determina si un texto contiene o no indicadores asociados a estados depresivos. El modelo devuelve tanto la clase predicha como una probabilidad asociada a dicha predicción.
Ventajas del modelo
La combinación de TF-IDF y Regresión Logística permite obtener un modelo eficiente, rápido y fácilmente interpretable, lo que facilita el análisis de los resultados y la comprensión de qué características influyen en la decisión del modelo.
Limitaciones y consideraciones
Este sistema no sustituye una evaluación clínica ni profesional. El rendimiento del modelo depende en gran medida de la calidad, longitud y contexto del texto introducido, así como del conjunto de datos utilizado para su entrenamiento.
Información del Modelo B
Algoritmo
Máquina de Vectores de Soporte (SVM)
En este modelo se ha utilizado una Máquina de Vectores de Soporte (SVM) como clasificador binario. Este algoritmo busca encontrar el hiperplano óptimo que separa las clases “depresivo” y “no depresivo” maximizando la distancia entre ambas, lo que permite una mejor generalización en datos no vistos.
Representación del texto
TF-IDF (Term Frequency – Inverse Document Frequency)
Al igual que en el Modelo A, los textos se representan mediante TF-IDF, transformando cada documento en un vector numérico que refleja la importancia relativa de las palabras dentro del conjunto de datos.
Clasificación binaria
El Modelo B aborda el mismo problema de clasificación binaria, determinando si un texto presenta indicadores depresivos o no, permitiendo comparar directamente sus resultados con los obtenidos por el Modelo A.
Ventajas del modelo
El uso de SVM permite manejar de forma eficiente espacios de alta dimensionalidad, como los generados por TF-IDF, ofreciendo un buen rendimiento incluso cuando las clases no son fácilmente separables.
Limitaciones y consideraciones
Aunque este modelo puede ofrecer mejores resultados en algunos casos, su interpretación es menos directa que la de la Regresión Logística y su rendimiento depende del ajuste adecuado de los hiperparámetros.