Cómo evitar que el preprocesamiento afecte a mis clusters?
#1
Llevo unos meses trabajando en un proyecto donde debo agrupar clientes por su comportamiento de compra, y aunque he probado varios algoritmos, los resultados no me convencen del todo. Me preocupa que esté pasando por alto algo fundamental en la fase de preprocesamiento, especialmente al tratar con variables de escalas tan diferentes. ¿Alguien más ha sentido que sus clusters son algo arbitrarios o inestables ante pequeños cambios en los datos? Me da la impresión de que mi enfoque actual es demasiado rígido.
Responder
#2
Suena como un clasico desajuste de escalas. Si una variable va de 0 a 1000 y otra de 0 a 1, los clusters pueden girar alrededor de esa diferencia sin que signifique nada real. ¿Has probado normalizar por z score o por min max y mirar si la estabilidad mejora al cambiar la distancia entre puntos?
Responder
#3
Me pasa a veces: cuando el preprocesamiento se siente tan rigido, los clusters se vuelven predecibles y un poco frios. A veces la intuicion importa más que la métrica. La idea de que quizá hay que replantear qué significa agrupar por comportamiento de compra.
Responder
#4
¿Y si el problema es que el objetivo está mal definido? agrupar por comportamiento de compra es ambiguo: qué variables valen, qué periodos, qué umbrales. Los clusters podrían cambiar si se redefine la tarea, no solo si se cambia el algoritmo.
Responder
#5
Yo miraria la robustez primero: outliers, escalas distintas, variables dummy, y una validacion que no dependa de la misma configuracion. A veces una distancia distinta o una proyeccion como PCA revela estructuras que la configuracion anterior oculta.
Responder
#6
Quizá prueba una normalizacion basada en percentiles para que las colas no dominen en los clusters. Es un concepto sin explicarlo del todo.
Responder
#7
Una perspectiva humana dice que los lectores esperan consistencia y que el dataset cambia con el tiempo, y eso cambia los clusters con ajustes menores. Tal vez convenga cuestionar el enfoque para no quedarse atado a una unica idea.
Responder


[-]
Respuesta rápida
Mensaje
Escribe tu respuesta a este mensaje aquí.

Verificación de la imagen
Escribe el texto que aparece en la imagen, en el campo que está abajo. Este proceso se usa para evitar mensajes automáticos.
Verificación de la imagen
(no distingue MAYÚSC/minúsc)

Salto de foro: