El reporte arranca con el tratamiento de outliers (figura 1): identifica los 13,727 pedidos con pérdida estadísticamente extrema según el criterio Tukey y los aísla. Las figuras 2 a 11 analizan los 166,781 pedidos restantes (sin outliers) para detectar de dónde provienen las pérdidas ordinarias residuales — las que no se explican por valores atípicos sino por el patrón cotidiano de la operación.
Análisis del dataset completo (180,508 pedidos). Izquierda: distribución original con outliers Tukey. Derecha: distribución tras winsorización al fence. Los 13,727 outliers se aíslan; las siguientes figuras analizan los 166,781 pedidos restantes.
Tasa global de pedidos con pérdida y pérdida acumulada por año, sobre el dataset filtrado. Aun sin los outliers severos, la base de pérdidas sigue siendo no marginal.
% pedidos con pérdida por rango de descuento aplicado. Si las barras quedan a la misma altura, el descuento no explica las pérdidas residuales.
% pedidos con pérdida por estado administrativo. Incluye COMPLETE: si también pierde, descarta cancelaciones/fraudes como causa.
Serie mensual 2015-01 → 2018-01 con banda verde ±2pp del promedio. Si la línea no sale de la banda, no hay tendencia ni estacionalidad.
% pedidos con pérdida en las 23 regiones del mundo. Si todas se agrupan cerca del promedio, no hay foco geográfico.
Heatmap simultáneo año × región. Celdas vacías (—) son combinaciones sin datos; las celdas con valor deberían estar todas en tono similar.
Diferencia max-min del % de pérdida en cada candidato (categoría, región, hora, día, modo, cantidad, mercado, segmento, país). Se muestran dos barras: con todos los grupos y con n ≥ 1000 por grupo.
Scatter haversine cliente↔centro USA vs Benefit per order, con ganancias en verde y pérdidas en rojo. Las nubes superpuestas demuestran ausencia de pendiente.
Boxplots de Benefit per order por categoría, con el % de pérdida anotado. Distribuciones similares indican que ninguna categoría es estructuralmente más perdedora.
Barras rojas: tasa de pérdida por cantidad (1 a 5 unidades). Línea blanca: magnitud media de pérdida. La cantidad no afecta la tasa; sí amplifica la magnitud en $.