1 Exploración preliminar de los datos

En esta sección, realizamos una exploración preliminar de los datos para entender la estructura y el contenido del conjunto de datos. Esto incluye la carga de las librerías necesarias, la lectura del archivo Excel que contiene los datos de los proyectos, y la creación de variables dummy para las tipologías de proyectos y gobernación.

# Cargar las librerías
library(readxl)   
library(dplyr)    
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(writexl)
library(vegan)
## Cargando paquete requerido: permute
library(permute)
library(fastDummies)
library(ggplot2)
library(scales)
library(AER)
## Cargando paquete requerido: car
## Cargando paquete requerido: carData
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
## Cargando paquete requerido: lmtest
## Cargando paquete requerido: zoo
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Cargando paquete requerido: sandwich
## Cargando paquete requerido: survival
library(sf)
## Linking to GEOS 3.13.1, GDAL 3.10.2, PROJ 9.5.1; sf_use_s2() is TRUE
library(tidyr)
library(viridis)
## Cargando paquete requerido: viridisLite
## 
## Adjuntando el paquete: 'viridis'
## The following object is masked from 'package:scales':
## 
##     viridis_pal
library(knitr)
library(data.table)
## 
## Adjuntando el paquete: 'data.table'
## The following objects are masked from 'package:zoo':
## 
##     yearmon, yearqtr
## The following objects are masked from 'package:dplyr':
## 
##     between, first, last
library(carData)
library(stringr)
library(purrr)
## 
## Adjuntando el paquete: 'purrr'
## The following object is masked from 'package:data.table':
## 
##     transpose
## The following object is masked from 'package:car':
## 
##     some
## The following object is masked from 'package:scales':
## 
##     discard
library(cowplot)
library(GGally)
library(viridis)
library(ggspatial)
library(ggpubr)
## 
## Adjuntando el paquete: 'ggpubr'
## The following object is masked from 'package:cowplot':
## 
##     get_legend
library(nortest)
library(gridExtra)
## 
## Adjuntando el paquete: 'gridExtra'
## The following object is masked from 'package:dplyr':
## 
##     combine
library(tibble)
library(reshape2)
## 
## Adjuntando el paquete: 'reshape2'
## The following objects are masked from 'package:data.table':
## 
##     dcast, melt
## The following object is masked from 'package:tidyr':
## 
##     smiths
library(kableExtra)
## 
## Adjuntando el paquete: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(formattable)
## 
## Adjuntando el paquete: 'formattable'
## The following objects are masked from 'package:scales':
## 
##     comma, percent, scientific
library(DT)
library(corrplot)
## corrplot 0.95 loaded
library(ggridges)
library(treemapify)
library(RColorBrewer)
library(ggrepel)
library(igraph)
## 
## Adjuntando el paquete: 'igraph'
## The following object is masked from 'package:formattable':
## 
##     normalize
## The following object is masked from 'package:tibble':
## 
##     as_data_frame
## The following objects are masked from 'package:purrr':
## 
##     compose, simplify
## The following object is masked from 'package:tidyr':
## 
##     crossing
## The following object is masked from 'package:vegan':
## 
##     diversity
## The following object is masked from 'package:permute':
## 
##     permute
## The following objects are masked from 'package:dplyr':
## 
##     as_data_frame, groups, union
## The following objects are masked from 'package:stats':
## 
##     decompose, spectrum
## The following object is masked from 'package:base':
## 
##     union
library(ggraph)
library(ggdendro)
library(patchwork)
## 
## Adjuntando el paquete: 'patchwork'
## The following object is masked from 'package:formattable':
## 
##     area
## The following object is masked from 'package:cowplot':
## 
##     align_plots
library(pheatmap)
library(grid)
library(cluster)  
library(mclust)
## Package 'mclust' version 6.1.1
## Type 'citation("mclust")' for citing this R package in publications.
## 
## Adjuntando el paquete: 'mclust'
## The following object is masked from 'package:purrr':
## 
##     map
library(DT)    
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(car)
library(MASS)
## 
## Adjuntando el paquete: 'MASS'
## The following object is masked from 'package:patchwork':
## 
##     area
## The following object is masked from 'package:formattable':
## 
##     area
## The following object is masked from 'package:dplyr':
## 
##     select
library(broom)
library(ggeffects)
## 
## Adjuntando el paquete: 'ggeffects'
## The following object is masked from 'package:cowplot':
## 
##     get_title
library(margins)
library(tmap)
library(sp)
## 
## Adjuntando el paquete: 'sp'
## The following object is masked from 'package:ggraph':
## 
##     geometry
library(conflicted)
library(biscale)

2 Desarrollamos las estimaciones de las tipologías de proyectos

knitr::opts_chunk$set(echo = TRUE)

conflict_prefer("select", "dplyr")
## [conflicted] Will prefer dplyr::select over any other package.
conflict_prefer("filter", "dplyr")
## [conflicted] Will prefer dplyr::filter over any other package.
## -------------**Creación de variables dummy y resumen por comuna**---------------------##
df_raw <- read_excel ("C:/Users/william/Desktop/monografia aca merida/datos/ACA Modelaje R Final.xlsx", 
    sheet = "Resumen") %>%
  mutate(ID_COMUNA = paste0(COD_UBIGEO, "-", COD_CC))

# Crear dummies desde las variables cualitativas
df_dummies <- df_raw %>%
  dummy_cols(
    select_columns = c(
      "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG",
      "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION",
      "CLASIFICACION_DEL_PROYECTO"
    ),
    remove_first_dummy = FALSE
  )

# ---------------------Primera tabla - Variables originales (primeros 10 registros)---------------------
tabla1 <- df_raw %>%
  select(
    `Nudo Críticos por Tipología CFG` = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
    `Nudos Críticos por Tipología de Gobierno` = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
    `COD UBIGEO` = COD_UBIGEO,
    `COD CC` = COD_CC,
    COMUNA,
    `ID COMUNA` = ID_COMUNA
  ) %>%
  head(10)

kable(tabla1, caption = "Tabla 1. Primeros 10 registros de datos originales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), font_size = 10) %>%
  footnote(general = "Nota. ID_COMUNA = Identificador único de comuna y combinación del código UBIGEO y código SITUR de cada comuna; COD_UBIGEO = Código de ubicación geográfica a nivel nacional y Mérida.",
           general_title = "")
Tabla 1. Primeros 10 registros de datos originales
Nudo Críticos por Tipología CFG Nudos Críticos por Tipología de Gobierno COD UBIGEO COD CC COMUNA ID COMUNA
INFRAESTRUCTURA DRENAJES 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
ELECTRICIDAD ELECTRICIDAD 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
TELECOMUNICACIONES TELECOMUNICACIONES 140102 14-01-2007 COMUNA SIMON BOLÍVAR. 140102-14-01-2007
MANEJO INTEGRAL DEL AGUA AGUA POTABLE 140102 C-MIX-2021-01-0003 COMUNA ETERNO GIGANTE 140102-C-MIX-2021-01-0003
VIVIENDA VIVIENDA 140102 C-MIX-2021-01-0003 COMUNA ETERNO GIGANTE 140102-C-MIX-2021-01-0003
MANEJO INTEGRAL DEL AGUA AGUA RESIDUAL 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
AMBIENTE CANALIZACION 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
INFRAESTRUCTURA VIVIENDA 140102 C-MIX-2018-11-0084 COMUNA LUZ DEL ALBA 140102-C-MIX-2018-11-0084
MANEJO INTEGRAL DEL AGUA AGUA POTABLE 140102 C-MIX-2021-02-0005 COMUNA FRANCISCO DE MIRANDA 140102-C-MIX-2021-02-0005
INFRAESTRUCTURA DRENAJES 140102 C-MIX-2021-02-0005 COMUNA FRANCISCO DE MIRANDA 140102-C-MIX-2021-02-0005
Nota. ID_COMUNA = Identificador único de comuna y combinación del código UBIGEO y código SITUR de cada comuna; COD_UBIGEO = Código de ubicación geográfica a nivel nacional y Mérida.
#------------------------Segunda tabla - Variables importantes (primeros 10 registros)--------------------
tabla2 <- df_raw %>%
  select(
    n_proyectos,
    PLAZOS,
    CLASIFICACION_DEL_PROYECTO,
    TIPOLOGIA_CFG_NUM,
    GOBERNACION_NUM,
    RATIO_ACA_PROYECTO_CULMINADO,
    Clasificacion_Actores_institucionales
  ) %>%
  head(10)

kable(tabla2, caption = "Tabla 2. Primeros 10 registros de variables de análisis principales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), font_size = 10)
Tabla 2. Primeros 10 registros de variables de análisis principales
n_proyectos PLAZOS CLASIFICACION_DEL_PROYECTO TIPOLOGIA_CFG_NUM GOBERNACION_NUM RATIO_ACA_PROYECTO_CULMINADO Clasificacion_Actores_institucionales
4 1 3 5 5 3 2
4 1 1 4 6 1 2
4 1 1 13 17 1 2
4 2 3 6 2 3 2
4 2 1 16 21 1 1
4 1 1 6 3 1 2
4 1 1 1 4 1 1
4 1 3 5 21 3 3
4 2 1 6 2 1 2
4 2 1 5 5 1 2

3 Análisis de tendencia central y de dispersión de las variables originales

#-------------------- Análisis de tendencia central y dispersión---------------
analisis_tendencia <- df_raw %>%
  select(n_proyectos, PLAZOS,CLASIFICACION_DEL_PROYECTO, TIPOLOGIA_CFG_NUM, GOBERNACION_NUM, 
         RATIO_ACA_PROYECTO_CULMINADO, Clasificacion_Actores_institucionales) %>%
  psych::describe() %>%
  rownames_to_column("Variable") %>%
  select(Variable, n, mean, sd, min, max, median, skew, kurtosis)

kable(analisis_tendencia, caption = "Tabla 3. Medidas de tendencia central y dispersión") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), font_size = 10)
Tabla 3. Medidas de tendencia central y dispersión
Variable n mean sd min max median skew kurtosis
n_proyectos 198 3.737374 0.5055200 2 4 4 -1.7494530 2.1981557
PLAZOS 198 1.808081 0.4656041 0 2 2 -2.4023102 5.1067366
CLASIFICACION_DEL_PROYECTO 198 2.257576 1.2979164 1 4 2 0.2106089 -1.7220231
TIPOLOGIA_CFG_NUM 198 8.767677 4.8674372 1 16 6 0.2606497 -1.4123977
GOBERNACION_NUM 198 10.393939 7.0470762 1 21 8 0.3298126 -1.5163471
RATIO_ACA_PROYECTO_CULMINADO 198 2.257576 1.2979164 1 4 2 0.2106089 -1.7220231
Clasificacion_Actores_institucionales 198 2.005050 0.7706380 1 4 2 0.4549552 -0.1339291
# Análisis de frecuencias para variables categóricas n_proyectos
frecuencias_n_proyectos <- df_raw %>%
  count(n_proyectos) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = n_proyectos)
kable(frecuencias_n_proyectos, caption = "Distribución de frecuencias para la variable n_proyectos") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable n_proyectos
Categoría Frecuencia Porcentaje
2 6 3.03
3 40 20.20
4 152 76.77
# Análisis de frecuencias para variables categóricas Clasificación del proyecto

frecuencias_clasificacion_proyecto <- df_raw %>%
  count(CLASIFICACION_DEL_PROYECTO) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = CLASIFICACION_DEL_PROYECTO)
kable(frecuencias_clasificacion_proyecto, caption = "Distribución de frecuencias para la variable CLASIFICACION_DEL_PROYECTO") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable CLASIFICACION_DEL_PROYECTO
Categoría Frecuencia Porcentaje
1 97 48.99
2 3 1.52
3 48 24.24
4 50 25.25
# Análisis de frecuencias para variables categóricas Plazos
frecuencias_plazos <- df_raw %>%
  count(PLAZOS) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = PLAZOS)

kable(frecuencias_plazos, caption = "Distribución de frecuencias para la variable PLAZOS") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable PLAZOS
Categoría Frecuencia Porcentaje
0 6 3.03
1 26 13.13
2 166 83.84
# Análisis de RATIO_ACA_PROYECTO_CULMINADO
frecuencias_ratio <- df_raw %>%
  count(RATIO_ACA_PROYECTO_CULMINADO) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = RATIO_ACA_PROYECTO_CULMINADO)

kable(frecuencias_ratio, caption = "Distribución de frecuencias para la variable RATIO_ACA_PROYECTO_CULMINADO") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable RATIO_ACA_PROYECTO_CULMINADO
Categoría Frecuencia Porcentaje
1 97 48.99
2 3 1.52
3 48 24.24
4 50 25.25
# Análisis de actores institucionales
frecuencias_actores <- df_raw %>%
  count(Clasificacion_Actores_institucionales) %>%
  mutate(Porcentaje = round(n / sum(n) * 100, 2)) %>%
  rename(Frecuencia = n, Categoría = Clasificacion_Actores_institucionales)

kable(frecuencias_actores, caption = "Distribución de frecuencias para la variable Clasificacion_Actores_institucionales") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Distribución de frecuencias para la variable Clasificacion_Actores_institucionales
Categoría Frecuencia Porcentaje
1 51 25.76
2 102 51.52
3 38 19.19
4 7 3.54
##--------------------------Trafico de frecuencias---------------------------

# Combinar todos los dataframes de frecuencias en uno solo
plot_data <- bind_rows(
  frecuencias_n_proyectos %>% mutate(Variable = "Número de Consultas (n_proyectos)"),
  frecuencias_clasificacion_proyecto %>% mutate(Variable = "Estado del Proyecto"),
  frecuencias_ratio %>% mutate(Variable = "Ratio de Efectividad"),
  frecuencias_plazos %>% mutate(Variable = "Plazo de Ejecución (PLAZOS)"),
  frecuencias_actores %>% mutate(Variable = "Actor Institucional Principal")
) %>%
  mutate(Categoría = as.factor(Categoría))

# Definir etiquetas descriptivas para cada categoría
plot_data <- plot_data %>%
  mutate(
    Etiqueta_Categoria = case_when(
      Variable == "Estado del Proyecto" ~ case_when(
        Categoría == 1 ~ "1 - No Considerado",
        Categoría == 2 ~ "2 - No Culminado",
        Categoría == 3 ~ "3 - En Ejecución",
        Categoría == 4 ~ "4 - Culminado"
      ),
      Variable == "Ratio de Efectividad" ~ case_when(
        Categoría == 1 ~ "1 - Muy Baja",
        Categoría == 2 ~ "2 - Baja",
        Categoría == 3 ~ "3 - Media",
        Categoría == 4 ~ "4 - Alta"
      ),
      Variable == "Plazo de Ejecución (PLAZOS)" ~ case_when(
        Categoría == 0 ~ "0 - Sin Dato",
        Categoría == 1 ~ "1 - Corto Plazo",
        Categoría == 2 ~ "2 - Mediano Plazo"
      ),
      Variable == "Actor Institucional Principal" ~ case_when(
        Categoría == 1 ~ "1 - Ministerio",
        Categoría == 2 ~ "2 - Gob. Nac/Est.",
        Categoría == 3 ~ "3 - Mun./Comunal",
        Categoría == 4 ~ "4 - Privado"
      ),
      Variable == "Número de Consultas (n_proyectos)" ~ as.character(Categoría),
      TRUE ~ as.character(Categoría)
    )
  )

# Calcular el límite superior del eje Y para asegurar que las etiquetas encajen
y_max <- max(plot_data$Frecuencia) * 1.1

# Crear el gráfico de barras con facetas mejorado
ggplot(plot_data, aes(x = Etiqueta_Categoria, y = Frecuencia, fill = Etiqueta_Categoria)) +
  geom_col(show.legend = FALSE) +  
  geom_text(aes(label = Frecuencia), vjust = -0.5, size = 3.5) +  
  facet_wrap(~ Variable, scales = "free_x", ncol = 5) + 
  scale_fill_viridis_d() + 
  labs(
    title = "Distribución de Frecuencias de Variables Clave",
    x = "Categorías",
    y = "Frecuencia (Número de Proyectos)",
    caption = "Elaboración Propia - William Gutierrez"  
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1, size = 9),  
    strip.text = element_text(face = "bold", size = 10), 
    plot.title = element_text(hjust = 0.5, face = "bold"),  
    plot.caption = element_text(hjust = 1, size = 9, face = "italic")  
  ) +
  ylim(0, y_max)  

4 Frecuencia global por cada tipología, ¿qué problema es el más común?

Para establecer cuáles son los nudos críticos más recurrentes en todo el Estado Mérida, primero calculamos la frecuencia absoluta y relativa de cada tipología CFG y de gobernación. Esto nos permite identificar las áreas de mayor concentración de problemas y priorizar las líneas de análisis posteriores.

##----------------------------Resumen CFG por Comuna---------------------------
cfg_cols <- df_dummies %>% 
  select(starts_with("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_")) %>% 
  names()

df_cfg_summary <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(cfg_cols), list(
      count = ~ sum(.x, na.rm = TRUE),
      pct = ~ sum(.x, na.rm = TRUE) / n() * 100
    ))
  ) %>%
  ungroup()

##-----------------------Resumen de Gobernación por comuna----------------------
gob_cols <- df_dummies %>% 
  select(starts_with("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_")) %>% 
  names()

df_gob_summary <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(gob_cols), list(
      count = ~ sum(.x, na.rm = TRUE),
      pct = ~ sum(.x, na.rm = TRUE) / n() * 100
    ))
  ) %>%
  ungroup()

##------------------------Análisis de frecuencias-------------------------------

# Función mejorada para análisis completo
analizar_frecuencia <- function(data, var, fill_color, line_color, titulo, tipo = "proyectos") {
  # Determinar nombre de etiqueta según tipo
  y_label <- ifelse(tipo == "proyectos", "Número de proyectos", "Número de comunas")
  
  # Frecuencias globales
  freq <- data %>%
    count({{var}}, name = "n") %>%
    arrange(desc(n)) %>%
    mutate(
      pct = n / sum(n) * 100,
      cum_pct = cumsum(pct),
      etiqueta = paste0(n, "\n(", round(pct, 1), "%)")
    )
  
  # Gráfico combinado
  plot <- ggplot(freq, 
         aes(x = reorder({{var}}, n), y = n)) +
    geom_col(fill = fill_color, alpha = 0.8) +
    geom_text(aes(label = etiqueta), 
              hjust = -0.1, size = 3.5, color = "black", lineheight = 0.8) +
    geom_line(aes(y = cum_pct * max(n) / 100), 
              group = 1, color = line_color, size = 0.8) +
    geom_point(aes(y = cum_pct * max(n) / 100), 
               color = line_color, size = 2) +
    scale_y_continuous(
      name = y_label,
      sec.axis = sec_axis(~ . * 100 / max(freq$n), 
                         name = "Porcentaje acumulado (%)",
                         labels = scales::percent_format(scale = 1))
    ) +
    coord_flip() +
    labs(
      title = titulo,
      subtitle = "Barras: frecuencia absoluta | Texto: conteo y % individual | Línea: % acumulado",
      x = NULL
    ) +
    theme_minimal(base_size = 12) +
    expand_limits(y = max(freq$n) * 1.15)
  
  return(list(freq = freq, plot = plot))
}

# Función mejorada para frecuencia por comuna
analizar_frecuencia_comuna <- function(data, var, fill_color, line_color, titulo) {
  freq_comuna <- data %>%
    distinct(ID_COMUNA, {{var}}) %>%  
    count({{var}}, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      pct_comunas = n_comunas / sum(n_comunas) * 100,
      cum_pct = cumsum(pct_comunas),
      etiqueta = paste0(n_comunas, "\n(", round(pct_comunas, 1), "%)")
    )
  
  # Gráfico combinado
  plot <- ggplot(freq_comuna, 
         aes(x = reorder({{var}}, n_comunas), y = n_comunas)) +
    geom_col(fill = fill_color, alpha = 0.8) +
    geom_text(aes(label = etiqueta), 
              hjust = -0.1, size = 3.5, color = "black", lineheight = 0.8) +
    geom_line(aes(y = cum_pct * max(n_comunas) / 100),
              group = 1, color = line_color, size = 0.8) +
    geom_point(aes(y = cum_pct * max(n_comunas) / 100),
               color = line_color, size = 2) +
    scale_y_continuous(
      name = "Número de comunas",
      sec.axis = sec_axis(~ . * 100 / max(freq_comuna$n_comunas),
                         name = "Porcentaje acumulado (%)",
                         labels = scales::percent_format(scale = 1))
    ) +
    coord_flip() +
    expand_limits(y = max(freq_comuna$n_comunas) * 1.15) +
    labs(
      title = titulo,
      subtitle = "Barras: frecuencia absoluta | Texto: conteo y % de comunas | Línea: % acumulado",
      x = NULL
    ) +
    theme_minimal(base_size = 12)
  
  return(list(freq_comuna = freq_comuna, plot = plot))
}
## ----------------------------Análisis para CFG--------------------------------

# Conteo y proporciones globales por Tipologia CFG

cfg_global_proyectos <- analizar_frecuencia(
  df_dummies,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
  "darkblue", "gold",
  "Frecuencia global de tipologías CFG (Proyectos)"
)
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
cfg_global_comunas <- analizar_frecuencia_comuna(
  df_dummies,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
  "darkblue", "gold",
  "Frecuencia de tipologías CFG por comuna"
)
# Tablas de estadísticas descriptivas básicas de frecuencias para CFG
print(cfg_global_proyectos$freq)
## # A tibble: 16 × 5
##    CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG     n    pct cum_pct etiqueta   
##    <chr>                                        <int>  <dbl>   <dbl> <chr>      
##  1 MANEJO INTEGRAL DEL AGUA                        54 27.3      27.3 "54\n(27.3…
##  2 VIALIDAD                                        30 15.2      42.4 "30\n(15.2…
##  3 VIVIENDA                                        21 10.6      53.0 "21\n(10.6…
##  4 ELECTRICIDAD                                    19  9.60     62.6 "19\n(9.6%…
##  5 SALUD                                           14  7.07     69.7 "14\n(7.1%…
##  6 INFRAESTRUCTURA                                 12  6.06     75.8 "12\n(6.1%…
##  7 AMBIENTE                                        10  5.05     80.8 "10\n(5.1%…
##  8 EDUCACIÓN                                        9  4.55     85.4 "9\n(4.5%)"
##  9 TRANSPORTE                                       7  3.54     88.9 "7\n(3.5%)"
## 10 TELECOMUNICACIONES                               6  3.03     91.9 "6\n(3%)"  
## 11 MUROS                                            5  2.53     94.4 "5\n(2.5%)"
## 12 SOCIO PRODUCTIVO                                 4  2.02     96.5 "4\n(2%)"  
## 13 SEGURIDAD                                        3  1.52     98.0 "3\n(1.5%)"
## 14 CANALIZACION                                     2  1.01     99.0 "2\n(1%)"  
## 15 ORGANIZACION COMUNAL                             1  0.505    99.5 "1\n(0.5%)"
## 16 PROCESOS INDUSTRIALES                            1  0.505   100   "1\n(0.5%)"
##----------------------------Mostrar resultados-------------------------------------
# Conteo y proporciones globales sobre la variable original
freq_cfg <- df_dummies %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n") %>%
  arrange(desc(n)) %>%
  mutate(
    pct     = n / sum(n) * 100,
    cum_pct = cumsum(pct)
  )
#-------------------------Top 10 barras simples--------------------------------
freq_cfg %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, n),
    y = n
  )) +
    geom_col(fill = "darkblue") +
    coord_flip() +
    labs(
      title = "Top 10 tipologías CFG más frecuentes",
      x     = "Tipología CFG",
      y     = "Número de proyectos"
    ) +
    theme_minimal()

##--------------------Grafico de frecuencias de tipologías CFG------------------
print(cfg_global_proyectos$plot)

#----------------------------------Tablas de estadísticas descriptivas básicas de frecuencias para CFG para las comunas-----------------------------------
print(cfg_global_comunas$freq_comuna)
## # A tibble: 16 × 5
##    CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOL…¹ n_comunas pct_comunas cum_pct etiqueta
##    <chr>                                      <int>       <dbl>   <dbl> <chr>   
##  1 MANEJO INTEGRAL DEL AGUA                      43      23.6      23.6 "43\n(2…
##  2 VIALIDAD                                      27      14.8      38.5 "27\n(1…
##  3 VIVIENDA                                      21      11.5      50   "21\n(1…
##  4 ELECTRICIDAD                                  18       9.89     59.9 "18\n(9…
##  5 SALUD                                         14       7.69     67.6 "14\n(7…
##  6 INFRAESTRUCTURA                               11       6.04     73.6 "11\n(6…
##  7 AMBIENTE                                      10       5.49     79.1 "10\n(5…
##  8 EDUCACIÓN                                      9       4.95     84.1 "9\n(4.…
##  9 TRANSPORTE                                     7       3.85     87.9 "7\n(3.…
## 10 TELECOMUNICACIONES                             6       3.30     91.2 "6\n(3.…
## 11 MUROS                                          5       2.75     94.0 "5\n(2.…
## 12 SOCIO PRODUCTIVO                               4       2.20     96.2 "4\n(2.…
## 13 SEGURIDAD                                      3       1.65     97.8 "3\n(1.…
## 14 CANALIZACION                                   2       1.10     98.9 "2\n(1.…
## 15 ORGANIZACION COMUNAL                           1       0.549    99.5 "1\n(0.…
## 16 PROCESOS INDUSTRIALES                          1       0.549   100   "1\n(0.…
## # ℹ abbreviated name: ¹​CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG
#--------Frecuencia absoluta y relativa de comunas por tipología CFG---------
freq_cfg_comuna <- df_dummies %>%
  distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
  arrange(desc(n_comunas)) %>%
  mutate(
    pct_comunas = n_comunas / sum(n_comunas) * 100,
    cum_pct     = cumsum(pct_comunas)
  )

#---------------------------------Top 10 comunas--------------------------------
freq_cfg_comuna %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, n_comunas),
    y = n_comunas
  )) +
    geom_col(fill = "darkblue") +
    coord_flip() +
    labs(
      title = "Top 10 tipologías CFG por número de comunas",
      x     = "Tipología CFG",
      y     = "Número de comunas"
    ) +
    theme_minimal()

##----------------Grafico de frecuencias de tipologías CFG--------------------
print(cfg_global_comunas$plot)

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS CFG POR PROYECTOS
# ==============================================================================

crear_tabla_cfg_proyectos <- function(data) {
  
  # Calcular frecuencias
  tabla_cfg <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_proyectos") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      porcentaje = round(n_proyectos / sum(n_proyectos) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Proyectos" = n_proyectos,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada con kableExtra
  tabla_final <- tabla_cfg %>%
    kable(
      caption = "Tabla 4.1: Distribución de Frecuencias de Tipologías CFG por Número de Proyectos",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#e8f4fd") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Frecuencias Absolutas y Relativas" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Las primeras 4 tipologías concentran el 62.6% de todos los nudos críticos"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_cfg, tabla = tabla_final))
}

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS CFG POR COMUNAS
# ==============================================================================

crear_tabla_cfg_comunas <- function(data) {
  
  # Calcular frecuencias por comuna (sin repetir comunas)
  tabla_cfg_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      porcentaje = round(n_comunas / sum(n_comunas) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Comunas" = n_comunas,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_cfg_comunas %>%
    kable(
      caption = "Tabla 4.2: Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#e8f4fd") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Distribución Territorial" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Una comuna puede tener múltiples tipologías, pero se cuenta una sola vez por tipología"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_cfg_comunas, tabla = tabla_final))
}

# ==============================================================================
# TABLA COMPARATIVA CFG: PROYECTOS VS COMUNAS
# ==============================================================================

crear_tabla_comparativa_cfg <- function(data) {
  
  # Datos por proyectos
  cfg_proyectos <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_proyectos") %>%
    mutate(pct_proyectos = round(n_proyectos / sum(n_proyectos) * 100, 2))
  
  # Datos por comunas
  cfg_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "n_comunas") %>%
    mutate(pct_comunas = round(n_comunas / sum(n_comunas) * 100, 2))
  
  # Unir ambas tablas
  tabla_comparativa <- cfg_proyectos %>%
    inner_join(cfg_comunas, by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      ranking = row_number(),
      intensidad = round(n_proyectos / n_comunas, 2)  # Proyectos por comuna promedio
    ) %>%
    select(
      ranking,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      n_proyectos, pct_proyectos,
      n_comunas, pct_comunas,
      intensidad
    ) %>%
    rename(
      "Rank" = ranking,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "N° Proy." = n_proyectos,
      "% Proy." = pct_proyectos,
      "N° Com." = n_comunas,
      "% Com." = pct_comunas,
      "Intensidad" = intensidad
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_comparativa %>%
    kable(
      caption = "Tabla 4.3: Análisis Comparativo CFG - Proyectos vs Comunas Afectadas",
      align = c("c", "l", rep("c", 5)),
      format = "html",
      digits = 2
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#2c3e50", width = "3em") %>%
    column_spec(2, width = "15em") %>%
    column_spec(3:7, width = "6em") %>%
    add_header_above(c(" " = 2, "Por Proyectos" = 2, "Por Comunas" = 2, "Indicador" = 1)) %>%
    row_spec(1:3, background = "#ffe6e6") %>%  # Top 3 en rojo suave
    row_spec(4:7, background = "#fff2e6") %>%  # Siguientes 4 en naranja suave
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por tipología)"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_comparativa, tabla = tabla_final))
}

# ==============================================================================
#  TABLA RESUMEN EJECUTIVO CFG (TOP 10)
# ==============================================================================

crear_tabla_resumen_cfg <- function(data) {
  
  # Calcular estadísticas resumidas
  total_proyectos <- nrow(data)
  total_comunas <- n_distinct(data$ID_COMUNA)
  
  resumen_cfg <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "proyectos") %>%
    arrange(desc(proyectos)) %>%
    slice(1:10) %>%  # Solo top 10
    mutate(
      pct_proyectos = round(proyectos / total_proyectos * 100, 1),
      pct_acum = round(cumsum(pct_proyectos), 1)
    ) %>%
    # Agregar datos de comunas
    left_join(
      data %>%
        distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>%
        count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, name = "comunas"),
      by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG"
    ) %>%
    mutate(
      pct_comunas = round(comunas / total_comunas * 100, 1),
      posicion = row_number(),
      categoria = case_when(
        posicion <= 3 ~ "🔴 Crítico",
        posicion <= 7 ~ "🟡 Alto",
        TRUE ~ "🟢 Medio"
      )
    ) %>%
    select(
      posicion, categoria,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      proyectos, pct_proyectos, pct_acum,
      comunas, pct_comunas
    ) %>%
    rename(
      "Pos." = posicion,
      "Nivel" = categoria,
      "Tipología CFG" = CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG,
      "Proy." = proyectos,
      "%" = pct_proyectos,
      "% Acum." = pct_acum,
      "Com." = comunas,
      "% Com." = pct_comunas
    )
  
  # Crear tabla formateada
  tabla_final <- resumen_cfg %>%
    kable(
      caption = "Tabla 4.4: Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas",
      align = c("c", "c", "l", rep("c", 5)),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, width = "3em") %>%
    column_spec(2, width = "8em") %>%
    column_spec(3, width = "15em") %>%
    column_spec(4:8, width = "5em") %>%
    add_header_above(c(" " = 3, "Análisis por Proyectos" = 3, "Por Comunas" = 2)) %>%
    footnote(
      general = paste0(
        "Total analizado: ", total_proyectos, " proyectos en ", total_comunas, " comunas. ",
        "El Top 10 concentra el ", round(sum(resumen_cfg$`%`), 1), "% de todos los nudos críticos."
      ),
      general_title = "Nota:",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = resumen_cfg, tabla = tabla_final))
}

5 Análisis de Tipologías CFG: Tablas Descriptivas

En esta sección presentamos el análisis detallado de las tipologías CFG mediante tablas descriptivas que permiten visualizar la distribución, frecuencia e impacto territorial de los nudos críticos identificados.

5.1 Tabla 4.1: Distribución de Frecuencias de Tipologías CFG por Número de Proyectos

Tabla 4.1: Distribución de Frecuencias de Tipologías CFG por Número de Proyectos
Frecuencias Absolutas y Relativas
Tipología CFG N° Proyectos Porcentaje (%) % Acumulado Ranking
MANEJO INTEGRAL DEL AGUA 54 27.27 27.27 1
VIALIDAD 30 15.15 42.42 2
VIVIENDA 21 10.61 53.03 3
ELECTRICIDAD 19 9.60 62.63 4
SALUD 14 7.07 69.70 5
INFRAESTRUCTURA 12 6.06 75.76 6
AMBIENTE 10 5.05 80.81 7
EDUCACIÓN 9 4.55 85.36 8
TRANSPORTE 7 3.54 88.90 9
TELECOMUNICACIONES 6 3.03 91.93 10
MUROS 5 2.53 94.46 11
SOCIO PRODUCTIVO 4 2.02 96.48 12
SEGURIDAD 3 1.52 98.00 13
CANALIZACION 2 1.01 99.01 14
ORGANIZACION COMUNAL 1 0.51 99.52 15
PROCESOS INDUSTRIALES 1 0.51 100.03 16
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Las primeras 4 tipologías concentran el 62.6% de todos los nudos críticos

Nota: La tabla muestra la distribución absoluta y relativa de las tipologías CFG según el número de proyectos asociados.

5.2 Tabla 4.2: Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas

Tabla 4.2: Distribución de Frecuencias de Tipologías CFG por Número de Comunas Afectadas
Distribución Territorial
Tipología CFG N° Comunas Porcentaje (%) % Acumulado Ranking
MANEJO INTEGRAL DEL AGUA 43 23.63 23.63 1
VIALIDAD 27 14.84 38.47 2
VIVIENDA 21 11.54 50.01 3
ELECTRICIDAD 18 9.89 59.90 4
SALUD 14 7.69 67.59 5
INFRAESTRUCTURA 11 6.04 73.63 6
AMBIENTE 10 5.49 79.12 7
EDUCACIÓN 9 4.95 84.07 8
TRANSPORTE 7 3.85 87.92 9
TELECOMUNICACIONES 6 3.30 91.22 10
MUROS 5 2.75 93.97 11
SOCIO PRODUCTIVO 4 2.20 96.17 12
SEGURIDAD 3 1.65 97.82 13
CANALIZACION 2 1.10 98.92 14
ORGANIZACION COMUNAL 1 0.55 99.47 15
PROCESOS INDUSTRIALES 1 0.55 100.02 16
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Una comuna puede tener múltiples tipologías, pero se cuenta una sola vez por tipología

Nota: Esta tabla representa la distribución territorial de las tipologías, contabilizando cuántas comunas están afectadas por cada tipo de nudo crítico.

5.3 Tabla 4.3: Análisis Comparativo CFG - Proyectos vs Comunas Afectadas

Tabla 4.3: Análisis Comparativo CFG - Proyectos vs Comunas Afectadas
Por Proyectos
Por Comunas
Indicador
Rank Tipología CFG N° Proy. % Proy. N° Com. % Com. Intensidad
1 MANEJO INTEGRAL DEL AGUA 54 27.27 43 23.63 1.26
2 VIALIDAD 30 15.15 27 14.84 1.11
3 VIVIENDA 21 10.61 21 11.54 1.00
4 ELECTRICIDAD 19 9.60 18 9.89 1.06
5 SALUD 14 7.07 14 7.69 1.00
6 INFRAESTRUCTURA 12 6.06 11 6.04 1.09
7 AMBIENTE 10 5.05 10 5.49 1.00
8 EDUCACIÓN 9 4.55 9 4.95 1.00
9 TRANSPORTE 7 3.54 7 3.85 1.00
10 TELECOMUNICACIONES 6 3.03 6 3.30 1.00
11 MUROS 5 2.53 5 2.75 1.00
12 SOCIO PRODUCTIVO 4 2.02 4 2.20 1.00
13 SEGURIDAD 3 1.52 3 1.65 1.00
14 CANALIZACION 2 1.01 2 1.10 1.00
15 ORGANIZACION COMUNAL 1 0.51 1 0.55 1.00
16 PROCESOS INDUSTRIALES 1 0.51 1 0.55 1.00
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por tipología)

Nota: El indicador de intensidad (proyectos/comuna) permite identificar tipologías con mayor concentración de problemas por territorio.

5.4 Tabla 4.4: Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas

Tabla 4.4: Resumen Ejecutivo - Top 10 Tipologías CFG Más Críticas
Análisis por Proyectos
Por Comunas
Pos. Nivel Tipología CFG Proy. % % Acum. Com. % Com.
1 🔴 Crítico MANEJO INTEGRAL DEL AGUA 54 27.3 27.3 43 72.9
2 🔴 Crítico VIALIDAD 30 15.2 42.5 27 45.8
3 🔴 Crítico VIVIENDA 21 10.6 53.1 21 35.6
4 🟡 Alto ELECTRICIDAD 19 9.6 62.7 18 30.5
5 🟡 Alto SALUD 14 7.1 69.8 14 23.7
6 🟡 Alto INFRAESTRUCTURA 12 6.1 75.9 11 18.6
7 🟡 Alto AMBIENTE 10 5.1 81.0 10 16.9
8 🟢 Medio EDUCACIÓN 9 4.5 85.5 9 15.3
9 🟢 Medio TRANSPORTE 7 3.5 89.0 7 11.9
10 🟢 Medio TELECOMUNICACIONES 6 3.0 92.0 6 10.2
Nota: Total analizado: 198 proyectos en 59 comunas. El Top 10 concentra el 92% de todos los nudos críticos.

Nota: Clasificación por nivel de criticidad basado en la frecuencia de aparición y distribución territorial.

6 Exportación de Datos para Análisis Adicional

7 Resumen Interpretativo del Análisis CFG

Los resultados muestran que las tipologías CFG presentan distribuciones heterogéneas tanto en frecuencia de proyectos como en alcance territorial. Las primeras cuatro tipologías concentran más del 60% de los nudos críticos identificados, indicando áreas prioritarias para la intervención.

Para complementar el análisis global, identificamos la tipología más frecuente en cada comuna. Esto nos permite ver si el patrón global se replica localmente o si existen particularidades territoriales.

Al igual que con las tipologías CFG, calculamos la frecuencia absoluta y relativa de las categorías de gobernación. Esto nos permite identificar qué actores institucionales son más relevantes en la gestión de los proyectos.

##Frecuencias de gobernación

#----------------------------Resumen Gobernación por Comuna----------------------
## Análisis para Gobernación ----
# Conteo y proporciones globales por Tipologia de Gobernación
freq_gob <- df_dummies %>%
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n") %>%
  arrange(desc(n)) %>%
  mutate(pct = n / sum(n) * 100)


#  Gráfico de barras (Top 10) de gobernación por proyectos
freq_gob %>%
  slice(1:10) %>%
  ggplot(aes(x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, n),
             y = n)) +
    geom_col(fill = "darkred") +
    coord_flip() +
    labs(
      title = "Top 10 categorías de Gobernación más frecuentes",
      x     = "Categoría de Gobernación",
      y     = "Número de proyectos"
    ) +
    theme_minimal()

# Frecuencia absoluta y relativa por comuna
freq_gob_comuna <- df_dummies %>%
  distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%  
  count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
  arrange(desc(n_comunas)) %>%
  mutate(
    pct_comunas = n_comunas / sum(n_comunas) * 100,
    cum_pct     = cumsum(pct_comunas)
  )


#----------------------------Gráfico de top 10 por comuna---------------------------
freq_gob_comuna %>%
  slice(1:10) %>%
  ggplot(aes(
    x = reorder(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, n_comunas),
    y = n_comunas
  )) +
  geom_col(fill = "darkred") +
  coord_flip() +
  labs(
    title = "Top 10 categorías de Gobernación por número de comunas",
    x     = "Categoría de Gobernación",
    y     = "Número de comunas"
  ) +
  theme_minimal()

# ------------------------Global - Proyectos-------------------------------------------
gob_global_proyectos <- analizar_frecuencia(
  df_raw,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
  "darkred", "gold",
  "Frecuencia global de categorías de Gobernación (Proyectos)",
  "proyectos"
)

# -------------------------Global - Comunas--------------------------------------------
gob_global_comunas <- analizar_frecuencia_comuna(
  df_raw,
  CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
  "darkred", "gold",
  "Frecuencia de categorías de Gobernación por comuna"
)

#----------------------Grafico de frecuencias de categorías de Gobernación-------------
print(gob_global_proyectos$plot)

#----Grafico Frecuencia absoluta y relativa de comunas por categoría de Gobernación----
print(gob_global_comunas$plot)

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS GOBERNACIÓN POR PROYECTOS
# ==============================================================================
crear_tabla_gob_proyectos <- function(data) {
  
  # Calcular frecuencias
  tabla_gob <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_proyectos") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      porcentaje = round(n_proyectos / sum(n_proyectos) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Proyectos" = n_proyectos,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada con kableExtra
  tabla_final <- tabla_gob %>%
    kable(
      caption = "Tabla 5.1: Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#ffebee") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Frecuencias Absolutas y Relativas" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Las primeras 4 categorías concentran el 51.5% de todos los proyectos"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_gob, tabla = tabla_final))
}

# ==============================================================================
#  TABLA COMPLETA DE FRECUENCIAS GOBERNACIÓN POR COMUNAS
# ==============================================================================
crear_tabla_gob_comunas <- function(data) {
  
  # Calcular frecuencias por comuna (sin repetir comunas)
  tabla_gob_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
    arrange(desc(n_comunas)) %>%
    mutate(
      porcentaje = round(n_comunas / sum(n_comunas) * 100, 2),
      pct_acumulado = round(cumsum(porcentaje), 2),
      ranking = row_number()
    ) %>%
    rename(
      "Ranking" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Comunas" = n_comunas,
      "Porcentaje (%)" = porcentaje,
      "% Acumulado" = pct_acumulado
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_gob_comunas %>%
    kable(
      caption = "Tabla 5.2: Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas",
      align = c("c", "l", "c", "c", "c"),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 12
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000") %>%
    column_spec(2, width = "20em") %>%
    column_spec(3:5, width = "8em") %>%
    row_spec(1:4, background = "#ffebee") %>%  # Resaltar top 4
    add_header_above(c(" " = 2, "Distribución Territorial" = 3)) %>%
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Nota: Una comuna puede tener múltiples categorías, pero se cuenta una sola vez por categoría"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_gob_comunas, tabla = tabla_final))
}

# ==============================================================================
# TABLA COMPARATIVA GOBERNACIÓN: PROYECTOS VS COMUNAS
# ==============================================================================
crear_tabla_comparativa_gob <- function(data) {
  
  # Datos por proyectos
  gob_proyectos <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_proyectos") %>%
    mutate(pct_proyectos = round(n_proyectos / sum(n_proyectos) * 100, 2))
  
  # Datos por comunas
  gob_comunas <- data %>%
    distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "n_comunas") %>%
    mutate(pct_comunas = round(n_comunas / sum(n_comunas) * 100, 2))
  
  # Unir ambas tablas
  tabla_comparativa <- gob_proyectos %>%
    inner_join(gob_comunas, by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION") %>%
    arrange(desc(n_proyectos)) %>%
    mutate(
      ranking = row_number(),
      intensidad = round(n_proyectos / n_comunas, 2)  # Proyectos por comuna promedio
    ) %>%
    select(
      ranking,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      n_proyectos, pct_proyectos,
      n_comunas, pct_comunas,
      intensidad
    ) %>%
    rename(
      "Rank" = ranking,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "N° Proy." = n_proyectos,
      "% Proy." = pct_proyectos,
      "N° Com." = n_comunas,
      "% Com." = pct_comunas,
      "Intensidad" = intensidad
    )
  
  # Crear tabla formateada
  tabla_final <- tabla_comparativa %>%
    kable(
      caption = "Tabla 5.3: Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas",
      align = c("c", "l", rep("c", 5)),
      format = "html",
      digits = 2
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, color = "white", background = "#8B0000", width = "3em") %>%
    column_spec(2, width = "15em") %>%
    column_spec(3:7, width = "6em") %>%
    add_header_above(c(" " = 2, "Por Proyectos" = 2, "Por Comunas" = 2, "Indicador" = 1)) %>%
    row_spec(1:3, background = "#ffcdd2") %>%  # Top 3 en rojo suave
    row_spec(4:7, background = "#ffecb3") %>%  # Siguientes 4 en amarillo suave
    footnote(
      general = c(
        "Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025",
        "Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por categoría)"
      ),
      general_title = "",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = tabla_comparativa, tabla = tabla_final))
}

# ==============================================================================
#  TABLA RESUMEN EJECUTIVO GOBERNACIÓN (TOP 10)
# ==============================================================================
crear_tabla_resumen_gob <- function(data) {
  
  # Calcular estadísticas resumidas
  total_proyectos <- nrow(data)
  total_comunas <- n_distinct(data$ID_COMUNA)
  
  resumen_gob <- data %>%
    count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "proyectos") %>%
    arrange(desc(proyectos)) %>%
    slice(1:10) %>%  # Solo top 10
    mutate(
      pct_proyectos = round(proyectos / total_proyectos * 100, 1),
      pct_acum = round(cumsum(pct_proyectos), 1)
    ) %>%
    # Agregar datos de comunas
    left_join(
      data %>%
        distinct(ID_COMUNA, CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>%
        count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION, name = "comunas"),
      by = "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION"
    ) %>%
    mutate(
      pct_comunas = round(comunas / total_comunas * 100, 1),
      posicion = row_number(),
      categoria = case_when(
        posicion <= 3 ~ "🔴 Crítico",
        posicion <= 7 ~ "🟡 Alto",
        TRUE ~ "🟢 Medio"
      )
    ) %>%
    select(
      posicion, categoria,
      CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      proyectos, pct_proyectos, pct_acum,
      comunas, pct_comunas
    ) %>%
    rename(
      "Pos." = posicion,
      "Nivel" = categoria,
      "Categoría Gobernación" = CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION,
      "Proy." = proyectos,
      "%" = pct_proyectos,
      "% Acum." = pct_acum,
      "Com." = comunas,
      "% Com." = pct_comunas
    )
  
  # Crear tabla formateada
  tabla_final <- resumen_gob %>%
    kable(
      caption = "Tabla 5.4: Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas",
      align = c("c", "c", "l", rep("c", 5)),
      format = "html"
    ) %>%
    kable_styling(
      bootstrap_options = c("striped", "hover", "condensed", "responsive"),
      full_width = FALSE,
      position = "center",
      font_size = 11
    ) %>%
    column_spec(1, bold = TRUE, width = "3em") %>%
    column_spec(2, width = "8em") %>%
    column_spec(3, width = "15em") %>%
    column_spec(4:8, width = "5em") %>%
    add_header_above(c(" " = 3, "Análisis por Proyectos" = 3, "Por Comunas" = 2)) %>%
    footnote(
      general = paste0(
        "Total analizado: ", total_proyectos, " proyectos en ", total_comunas, " comunas. ",
        "El Top 10 concentra el ", round(sum(resumen_gob$`%`), 1), "% de todos los proyectos."
      ),
      general_title = "Nota:",
      footnote_as_chunk = TRUE
    )
  
  return(list(datos = resumen_gob, tabla = tabla_final))
}

8 Análisis de Categorías de Gobernación: Tablas Descriptivas

En esta sección presentamos el análisis detallado de las categorías de gobernación mediante tablas descriptivas que permiten visualizar la distribución, frecuencia e impacto territorial de los nudos críticos identificados.

8.1 Tabla 5.1: Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos

Tabla 5.1: Distribución de Frecuencias de Categorías de Gobernación por Número de Proyectos
Frecuencias Absolutas y Relativas
Categoría Gobernación N° Proyectos Porcentaje (%) % Acumulado Ranking
AGUA POTABLE 28 14.14 14.14 1
VIVIENDA 23 11.62 25.76 2
ELECTRICIDAD 19 9.60 35.36 3
VIALIDAD 18 9.09 44.45 4
EQUIPAMIENTO SALUD 14 7.07 51.52 5
AGUA RESIDUAL 13 6.57 58.09 6
DRENAJES 13 6.57 64.66 7
EQUIPAMIENTO EDUCATIVO 12 6.06 70.72 8
CANALIZACION 10 5.05 75.77 9
TRANSPORTE 8 4.04 79.81 10
VIALIDAD AGRICOLA 8 4.04 83.85 11
TELECOMUNICACIONES 6 3.03 86.88 12
INFRAESTRUCTURA 5 2.53 89.41 13
MUROS 5 2.53 91.94 14
SOCIO PRODUCTIVO 4 2.02 93.96 15
EQUIPAMIENTO SEGURIDAD 3 1.52 95.48 16
PUENTE 3 1.52 97.00 17
SISTEMAS DE RIEGO 3 1.52 98.52 18
AGUA 1 0.51 99.03 19
GAS 1 0.51 99.54 20
ORGANIZACION COMUNAL 1 0.51 100.05 21
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Las primeras 4 categorías concentran el 51.5% de todos los proyectos

Nota: La tabla muestra la distribución absoluta y relativa de las categorías de gobernación según el número de proyectos asociados.

8.2 Tabla 5.2: Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas

Tabla 5.2: Distribución de Frecuencias de Categorías de Gobernación por Número de Comunas Afectadas
Distribución Territorial
Categoría Gobernación N° Comunas Porcentaje (%) % Acumulado Ranking
AGUA POTABLE 26 13.54 13.54 1
VIVIENDA 22 11.46 25.00 2
ELECTRICIDAD 18 9.38 34.38 3
VIALIDAD 17 8.85 43.23 4
EQUIPAMIENTO SALUD 14 7.29 50.52 5
DRENAJES 13 6.77 57.29 6
AGUA RESIDUAL 12 6.25 63.54 7
EQUIPAMIENTO EDUCATIVO 12 6.25 69.79 8
CANALIZACION 10 5.21 75.00 9
TRANSPORTE 8 4.17 79.17 10
VIALIDAD AGRICOLA 8 4.17 83.34 11
TELECOMUNICACIONES 6 3.12 86.46 12
INFRAESTRUCTURA 5 2.60 89.06 13
MUROS 5 2.60 91.66 14
SOCIO PRODUCTIVO 4 2.08 93.74 15
EQUIPAMIENTO SEGURIDAD 3 1.56 95.30 16
PUENTE 3 1.56 96.86 17
SISTEMAS DE RIEGO 3 1.56 98.42 18
AGUA 1 0.52 98.94 19
GAS 1 0.52 99.46 20
ORGANIZACION COMUNAL 1 0.52 99.98 21
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Nota: Una comuna puede tener múltiples categorías, pero se cuenta una sola vez por categoría

Nota: Esta tabla representa la distribución territorial de las categorías de gobernación, contabilizando cuántas comunas están afectadas por cada tipo de nudo crítico.

8.3 Tabla 5.3: Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas

Tabla 5.3: Análisis Comparativo Gobernación - Proyectos vs Comunas Afectadas
Por Proyectos
Por Comunas
Indicador
Rank Categoría Gobernación N° Proy. % Proy. N° Com. % Com. Intensidad
1 AGUA POTABLE 28 14.14 26 13.54 1.08
2 VIVIENDA 23 11.62 22 11.46 1.05
3 ELECTRICIDAD 19 9.60 18 9.38 1.06
4 VIALIDAD 18 9.09 17 8.85 1.06
5 EQUIPAMIENTO SALUD 14 7.07 14 7.29 1.00
6 AGUA RESIDUAL 13 6.57 12 6.25 1.08
7 DRENAJES 13 6.57 13 6.77 1.00
8 EQUIPAMIENTO EDUCATIVO 12 6.06 12 6.25 1.00
9 CANALIZACION 10 5.05 10 5.21 1.00
10 TRANSPORTE 8 4.04 8 4.17 1.00
11 VIALIDAD AGRICOLA 8 4.04 8 4.17 1.00
12 TELECOMUNICACIONES 6 3.03 6 3.12 1.00
13 INFRAESTRUCTURA 5 2.53 5 2.60 1.00
14 MUROS 5 2.53 5 2.60 1.00
15 SOCIO PRODUCTIVO 4 2.02 4 2.08 1.00
16 EQUIPAMIENTO SEGURIDAD 3 1.52 3 1.56 1.00
17 PUENTE 3 1.52 3 1.56 1.00
18 SISTEMAS DE RIEGO 3 1.52 3 1.56 1.00
19 AGUA 1 0.51 1 0.52 1.00
20 GAS 1 0.51 1 0.52 1.00
21 ORGANIZACION COMUNAL 1 0.51 1 0.52 1.00
Fuente: Elaboración propia basada en datos del Estado Mérida 2019-2025 Intensidad = N° Proyectos / N° Comunas (promedio de proyectos por comuna por categoría)

Nota: El indicador de intensidad (proyectos/comuna) permite identificar categorías con mayor concentración de problemas por territorio.

8.4 Tabla 5.4: Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas

Tabla 5.4: Resumen Ejecutivo - Top 10 Categorías de Gobernación Más Críticas
Análisis por Proyectos
Por Comunas
Pos. Nivel Categoría Gobernación Proy. % % Acum. Com. % Com.
1 🔴 Crítico AGUA POTABLE 28 14.1 14.1 26 44.1
2 🔴 Crítico VIVIENDA 23 11.6 25.7 22 37.3
3 🔴 Crítico ELECTRICIDAD 19 9.6 35.3 18 30.5
4 🟡 Alto VIALIDAD 18 9.1 44.4 17 28.8
5 🟡 Alto EQUIPAMIENTO SALUD 14 7.1 51.5 14 23.7
6 🟡 Alto AGUA RESIDUAL 13 6.6 58.1 12 20.3
7 🟡 Alto DRENAJES 13 6.6 64.7 13 22.0
8 🟢 Medio EQUIPAMIENTO EDUCATIVO 12 6.1 70.8 12 20.3
9 🟢 Medio CANALIZACION 10 5.1 75.9 10 16.9
10 🟢 Medio TRANSPORTE 8 4.0 79.9 8 13.6
Nota: Total analizado: 198 proyectos en 59 comunas. El Top 10 concentra el 79.9% de todos los proyectos.

Nota: Clasificación por nivel de criticidad basado en la frecuencia de aparición y distribución territorial.

9 Gráficos Adicionales de Distribución de Proyectos

10 Exportación de Datos de Gobernación

11 Resumen Interpretativo del Análisis de Gobernación

Los resultados muestran que las categorías de gobernación presentan distribuciones heterogéneas tanto en frecuencia de proyectos como en alcance territorial. Las primeras cuatro categorías concentran más del 50% de los proyectos, indicando áreas prioritarias para la intervención.

12 Desarrollamos indice Shannon y Pielou

13 Indice Shannon y Pielou por Comunas y Tipología CFG y de Gobernación

#--------------------------Crear mapeo único de ID_COMUNA a COMUNA-----------------------------
commune_map <- df_raw %>%
  distinct(ID_COMUNA, COMUNA) %>%
  mutate(COMUNA = str_trim(COMUNA))  # Limpiar espacios extras

## Detectar dinámicamente las columnas dummy
cfg_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", 
                 names(df_dummies), value = TRUE)
gob_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", 
                 names(df_dummies), value = TRUE)

## Calcular diversidad para las Tipología CFG con nombres de comunas
div_cfg <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(cfg_cols), sum, na.rm = TRUE)
  ) %>%
  ungroup() %>%
  # Agregar nombres de comunas
  left_join(commune_map, by = "ID_COMUNA") %>%
  # Calcular índices de diversidad
  {
    cnts <- select(., all_of(cfg_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  }
## Warning: There was 1 warning in `summarise()`.
## ℹ In argument: `across(all_of(cfg_cols), sum, na.rm = TRUE)`.
## ℹ In group 1: `ID_COMUNA = "140101-C-MIX-2018-11-0147"`.
## Caused by warning:
## ! The `...` argument of `across()` is deprecated as of dplyr 1.1.0.
## Supply arguments directly to `.fns` through an anonymous function instead.
## 
##   # Previously
##   across(a:b, mean, na.rm = TRUE)
## 
##   # Now
##   across(a:b, \(x) mean(x, na.rm = TRUE))
# Crear columna combinada para mostrar en tablas
div_cfg <- div_cfg %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

# Tabla: Top 10 comunas más diversas (con ID y nombre)
top10_cfg <- div_cfg %>%
  arrange(desc(H_shannon)) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, H_shannon, pielou, n_proyectos)

# Tabla: Top 10 comunas menos diversas (con ID y nombre)
bottom10_cfg <- div_cfg %>%
  arrange(H_shannon) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, H_shannon, pielou, n_proyectos)

# Mostrar tablas en formato kable para Tipología CFG
cat("\n\n**10 comunas con mayor diversidad (Shannon_CFG)**\n")
## 
## 
## **10 comunas con mayor diversidad (Shannon_CFG)**
knitr::kable(top10_cfg, 
             col.names = c("Comuna (ID - Nombre)", "H_CFG (Shannon)", "J_CFG (Pielou)", "N° Proyectos"),
             digits = 3,
             caption = "Top 10 comunas con mayor índice de Shannon para CFG")
Top 10 comunas con mayor índice de Shannon para CFG
Comuna (ID - Nombre) H_CFG (Shannon) J_CFG (Pielou) N° Proyectos
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 1.831 0.941 9
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 1.792 1.000 6
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 1.609 1.000 5
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 1.609 1.000 5
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 1.561 0.970 6
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 1.330 0.959 6
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 1.330 0.959 6
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 1.099 1.000 3
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 1.099 1.000 3
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 1.099 1.000 3
cat("\n\n**10 comunas con menor diversidad (Shannon_CFG)**\n")
## 
## 
## **10 comunas con menor diversidad (Shannon_CFG)**
knitr::kable(bottom10_cfg,
             col.names = c("Comuna (ID - Nombre)", "H_CFG (Shannon)", "J_CFG (Pielou)", "N° Proyectos"),
             digits = 3,
             caption = "Top 10 comunas con menor índice de Shannon para CFG")
Top 10 comunas con menor índice de Shannon para CFG
Comuna (ID - Nombre) H_CFG (Shannon) J_CFG (Pielou) N° Proyectos
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 0.637 0.918 3
140103-14-01-0005 - 19. COMUNA El PASO DE LOS ANDES 0.637 0.918 3
140602-C-MIX-2021-05-0007 - COMUNA SU LEGADO ES NUESTRA FORTALEZA SIMON PABLO FIGUEROA. 0.637 0.918 3
140605-14-06-0001 - 20. COMUNA LOMAS UNIDAS MACHO CAPAZ 0.637 0.918 3
140606-C-RUR-2021-03-0002 - COMUNA IGNACIO FERNÁNDEZ PEÑA 0.637 0.918 3
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 0.637 0.918 3
142102-C-MIX-2021-10-0011 - COMUNA LOS IDEALES DE CHÁVEZ 0.637 0.918 3
142104-14-21-0002 - COMUNA PATRIA NUEVA. 0.637 0.918 3
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 0.693 1.000 2
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 0.868 0.790 6
## Preparar datos para gráfico consolidado para CFG
tabla_extremos_cfg <- bind_rows(
  top10_cfg  %>% mutate(tipo = "Top 10 ↑") %>% rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_cfg %>% mutate(tipo = "Top 10 ↓") %>% rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  # Crear etiqueta ordenada por H_shannon
  mutate(COMUNA_ORD = reorder(COMUNA, H_shannon))

#---------------Gráfico: Shannon (barras) + Pielou (línea) para CFG------------------------#
maxH <- max(tabla_extremos_cfg$H_shannon)

# Ajustar el gráfico con dimensiones específicas
cfg_plot <- ggplot(tabla_extremos_cfg, aes(x = COMUNA_ORD, y = H_shannon, fill = tipo)) +
  geom_line(aes(y = pielou * maxH, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH), 
             color = "#D55E00", size = 2.5, shape = 18) +
  # Etiquetas de Pielou desplazadas a la derecha
  geom_text(aes(y = pielou * maxH, label = sprintf("J=%.2f", pielou)),
            hjust = -0.3, size = 2.5, color = "#D55E00") +  # Ajustado hjust

  geom_col(width = 0.7, alpha = 0.9) +
  geom_text(aes(y = H_shannon, label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.1, size = 2.8, color = "white", fontface = "bold") +  # Tamaño ajustado
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH * 1.15), 
    sec.axis = sec_axis(~ . / maxH, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.1))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad de Tipologías CFG por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 10) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.title.y = element_text(margin = margin(r = 10)),
    axis.title.x = element_text(margin = margin(t = 10)),
    axis.text.y = element_text(size = 8),  # Reducir tamaño texto eje Y
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(1, 2, 1, 1, "cm")  # Aumentar margen derecho
  )

# Guardar con dimensiones específicas
ggsave("cfg_diversity_plot.png", cfg_plot, width = 14, height = 10, dpi = 300)
print(cfg_plot)

## Calcular diversidad para Tipología de Gobernación con nombres
div_gob <- df_dummies %>%
  group_by(ID_COMUNA) %>%
  summarise(
    n_proyectos = n(),
    across(all_of(gob_cols), sum, na.rm = TRUE)
  ) %>%
  ungroup() %>%
  # Agregar nombres de comunas
  left_join(commune_map, by = "ID_COMUNA") %>%
  # Calcular índices de diversidad
  {
    cnts <- select(., all_of(gob_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  }

# Crear columna combinada para mostrar en tablas
div_gob <- div_gob %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

## Mostrar tablas con nombres
top10_gob <- div_gob %>% 
  arrange(desc(H_shannon)) %>% 
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou)

bottom10_gob <- div_gob %>% 
  arrange(H_shannon) %>% 
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou)

cat("\n\n**Top 10 comunas con mayor diversidad (Shannon) de Gobernación**\n")
## 
## 
## **Top 10 comunas con mayor diversidad (Shannon) de Gobernación**
knitr::kable(top10_gob,
             col.names = c("Comuna (ID - Nombre)", "N° Proyectos", "H_GOB (Shannon)", "J_GOB (Pielou)"),
             digits = 3, 
             caption = "Top 10 comunas con mayor índice de Shannon para Gobernación")
Top 10 comunas con mayor índice de Shannon para Gobernación
Comuna (ID - Nombre) N° Proyectos H_GOB (Shannon) J_GOB (Pielou)
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 9 2.197 1.000
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 6 1.792 1.000
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 5 1.609 1.000
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 5 1.609 1.000
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 6 1.561 0.970
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 6 1.561 0.970
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 6 1.330 0.959
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 6 1.330 0.959
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 1.099 1.000
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 1.099 1.000
cat("\n\n**Top 10 comunas con menor diversidad (Shannon) de Gobernación**\n")
## 
## 
## **Top 10 comunas con menor diversidad (Shannon) de Gobernación**
knitr::kable(bottom10_gob,
             col.names = c("Comuna (ID - Nombre)", "N° Proyectos", "H_GOB (Shannon)", "J_GOB (Pielou)"),
             digits = 3, 
             caption = "Top 10 comunas con menor índice de Shannon para Gobernación")
Top 10 comunas con menor índice de Shannon para Gobernación
Comuna (ID - Nombre) N° Proyectos H_GOB (Shannon) J_GOB (Pielou)
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 3 0.637 0.918
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 3 0.637 0.918
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 2 0.693 1.000
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 1.099 1.000
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 1.099 1.000
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 3 1.099 1.000
140102-14-01-0006 - COMUNA SOCIALISTA EZEQUIEL ZAMORA 3 1.099 1.000
140102-14-01-2007 - COMUNA SIMON BOLÍVAR. 3 1.099 1.000
140102-C-MIX-2018-11-0019 - COMUNA PRESIDENTE OBRERO 3 1.099 1.000
140102-C-MIX-2018-11-0084 - COMUNA LUZ DEL ALBA 3 1.099 1.000
## Preparar datos para gráfico de Gobernación
tabla_extremos_gob <- bind_rows(
  top10_gob %>% mutate(tipo = "Top 10 ↑") %>% rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_gob %>% mutate(tipo = "Top 10 ↓") %>% rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  # Crear etiqueta ordenada por H_shannon
  mutate(COMUNA_ORD = reorder(COMUNA, H_shannon))


#-------------------------Gráfica de tipología de gobernación-----------------------------#
maxH_gob <- max(tabla_extremos_gob$H_shannon)

gob_plot <- ggplot(tabla_extremos_gob, aes(x = COMUNA_ORD, y = H_shannon, fill = tipo)) +
  geom_line(aes(y = pielou * maxH_gob, group = 1), 
            color = "#E69F00", size = 1.0, linetype = "dashed") +
  geom_point(aes(y = pielou * maxH_gob), 
             color = "#D55E00", size = 2.5, shape = 18) +
  # Etiquetas de Pielou desplazadas a la derecha
  geom_text(aes(y = pielou * maxH_gob, label = sprintf("J=%.2f", pielou)),
            hjust = -0.2, size = 2.5, color = "#D55E00") +
  # Luego dibujar las barras de Shannon
  geom_col(width = 0.7, alpha = 0.9) +
  geom_text(aes(y = H_shannon, label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon))),
            hjust = 1.1, size = 2.8, color = "white", fontface = "bold") +
  facet_wrap(~ tipo, scales = "free_y", ncol = 1) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    limits = c(0, maxH_gob * 1.15),
    sec.axis = sec_axis(~ . / maxH_gob, name = "Índice de Pielou (J)",
                        labels = scales::number_format(accuracy = 0.1))
  ) +
  scale_fill_manual(values = c("Top 10 ↑" = "#56B4E9", "Top 10 ↓" = "#CC79A7")) +
  labs(
    title = "Diversidad Institucional (Gobernación) por Comuna",
    subtitle = "Top 10 comunas con mayor y menor diversidad | Barras: Shannon (H) | Línea: Pielou (J)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia datos de proyectos ACA - William Gutierrez"
  ) +
  theme_minimal(base_size = 10) +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 10, color = "gray40", hjust = 0.5),
    axis.title.y = element_text(margin = margin(r = 10)),
    axis.title.x = element_text(margin = margin(t = 10)),
    axis.text.y = element_text(size = 8),  # Reducir tamaño texto eje Y
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11),
    legend.position = "none",
    plot.margin = margin(1, 2, 1, 1, "cm")  # Aumentar margen derecho
  )

# Guardar con dimensiones específicas
ggsave("gob_diversity_plot.png", gob_plot, width = 14, height = 10, dpi = 300)
print(gob_plot)

14 Indice Shannon de ratio de proyecto por tipologías

## **Indice Shannon de ratio de proyecto por tipologías**

# Filtrar y preparar datos para Ratio
df_ratio_clean <- df_raw %>% 
  filter(!is.na(RATIO_ACA_PROYECTO_CULMINADO)) %>%  
  mutate(
    RATIO_ACA_PROYECTO_CULMINADO = factor(
      RATIO_ACA_PROYECTO_CULMINADO,
      levels = 1:4,
      labels = c("MUY BAJA", "BAJA", "MEDIA", "ALTA")
    )
  )

# Crear datos wide para diversidad
df_ratio_wide <- df_ratio_clean %>%
  group_by(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO) %>%
  summarise(n = n(), .groups = "drop") %>%
  complete(ID_COMUNA, RATIO_ACA_PROYECTO_CULMINADO, fill = list(n = 0)) %>%
  pivot_wider(
    names_from = RATIO_ACA_PROYECTO_CULMINADO, 
    values_from = n, 
    names_prefix = "ratio_"
  )

# Asegurar que todas las columnas de ratio existan
ratio_cols <- c("ratio_MUY BAJA", "ratio_BAJA", "ratio_MEDIA", "ratio_ALTA")
for (col in ratio_cols) {
  if (!col %in% names(df_ratio_wide)) {
    df_ratio_wide[[col]] <- 0
  }
}

# Calcular diversidad para Ratio
div_ratio <- df_ratio_wide %>%
  left_join(commune_map, by = "ID_COMUNA") %>%
  mutate(n_proyectos_ratio = rowSums(select(., all_of(ratio_cols)))) %>%
  {
    cnts <- select(., all_of(ratio_cols))
    tib <- select(., ID_COMUNA, COMUNA, n_proyectos_ratio)
    H <- vegan::diversity(cnts, index = "shannon")
    richesse <- rowSums(cnts > 0)
    J <- ifelse(richesse > 0, H / log(richesse), NA_real_)
    bind_cols(tib, H_shannon = H, pielou = J)
  } %>%
  mutate(COMUNA_ID_NOMBRE = paste(ID_COMUNA, "-", COMUNA))

# Crear top y bottom 10
top10_ratio <- div_ratio %>%
  arrange(desc(H_shannon)) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou)

bottom10_ratio <- div_ratio %>%
  arrange(H_shannon) %>%
  slice(1:10) %>%
  select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou)

# Preparar datos para gráfico
tabla_extremos_ratio <- bind_rows(
  top10_ratio %>% 
    mutate(tipo = "Mayor diversidad (Top 10)") %>% 
    rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_ratio %>% 
    mutate(tipo = "Menor diversidad (Bottom 10)") %>% 
    rename(COMUNA = COMUNA_ID_NOMBRE)
) %>%
  mutate(
    etiqueta_H = sprintf("H: %.2f", H_shannon),
    etiqueta_J = sprintf("J: %.2f", pielou)
  )
## Tabla completa (Todas las comunas)
div_ratio_completo <- div_ratio %>%
  select(COMUNA_ID_NOMBRE, n_proyectos_ratio, H_shannon, pielou) %>%
  arrange(desc(H_shannon)) %>%
  mutate(
    H_shannon = round(H_shannon, 3),
    pielou = round(pielou, 3),
    # Interpretación rápida
    Interpretacion = case_when(
      H_shannon < 0.5 ~ "Baja diversidad",
      H_shannon >= 0.5 & H_shannon < 1.0 ~ "Diversidad media",
      H_shannon >= 1.0 ~ "Alta diversidad"
    )
  )

# Mostrar tabla completa ordenada por diversidad
cat("\n\n**Diversidad de Ratio ACA en todas las comunas**\n")
## 
## 
## **Diversidad de Ratio ACA en todas las comunas**
knitr::kable(
  div_ratio_completo,
  col.names = c("Comuna (ID - Nombre)", "Proyectos", "H (Shannon)", "J (Pielou)", "Interpretación"),
  digits = 3,
  caption = "Diversidad de estados de culminación en todas las comunas"
)
Diversidad de estados de culminación en todas las comunas
Comuna (ID - Nombre) Proyectos H (Shannon) J (Pielou) Interpretación
141212-C-MIX-2016-02-0018 - 26. Comuna Prócer José Félix Ribas 9 1.311 0.946 Alta diversidad
140101-C-RUR-2018-11-0019 - 12. COMUNA MANUELITA SÁENZ 3 1.099 1.000 Alta diversidad
140102-C-MIX-2018-11-0019 - COMUNA PRESIDENTE OBRERO 3 1.099 1.000 Alta diversidad
140103-14-01-0002 - COMUNA AGRARIA SOCIALISTA GUACHARE 3 1.099 1.000 Alta diversidad
140103-14-01-0005 - 19. COMUNA El PASO DE LOS ANDES 3 1.099 1.000 Alta diversidad
140301-C-MIX-2018-02-0043 - 28. Comuna Socialista Agroindustrial de Paiva 3 1.099 1.000 Alta diversidad
140301-C-RUR-2021-10-0022 - COMUNA AGROTURÍSTICA LA NEBLINA DE SALINAS 3 1.099 1.000 Alta diversidad
140802-C-MIX-2018-02-0019 - COMUNA CARRIZALES UNIDOS 3 1.099 1.000 Alta diversidad
141207-C-MIX-2015-11-0005 - COMUNA SAN JACINTO ABRIENDO BRECHA 3 1.099 1.000 Alta diversidad
141601-C-RUR-2018-11-0024 - COMUNA PRODUCTIVA AMANECER CAMPESINO 3 1.099 1.000 Alta diversidad
141601-C-RUR-2018-11-0027 - COMUNA LA PIEDRA QUE CRECE EN REVOLUCIÓN 3 1.099 1.000 Alta diversidad
141901-C-MIX-2018-06-0007 - 15. COMUNA ECOSOCIALISTA, AGROTURÍSTICA Y CULTURAL MUCUY 3 1.099 1.000 Alta diversidad
142104-14-21-0002 - COMUNA PATRIA NUEVA. 3 1.099 1.000 Alta diversidad
141203-CEC-ME-025 - 18. PARROQUIA CARACCIOLO PARRA PÉREZ - COMUNA EN CONSTRUCCIÓN LAS HEROÍNAS DE MERIDA 5 1.055 0.960 Alta diversidad
141206-C-MIX-2018-11-0158 - COMUNA EN CONSTRUCCIÓN MUCUJÚN 6 1.011 0.921 Alta diversidad
141701-C-RUR-2018-11-0003 - COMUNA SOCIOPRODUCTIVA ALTO DE LA CARBONERA 6 1.011 0.921 Alta diversidad
142006-C-MIX-2016-05-0006 - COMUNA SAN JUAN DE LOS LIBERTADORES COMANDANTE SUPREMO 6 1.011 0.921 Alta diversidad
140102-C-MIX-2021-01-0003 - COMUNA ETERNO GIGANTE 2 0.693 1.000 Diversidad media
141211-14-12-0001 - 7. Consejo Comunal Milla Parte Media 6 0.693 1.000 Diversidad media
141211-14-12-0001 - 30. Consejo Comunal Unión Social 10 de Febrero 6 0.693 1.000 Diversidad media
141705-14-17-0000 - 25. Comuna El Paso de Bolívar 1813 5 0.673 0.971 Diversidad media
140101-C-RUR-2018-11-0018 - 14. COMUNA TIERRA DE ZAMORA 3 0.637 0.918 Diversidad media
140102-14-01-0006 - COMUNA SOCIALISTA EZEQUIEL ZAMORA 3 0.637 0.918 Diversidad media
140102-14-01-2007 - COMUNA SIMON BOLÍVAR. 3 0.637 0.918 Diversidad media
140102-C-MIX-2018-11-0084 - COMUNA LUZ DEL ALBA 3 0.637 0.918 Diversidad media
140102-C-MIX-2021-02-0004 - COMUNA ROSA LUXEMBURGO 3 0.637 0.918 Diversidad media
140102-C-MIX-2021-02-0005 - COMUNA FRANCISCO DE MIRANDA 3 0.637 0.918 Diversidad media
140103-14-01-0003 - COMUNA INDIA CARIBAY 3 0.637 0.918 Diversidad media
140303-14-03-0000 - Comuna La Cafetalera 3 0.637 0.918 Diversidad media
140601-C-MIX-2021-04-0012 - COMUNA PASO DE BOLIVAR POR LOS ANDES. 3 0.637 0.918 Diversidad media
140601-C-URB-2021-03-0010 - 17. COMUNA El GRAN CAÑAVERAL 3 0.637 0.918 Diversidad media
140602-C-MIX-2021-05-0007 - COMUNA SU LEGADO ES NUESTRA FORTALEZA SIMON PABLO FIGUEROA. 3 0.637 0.918 Diversidad media
140602-C-MIX-2021-05-0008 - 10. COMUNA YUBÁN ORTEGA SEMBRADOR DE ESPERANZAS 3 0.637 0.918 Diversidad media
140602-C-URB-2021-05-0008 - Comuna Socialista Libertadores de Conciencia Bolívar y Chávez 3 0.637 0.918 Diversidad media
140603-C-MIX-2018-11-0077 - 13. COMUNA AGROECOLÓGICA CULTURAL DE MONTAÑA KLÉBER RAMÍREZ ROJAS 3 0.637 0.918 Diversidad media
140605-14-06-0001 - 20. COMUNA LOMAS UNIDAS MACHO CAPAZ 3 0.637 0.918 Diversidad media
140606-C-RUR-2021-03-0002 - COMUNA IGNACIO FERNÁNDEZ PEÑA 3 0.637 0.918 Diversidad media
141201-C-URB-2021-07-0004 - COMUNA FANNY PRIETO. 3 0.637 0.918 Diversidad media
141204-14-12-0000 - COMUNA BICENTENARIA 16 DE SEPTIEMBRE. 3 0.637 0.918 Diversidad media
141207-14-12-0003 - COMUNA VALLE DEL CHAMA 3 0.637 0.918 Diversidad media
141207-14-12-0005 - COMUNA DON SIMÓN RODRÍGUEZ 3 0.637 0.918 Diversidad media
141303-C-MIX-2018-11-0113 - COMUNA VALLE DE LA VENTA 3 0.637 0.918 Diversidad media
141403-C-RUR-2017-04-0001 - 22. Comuna Socialista Una Esperanza Viva 3 0.637 0.918 Diversidad media
141601-CEC-ME-002 - CONSEJO COMUNAL LLANO GRANDE PARTE ALTA 3 0.637 0.918 Diversidad media
141704-CEC-ME-108 - 27. Comuna en Construcción de Escaguey 3 0.637 0.918 Diversidad media
141801-14-18-0000 - COMUNA SOCIALISTA PARAMO DE MARIÑO TIERRA DE LAGUNAS Y ENCANTOS 3 0.637 0.918 Diversidad media
141801-C-RUR-2018-11-0043 - COMUNA TRADICIONES Y VIVENCIAS DE BODOQUE 3 0.637 0.918 Diversidad media
142001-C-MIX-2018-08-0037 - COMUNA AGROECOLOGICA DOÑA SIMONA 3 0.637 0.918 Diversidad media
142101-14-21-0001 - COMUNA VENCEDORES EL AMPARO 3 0.637 0.918 Diversidad media
142102-C-MIX-2021-04-0013 - COMUNA TODOS JUNTOS VENCEREMOS 3 0.637 0.918 Diversidad media
142102-C-MIX-2021-10-0011 - COMUNA LOS IDEALES DE CHÁVEZ 3 0.637 0.918 Diversidad media
142104-14-21-0000 - Comuna Mucutíes 3 0.637 0.918 Diversidad media
140101-C-MIX-2018-11-0147 - 8. COMUNA FIELES A CHÁVEZ 3 0.000 NaN Baja diversidad
140101-C-URB-2018-11-0018 - 11. COMUNA UNIÓN DE CHÁVEZ 3 0.000 NaN Baja diversidad
140301-C-MIX-2021-10-0006 - COMUNA LA NUEVA FUERZA DE CHÁVEZ 3 0.000 NaN Baja diversidad
140301-CEC-ME-062 - Sector Comunal Casco Central 3 0.000 NaN Baja diversidad
140603-C-URB-2021-06-0003 - 8. COMUNA BRISAS DE MONTALBÁN. 3 0.000 NaN Baja diversidad
141301-C-MIX-2018-11-0168 - COMUNA VALLE DEL MOTATÁN 3 0.000 NaN Baja diversidad
141403-C-RUR-2017-02-0003 - 24. PENSAMIENTO CAMPESINO 3 0.000 NaN Baja diversidad
141403-C-RUR-2017-03-0002 - 23. Comuna El Sueño de Nuestro Comandante Eterno 3 0.000 NaN Baja diversidad
# Preparar datos para gráfico (sin crear etiquetas pre-definidas)
tabla_extremos_ratio <- bind_rows(
  top10_ratio %>% 
    mutate(tipo = "Mayor diversidad (Top 10)") %>% 
    rename(COMUNA = COMUNA_ID_NOMBRE),
  bottom10_ratio %>% 
    mutate(tipo = "Menor diversidad (Bottom 10)") %>% 
    rename(COMUNA = COMUNA_ID_NOMBRE)
)
# Nota: Removimos las etiquetas pre-definidas etiqueta_H y etiqueta_J

# Calcular maxH_ratio
maxH_ratio <- max(tabla_extremos_ratio$H_shannon, na.rm = TRUE) * 1.3

# Crear gráfico con valores exponenciales en las etiquetas
ratio_plot <- ggplot(tabla_extremos_ratio, aes(x = reorder(COMUNA, H_shannon), y = H_shannon, fill = tipo)) +
  geom_col(alpha = 0.85, width = 0.7) +
  
  # Etiquetas de Shannon con valor exponencial
  geom_text(
    aes(label = sprintf("%.2f (%.1f)", H_shannon, exp(H_shannon)), y = H_shannon * 0.5), 
    color = "white", 
    fontface = "bold",
    size = 2.8  # Reducido ligeramente
  ) +
  
  # Etiquetas de Pielou
  geom_text(
    aes(label = sprintf("J=%.2f", pielou), y = H_shannon + 0.05 * maxH_ratio),
    color = "#D55E00",
    size = 2.8,  # Reducido
    hjust = 0
  ) +
  
  # Línea y puntos de Pielou
  geom_line(
    aes(y = pielou * maxH_ratio, group = tipo), 
    color = "#E69F00", 
    linewidth = 1.2, 
    linetype = "solid"
  ) +
  geom_point(
    aes(y = pielou * maxH_ratio), 
    color = "#D55E00", 
    size = 3, 
    shape = 18
  ) +
  
  # Configuración del gráfico
  facet_wrap(
    ~ tipo, 
    scales = "free_y", 
    ncol = 1,
    strip.position = "top"
  ) +
  coord_flip() +
  scale_y_continuous(
    name = "Índice de Shannon (H)",
    sec.axis = sec_axis(
      ~ . / maxH_ratio, 
      name = "Índice de Pielou (J)",
      labels = scales::number_format(accuracy = 0.1)
    ),
    expand = expansion(mult = c(0, 0.15))
  ) +
  scale_fill_manual(values = c(
    "Mayor diversidad (Top 10)" = "#1b9e77", 
    "Menor diversidad (Bottom 10)" = "#d95f02"
  )) +
  labs(
    title = "Diversidad de estados de culminación de proyectos",
    subtitle = "Comunas con mayor y menor diversidad en estados de proyectos (Ratio ACA)",
    x = "Comuna (ID - Nombre)",
    caption = "Fuente: Elaboración propia - Proyectos ACA (2022-2025)\nNota: Barras = Shannon (H) con valor exponencial, Línea = Pielou (J)"
  ) +
  theme_minimal(base_size = 11) +  # Base size reducido
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),  # Título más pequeño
    plot.subtitle = element_text(size = 11, color = "gray30", hjust = 0.5),
    axis.title.y = element_text(margin = margin(r = 15)),
    axis.title.x = element_text(margin = margin(t = 10)),
    axis.text.y = element_text(size = 8),  # Texto del eje Y más pequeño
    panel.grid.major.y = element_blank(),
    strip.text = element_text(face = "bold", size = 11, color = "white"),
    strip.background = element_rect(fill = "gray25", color = NA),
    legend.position = "none",
    panel.spacing = unit(1, "lines"),
    plot.margin = margin(1, 2, 1, 1, "cm")  # Margen derecho aumentado
  )

# Guardar con dimensiones específicas
ggsave("ratio_diversity_plot.png", ratio_plot, width = 14, height = 10, dpi = 300)
## Warning: Removed 8 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Warning: Removed 8 rows containing missing values or values outside the scale range
## (`geom_point()`).
print(ratio_plot)
## Warning: Removed 8 rows containing missing values or values outside the scale range
## (`geom_line()`).
## Removed 8 rows containing missing values or values outside the scale range
## (`geom_point()`).

15 Visualización de los resultados

# -----------------------------------------------------------------------------
# FUNCIÓN PARA LIMPIAR EL ENTORNO (OPCIONAL)
# -----------------------------------------------------------------------------
limpiar_objetos_analisis <- function() {
  objetos_a_limpiar <- c("div_combinada", "tipo_comuna_stats", 
                        "div_cfg_con_tipo", "div_gob_con_tipo", "div_ratio_con_tipo")
  objetos_existentes <- objetos_a_limpiar[objetos_a_limpiar %in% ls(envir = .GlobalEnv)]
  if(length(objetos_existentes) > 0) {
    rm(list = objetos_existentes, envir = .GlobalEnv)
    cat("Limpiados objetos:", paste(objetos_existentes, collapse = ", "), "\n")
  }
}

# Ejecutar si quieres limpiar (descomenta la siguiente línea)
# limpiar_objetos_analisis()

# -----------------------------------------------------------------------------
# CLASIFICACIÓN COMPLETA Y CREACIÓN DEL TIPO DE COMUNA
# -----------------------------------------------------------------------------
crear_mapa_comunas <- function(df_source) {
  # Esta función crea el mapa de comunas de forma limpia cada vez
  mapa <- df_source %>%
    distinct(ID_COMUNA, COMUNA, COD_CC) %>%
    mutate(
      COMUNA = str_trim(COMUNA),
      Tipo_Comuna = case_when(
        str_detect(COD_CC, "C-URB") ~ "Urbana",
        str_detect(COD_CC, "C-RUR") ~ "Rural", 
        str_detect(COD_CC, "C-MIX") ~ "Mixta",
        str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
        str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
        str_detect(COD_CC, "^CEC") ~ "En construcción",
        TRUE ~ "No especificado"
      )
    )
  
  return(mapa)
}

# Verificar distribución
table(commune_map$Tipo_Comuna)
## Warning: Unknown or uninitialised column: `Tipo_Comuna`.
## < table of extent 0 >
# Crear el mapa de comunas fresco cada vez
commune_map <- crear_mapa_comunas(df_raw)

# Verificar distribución
cat("Distribución de tipos de comuna:\n")
## Distribución de tipos de comuna:
print(table(commune_map$Tipo_Comuna))
## 
## En construcción           Mixta           Rural          Urbana 
##              21              23              11               5
# =============================================================================
# ANÁLISIS INTEGRAL ÍNDICE SHANNON - POLÍTICAS PÚBLICAS ACA
# =============================================================================

# -----------------------------------------------------------------------------
# PALETA DE COLORES Y TEMA COMÚN
# -----------------------------------------------------------------------------
colores_comuna <- c(
  "Urbana" = "#2E86AB",           # Azul - densidad urbana
  "Rural" = "#A23B72",            # Magenta - ruralidad
  "Mixta" = "#F18F01",            # Naranja - combinación
  "En construcción" = "#C73E1D",   # Rojo - desarrollo
  "No especificado" = "#7D8491"    # Gris - sin clasificar
)

tema_comun <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 16, hjust = 0.5, color = "#2E86AB"),
    plot.subtitle = element_text(size = 12, color = "gray40", hjust = 0.5),
    axis.title = element_text(face = "bold", size = 11),
    axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
    legend.position = "bottom",
    strip.text = element_text(face = "bold", size = 11, color = "#2E86AB"),
    strip.background = element_rect(fill = "gray95", color = "white"),
    panel.border = element_rect(color = "gray90", fill = NA),
    legend.title = element_text(face = "bold")
  )

# -----------------------------------------------------------------------------
# PREPARACIÓN DE DATOS
# -----------------------------------------------------------------------------
# Crear mapa de comunas
commune_map <- df_raw %>%
  distinct(ID_COMUNA, COMUNA, COD_CC) %>%
  mutate(
    COMUNA = str_trim(COMUNA),
    Tipo_Comuna = case_when(
      str_detect(COD_CC, "C-URB") ~ "Urbana",
      str_detect(COD_CC, "C-RUR") ~ "Rural", 
      str_detect(COD_CC, "C-MIX") ~ "Mixta",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
      str_detect(COD_CC, "^CEC") ~ "En construcción",
      TRUE ~ "No especificado"
    )
  )

# Agregar tipo de comuna a cada dataset
div_cfg_con_tipo <- div_cfg %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")
## Warning in left_join(., commune_map %>% select(ID_COMUNA, Tipo_Comuna), : Detected an unexpected many-to-many relationship between `x` and `y`.
## ℹ Row 37 of `x` matches multiple rows in `y`.
## ℹ Row 24 of `y` matches multiple rows in `x`.
## ℹ If a many-to-many relationship is expected, set `relationship =
##   "many-to-many"` to silence this warning.
div_gob_con_tipo <- div_gob %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")
## Warning in left_join(., commune_map %>% select(ID_COMUNA, Tipo_Comuna), : Detected an unexpected many-to-many relationship between `x` and `y`.
## ℹ Row 37 of `x` matches multiple rows in `y`.
## ℹ Row 24 of `y` matches multiple rows in `x`.
## ℹ If a many-to-many relationship is expected, set `relationship =
##   "many-to-many"` to silence this warning.
div_ratio_con_tipo <- div_ratio %>%
  select(-contains("Tipo_Comuna")) %>%
  left_join(commune_map %>% select(ID_COMUNA, Tipo_Comuna), by = "ID_COMUNA")
## Warning in left_join(., commune_map %>% select(ID_COMUNA, Tipo_Comuna), : Detected an unexpected many-to-many relationship between `x` and `y`.
## ℹ Row 37 of `x` matches multiple rows in `y`.
## ℹ Row 24 of `y` matches multiple rows in `x`.
## ℹ If a many-to-many relationship is expected, set `relationship =
##   "many-to-many"` to silence this warning.
# Combinar datasets
div_combinada <- bind_rows(
  div_cfg_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "CFG"),
  
  div_gob_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "Gobernación"),
  
  div_ratio_con_tipo %>%
    select(COMUNA_ID_NOMBRE, n_proyectos = n_proyectos_ratio, H_shannon, pielou, Tipo_Comuna) %>%
    mutate(Tipo_Analisis = "Ratio ACA")
) %>%
  mutate(
    Shannon_Categoria = case_when(
      H_shannon < 0.5 ~ "Muy Baja",
      H_shannon < 1.0 ~ "Baja", 
      H_shannon < 1.5 ~ "Media",
      H_shannon >= 1.5 ~ "Alta"
    ),
    Eficiencia = H_shannon / (n_proyectos + 0.1)
  ) %>%
  filter(!is.na(H_shannon), !is.na(Tipo_Comuna), is.finite(H_shannon))

# -----------------------------------------------------------------------------
# ESTADÍSTICAS DESCRIPTIVAS
# -----------------------------------------------------------------------------
stats_shannon <- div_combinada %>%
  group_by(Tipo_Analisis, Tipo_Comuna) %>%
  summarise(
    n = n(),
    mean_shannon = mean(H_shannon, na.rm = TRUE),
    sd_shannon = sd(H_shannon, na.rm = TRUE),
    median_shannon = median(H_shannon, na.rm = TRUE),
    se = sd_shannon / sqrt(n),
    .groups = "drop"
  ) %>%
  filter(n >= 2)

# Mostrar tabla de estadísticas
kable(stats_shannon,
      caption = "Estadísticas del Índice Shannon por Tipo de Comuna y Análisis",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Estadísticas del Índice Shannon por Tipo de Comuna y Análisis
Tipo_Analisis Tipo_Comuna n mean_shannon sd_shannon median_shannon se
CFG En construcción 23 1.103 0.269 1.099 0.056
CFG Mixta 23 1.083 0.251 1.099 0.052
CFG Rural 11 1.120 0.263 1.099 0.079
CFG Urbana 5 1.006 0.207 1.099 0.092
Gobernación En construcción 23 1.163 0.197 1.099 0.041
Gobernación Mixta 23 1.179 0.295 1.099 0.062
Gobernación Rural 11 1.141 0.139 1.099 0.042
Gobernación Urbana 5 1.006 0.207 1.099 0.092
Ratio ACA En construcción 23 0.699 0.228 0.637 0.048
Ratio ACA Mixta 23 0.718 0.361 0.637 0.075
Ratio ACA Rural 11 0.723 0.415 0.637 0.125
Ratio ACA Urbana 5 0.382 0.349 0.637 0.156
# -----------------------------------------------------------------------------
# GRÁFICOS
# -----------------------------------------------------------------------------

# 1. Distribución Shannon
grafico_1_distribucion <- ggplot(div_combinada, aes(x = Tipo_Comuna, y = H_shannon, fill = Tipo_Comuna)) +
  geom_violin(alpha = 0.7, trim = FALSE, color = "white", linewidth = 0.8) +
  geom_boxplot(width = 0.2, fill = "white", outlier.colour = "#2E86AB", 
               outlier.size = 2, color = "black", linewidth = 0.5) +
  geom_jitter(aes(color = Tipo_Comuna), width = 0.15, size = 1.8, alpha = 0.6) +
  scale_fill_manual(values = colores_comuna, name = "Tipo de Comuna") +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free_y") +
  labs(
    title = "Distribución del Índice de Shannon por Tipo de Comuna",
    subtitle = "Análisis de diversidad en Agendas Concretas de Acción - Mérida, Venezuela",
    y = "Índice de Shannon (H')", 
    x = "Tipo de Comuna",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_1_distribucion)

# 2. Relación proyectos-Shannon
grafico_2_relacion <- ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon)) +
  geom_point(aes(color = Tipo_Comuna), size = 3, alpha = 0.7) +
  geom_smooth(method = "loess", se = TRUE, color = "#2E86AB", 
              fill = "#2E86AB", alpha = 0.2, linewidth = 1.2) +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free") +
  labs(
    title = "Relación entre Número de Proyectos y Diversidad Shannon",
    subtitle = "Análisis de correlación en políticas ACA",
    x = "Número de Proyectos",
    y = "Índice de Shannon (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_2_relacion)
## `geom_smooth()` using formula = 'y ~ x'
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 1.965
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 1.035
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 0
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : zero-width neighborhood. make span bigger
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 1
## Warning: Failed to fit group -1.
## Caused by error in `predLoess()`:
## ! NA/NaN/Inf en llamada a una función externa (arg 5)
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 1.965
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 1.035
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 0
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : zero-width neighborhood. make span bigger
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 1
## Warning: Failed to fit group -1.
## Caused by error in `predLoess()`:
## ! NA/NaN/Inf en llamada a una función externa (arg 5)
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : pseudoinverse used at 1.965
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : neighborhood radius 1.035
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : reciprocal condition number 0
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : zero-width neighborhood. make span bigger
## Warning in simpleLoess(y, x, w, span, degree = degree, parametric = parametric,
## : There are other near singularities as well. 1
## Warning: Failed to fit group -1.
## Caused by error in `predLoess()`:
## ! NA/NaN/Inf en llamada a una función externa (arg 5)

# 3. Comparativa de medias con intervalos de confianza
grafico_3_comparativa <- ggplot(stats_shannon, 
                               aes(x = reorder(Tipo_Comuna, mean_shannon), 
                                   y = mean_shannon, fill = Tipo_Comuna)) +
  geom_col(alpha = 0.8, color = "white", linewidth = 0.8) +
  geom_errorbar(aes(ymin = pmax(0, mean_shannon - se), 
                    ymax = mean_shannon + se), 
                width = 0.3, color = "black", linewidth = 0.8) +
  geom_text(aes(label = sprintf("%.2f", mean_shannon)), 
            vjust = -1.5, size = 4, fontface = "bold", color = "#2E86AB") +
  scale_fill_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis, scales = "free_y") +
  labs(
    title = "Índice de Shannon Promedio por Tipo de Comuna",
    subtitle = "Barras de error representan error estándar de la media",
    x = "Tipo de Comuna",
    y = "Shannon Promedio (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_3_comparativa)

# 4. Heatmap de frecuencias
datos_heatmap <- div_combinada %>%
  filter(Tipo_Analisis %in% c("CFG", "Gobernación")) %>%
  count(Tipo_Analisis, Tipo_Comuna, Shannon_Categoria) %>%
  complete(Tipo_Analisis, Tipo_Comuna, Shannon_Categoria, fill = list(n = 0))

grafico_4_heatmap <- ggplot(datos_heatmap, 
                           aes(x = Shannon_Categoria, y = Tipo_Comuna, fill = n)) +
  geom_tile(color = "white", linewidth = 0.8) +
  geom_text(aes(label = n, 
                color = ifelse(n >= max(n)/2, "white", "black")), 
            fontface = "bold", size = 4) +
  scale_fill_gradient(
    low = "#C6DBEF",    # Azul claro
    high = "#08519C",   # Azul oscuro
    name = "Frecuencia"
  ) +
  scale_color_identity() +
  facet_wrap(~ Tipo_Analisis) +
  labs(
    title = "Distribución de Frecuencias: Tipo Comuna vs. Shannon",
    subtitle = "Mapa de calor para análisis CFG y Gobernación",
    x = "Categoría Shannon",
    y = "Tipo de Comuna",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_4_heatmap)

# 5. Índice de Pielou vs Shannon
grafico_5_pielou <- ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon)) +
  geom_point(aes(color = Tipo_Comuna), size = 3, alpha = 0.7) +
  geom_smooth(method = "lm", se = TRUE, color = "#2E86AB", 
              fill = "#2E86AB", alpha = 0.2, linewidth = 1.2) +
  scale_color_manual(values = colores_comuna, name = "Tipo de Comuna") +
  facet_wrap(~ Tipo_Analisis) +
  labs(
    title = "Relación entre Número de Proyectos y Shannon",
    subtitle = "Análisis de proyectos y diversidad en ACA",
    x = "Número de Proyectos",
    y = "Índice de Shannon (H')",
    caption = "Elaborado por: William Gutiérrez"
  ) +
  tema_comun

print(grafico_5_pielou)
## `geom_smooth()` using formula = 'y ~ x'

16 Aplicación de normalidad

## Preparación de los datos
 # Eliminar valores nulos si es necesario
df_clean <- df_raw %>% filter(!is.na(n_proyectos) & !is.na(PLAZOS) & !is.na(CLASIFICACION_DEL_PROYECTO)& !is.na(RATIO_ACA_PROYECTO_CULMINADO)& !is.na(Clasificacion_Actores_institucionales)& !is.na(TIPOLOGIA_CFG_NUM)& !is.na(GOBERNACION_NUM))

# Función para crear un panel de diagnóstico de normalidad
create_normality_diagnostic <- function(data, variable, variable_name) {
  # Datos para la variable
  x <- data[[variable]]
  
  # Histograma con curva de densidad
  p1 <- ggplot(data, aes_string(x = variable)) +
    geom_histogram(aes(y = ..density..), bins = 30, fill = "lightblue", color = "black", alpha = 0.7) +
    geom_density(color = "red", linewidth = 1) +
    stat_function(fun = dnorm, 
                 args = list(mean = mean(x, na.rm = TRUE), 
                           sd = sd(x, na.rm = TRUE)),
                 color = "blue", linewidth = 1, linetype = "dashed") +
    labs(title = paste("Histograma y Densidad -", variable_name),
         x = variable_name, y = "Densidad") +
    theme_minimal()
  
  # Q-Q plot
  p2 <- ggplot(data, aes(sample = x)) +
    stat_qq() +
    stat_qq_line(color = "red") +
    labs(title = paste("Q-Q Plot -", variable_name)) +
    theme_minimal()
  
  # Combinar los gráficos
  gridExtra::grid.arrange(p1, p2, ncol = 2)
}

# Lista de variables para analizar
variables_to_analyze <- list(
  "n_proyectos" = "Número de Proyectos",
  "RATIO_ACA_PROYECTO_CULMINADO" = "Ratio ACA",
  "TIPOLOGIA_CFG_NUM" = "Tipología CFG",
  "GOBERNACION_NUM" = "Gobernación",
  "PLAZOS" = "Plazos",
  "CLASIFICACION_DEL_PROYECTO" = "Clasificación del Proyecto",
  "Clasificacion_Actores_institucionales" = "Actores Institucionales"
)

# Crear un panel para cada variable
for(var in names(variables_to_analyze)) {
  cat("\n\nAnálisis de normalidad para:", variables_to_analyze[[var]], "\n")
  print(create_normality_diagnostic(df_clean, var, variables_to_analyze[[var]]))
  
  # Imprimir resultados del test de Shapiro-Wilk
  sw_test <- shapiro.test(df_clean[[var]])
  cat("\nTest de Shapiro-Wilk:\n")
  cat("W =", round(sw_test$statistic, 4), "\n")
  cat("p-value =", format.pval(sw_test$p.value, digits = 4), "\n")
  cat("-----------------------------------\n")
}
## 
## 
## Análisis de normalidad para: Número de Proyectos
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.5502 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Ratio ACA

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.7444 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Tipología CFG

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8753 
## p-value = 1.027e-11 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Gobernación

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8601 
## p-value = 1.622e-12 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Plazos

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.4559 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Clasificación del Proyecto

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.7444 
## p-value = < 2.2e-16 
## -----------------------------------
## 
## 
## Análisis de normalidad para: Actores Institucionales

## TableGrob (1 x 2) "arrange": 2 grobs
##   z     cells    name           grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## 
## Test de Shapiro-Wilk:
## W = 0.8347 
## p-value = 9.828e-14 
## -----------------------------------
# Preparar el espacio para múltiples gráficos
par(mfrow = c(2, 4))  # 2 filas x 4 columnas para acomodar todos los Q-Q plots

# Crear Q-Q plots para cada variable con títulos descriptivos
qqnorm(df_clean$n_proyectos, main="Q-Q Plot: N° Proyectos",
       col = "blue", pch = 19)
qqline(df_clean$n_proyectos, col = "red")

qqnorm(df_clean$RATIO_ACA_PROYECTO_CULMINADO, main="Q-Q Plot: Ratio ACA",
       col = "green4", pch = 19)
qqline(df_clean$RATIO_ACA_PROYECTO_CULMINADO, col = "red")

qqnorm(df_clean$TIPOLOGIA_CFG_NUM, main="Q-Q Plot: Tipología CFG",
       col = "purple", pch = 19)
qqline(df_clean$TIPOLOGIA_CFG_NUM, col = "red")

qqnorm(df_clean$GOBERNACION_NUM, main="Q-Q Plot: Gobernación",
       col = "orange", pch = 19)
qqline(df_clean$GOBERNACION_NUM, col = "red")

qqnorm(df_clean$PLAZOS, main="Q-Q Plot: Plazos",
       col = "brown", pch = 19)
qqline(df_clean$PLAZOS, col = "red")

qqnorm(df_clean$CLASIFICACION_DEL_PROYECTO, main="Q-Q Plot: Clasificación",
       col = "darkgreen", pch = 19)
qqline(df_clean$CLASIFICACION_DEL_PROYECTO, col = "red")

qqnorm(df_clean$Clasificacion_Actores_institucionales, 
       main="Q-Q Plot: Actores Institucionales",
       col = "darkblue", pch = 19)
qqline(df_clean$Clasificacion_Actores_institucionales, col = "red")

# Restaurar la configuración original de gráficos
par(mfrow = c(1, 1))

# Resumen estadístico de las pruebas de normalidad
normality_summary <- data.frame(
  Variable = names(variables_to_analyze),
  W_statistic = sapply(names(variables_to_analyze), 
                      function(x) shapiro.test(df_clean[[x]])$statistic),
  p_value = sapply(names(variables_to_analyze), 
                   function(x) shapiro.test(df_clean[[x]])$p.value)
) %>%
  mutate(
    Normalidad = ifelse(p_value < 0.05, "No Normal", "Normal"),
    Variable_Name = unlist(variables_to_analyze)
  )

# Mostrar tabla resumen
kable(normality_summary %>% 
        select(Variable_Name, W_statistic, p_value, Normalidad),
      col.names = c("Variable", "Estadístico W", "Valor p", "Conclusión"),
      caption = "Resumen de Pruebas de Normalidad Shapiro-Wilk") %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Resumen de Pruebas de Normalidad Shapiro-Wilk
Variable Estadístico W Valor p Conclusión
n_proyectos.W Número de Proyectos 0.5501951 0 No Normal
RATIO_ACA_PROYECTO_CULMINADO.W Ratio ACA 0.7444145 0 No Normal
TIPOLOGIA_CFG_NUM.W Tipología CFG 0.8753315 0 No Normal
GOBERNACION_NUM.W Gobernación 0.8601242 0 No Normal
PLAZOS.W Plazos 0.4559052 0 No Normal
CLASIFICACION_DEL_PROYECTO.W Clasificación del Proyecto 0.7444145 0 No Normal
Clasificacion_Actores_institucionales.W Actores Institucionales 0.8346786 0 No Normal

Los resultados de la prueba de normalidad Shapiro-Wilk indican que todas las variables clave del conjunto de datos no siguen una distribución normal, ya que los p-valores son muy bajos (todos menos de 0.05). Esto sugiere que, para estas variables, deberías utilizar correlación no paramétrica como Spearman, en lugar de Pearson, que asume normalidad.

Todas las variables cuantitativas mostraron valores p < 0.001 en la prueba de Shapiro-Wilk, rechazando fuertemente la hipótesis nula de normalidad (Tabla X). En consecuencia, se emplearon métodos no paramétricos para los análisis posteriores

17 Modelo de Correlación entre Proyectos Comunitarios y Puntos Críticos

Para guiar el análisis de correlación entre los proyectos comunitarios de las Agendas Concretas de Acción (ACA) y los nudos críticos en el Estado Mérida, y dado que se confirmó la ausencia de normalidad en las variables cuantitativas mediante la prueba de Shapiro-Wilk (p-valores < 0,001), se optó por un enfoque no paramétrico para la evaluación de las relaciones. A continuación, se plantean la hipótesis general y las hipótesis específicas que buscan establecer el grado y la dirección de asociación entre las variables clave de este estudio, siguiendo la estructura y el rigor del planteamiento de hipótesis de la tesis de Castillo y Tello (2022, p.81-85), esto se ve detallada en la Tabla de Hipótesis 3:

# ===============================================================================
# MODELO DE CORRELACIÓN DE SPEARMAN PARA PROYECTOS COMUNALES ACA
# ===============================================================================

# 1. Preparación de datos (IGUAL)
top10_cfg <- df_dummies %>% count(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG) %>% arrange(desc(n)) %>% slice(1:10) %>% pull(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)
top10_gob <- df_dummies %>% count(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION) %>% arrange(desc(n)) %>% slice(1:10) %>% pull(CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION)
cfg_dummy_cols <- paste0("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", gsub(" ", "_", top10_cfg))
gob_dummy_cols <- paste0("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", gsub(" ", "_", top10_gob))
cfg_dummy_cols <- intersect(cfg_dummy_cols, names(df_dummies))
gob_dummy_cols <- intersect(gob_dummy_cols, names(df_dummies))
vars_resultado <- c("RATIO_ACA_PROYECTO_CULMINADO", "CLASIFICACION_DEL_PROYECTO", "PLAZOS", "Clasificacion_Actores_institucionales")

# 2. CREAR df_cor CORREGIDO (SIN case_when)
df_cor <- df_dummies %>%
  select(all_of(vars_resultado), all_of(cfg_dummy_cols), all_of(gob_dummy_cols))
  # ↑ ELIMINADO el mutate() con case_when porque la variable ya está correcta (1,2,3,4)

# 3. Cálculo de correlaciones de Spearman (IGUAL)
calcular_cor_spearman <- function(data) {
  n_vars <- ncol(data)
  cor_matrix <- matrix(NA, nrow = n_vars, ncol = n_vars)
  p_matrix <- matrix(NA, nrow = n_vars, ncol = n_vars)
  for (i in 1:n_vars) {
    for (j in 1:n_vars) {
      if (i != j) {
        temp <- data[, c(i, j)] %>% na.omit()
        if (nrow(temp) > 10) {
          test <- suppressWarnings(cor.test(temp[[1]], temp[[2]], method = "spearman", exact = FALSE))
          cor_matrix[i, j] <- test$estimate
          p_matrix[i, j] <- test$p.value
        }
      } else {
        cor_matrix[i, j] <- 1
      }
    }
  }
  rownames(cor_matrix) <- colnames(cor_matrix) <- colnames(data)
  rownames(p_matrix) <- colnames(p_matrix) <- colnames(data)
  return(list(cor = cor_matrix, p = p_matrix))
}
set.seed(123)
cor_results <- calcular_cor_spearman(df_cor)

# 4. Procesamiento de resultados y nombres cortos (IGUAL)
acortar_nombres <- function(nombres) {
  nombres <- gsub("CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", "CFG: ", nombres)
  nombres <- gsub("CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", "GOB: ", nombres)
  nombres <- gsub("_", " ", nombres)
  substr(nombres, 1, 28)
}
colnames(cor_results$cor) <- rownames(cor_results$cor) <- acortar_nombres(colnames(df_cor))
colnames(cor_results$p) <- rownames(cor_results$p) <- acortar_nombres(colnames(df_cor))

cor_df <- as.data.frame(cor_results$cor) %>%
  tibble::rownames_to_column("Variable1") %>%
  pivot_longer(-Variable1, names_to = "Variable2", values_to = "Correlacion") %>%
  left_join(
    as.data.frame(cor_results$p) %>%
      tibble::rownames_to_column("Variable1") %>%
      pivot_longer(-Variable1, names_to = "Variable2", values_to = "p_valor"),
    by = c("Variable1", "Variable2")
  ) %>%
  filter(!is.na(Correlacion), Variable1 != Variable2) %>%
  mutate(
    Significativa = ifelse(p_valor < 0.05, "Sí", "No"),
    Magnitud = case_when(
      abs(Correlacion) > 0.6 ~ "Muy fuerte",
      abs(Correlacion) > 0.4 ~ "Fuerte",
      abs(Correlacion) > 0.2 ~ "Moderada",
      TRUE ~ "Débil"
    )
  )

# 4. TABLA COMPLETA DE COEFICIENTES DE SPEARMAN
tabla_coef_spearman <- cor_df %>%
  select(Variable1, Variable2, Correlacion, p_valor, Significativa, Magnitud) %>%
  arrange(desc(abs(Correlacion)))

kable(tabla_coef_spearman,
      caption = "Coeficientes de Correlación de Spearman entre variables clave (ACA)",
      col.names = c("Variable 1", "Variable 2", "Rho (ρ)", "p-valor", "Significativa", "Magnitud"),
      align = "l") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(which(tabla_coef_spearman$Significativa == "Sí" & tabla_coef_spearman$Magnitud != "Débil"), bold = TRUE, color = "white", background = "#1b9e77") %>%
  row_spec(which(tabla_coef_spearman$Significativa == "Sí" & tabla_coef_spearman$Magnitud == "Débil"), color = "black", background = "#e6f2e6") %>%
  row_spec(which(tabla_coef_spearman$Significativa == "No"), color = "gray40", background = "#f7f7f7")
Coeficientes de Correlación de Spearman entre variables clave (ACA)
Variable 1 Variable 2 Rho (ρ) p-valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CLASIFICACION DEL PROYECTO 1.0000000 0.0000000 Muy fuerte
CLASIFICACION DEL PROYECTO RATIO ACA PROYECTO CULMINADO 1.0000000 0.0000000 Muy fuerte
CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.0000000 0.0000000 Muy fuerte
CFG: AMBIENTE GOB: CANALIZACION 1.0000000 0.0000000 Muy fuerte
GOB: ELECTRICIDAD CFG: ELECTRICIDAD 1.0000000 0.0000000 Muy fuerte
GOB: CANALIZACION CFG: AMBIENTE 1.0000000 0.0000000 Muy fuerte
CFG: VIVIENDA GOB: VIVIENDA 0.9501193 0.0000000 Muy fuerte
GOB: VIVIENDA CFG: VIVIENDA 0.9501193 0.0000000 Muy fuerte
CFG: TRANSPORTE GOB: TRANSPORTE 0.9329624 0.0000000 Muy fuerte
GOB: TRANSPORTE CFG: TRANSPORTE 0.9329624 0.0000000 Muy fuerte
CFG: VIALIDAD GOB: VIALIDAD 0.7483315 0.0000000 Muy fuerte
GOB: VIALIDAD CFG: VIALIDAD 0.7483315 0.0000000 Muy fuerte
Clasificacion Actores instit CFG: VIVIENDA -0.3677849 0.0000001 Moderada
CFG: VIVIENDA Clasificacion Actores instit -0.3677849 0.0000001 Moderada
Clasificacion Actores instit GOB: VIVIENDA -0.3535836 0.0000003 Moderada
GOB: VIVIENDA Clasificacion Actores instit -0.3535836 0.0000003 Moderada
Clasificacion Actores instit CFG: VIALIDAD 0.1910140 0.0070251 Débil
CFG: VIALIDAD Clasificacion Actores instit 0.1910140 0.0070251 Débil
PLAZOS CFG: INFRAESTRUCTURA -0.1854281 0.0089121 Débil
CFG: INFRAESTRUCTURA PLAZOS -0.1854281 0.0089121 Débil
RATIO ACA PROYECTO CULMINADO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
CLASIFICACION DEL PROYECTO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
GOB: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1667478 0.0188767 Débil
GOB: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1667478 0.0188767 Débil
Clasificacion Actores instit CFG: AMBIENTE -0.1552753 0.0289366 Débil
Clasificacion Actores instit GOB: CANALIZACION -0.1552753 0.0289366 Débil
CFG: AMBIENTE Clasificacion Actores instit -0.1552753 0.0289366 Débil
GOB: CANALIZACION Clasificacion Actores instit -0.1552753 0.0289366 Débil
CFG: VIALIDAD GOB: VIVIENDA -0.1531972 0.0311804 Débil
GOB: VIVIENDA CFG: VIALIDAD -0.1531972 0.0311804 Débil
CFG: VIALIDAD CFG: VIVIENDA -0.1455556 0.0407474 Débil
CFG: VIVIENDA CFG: VIALIDAD -0.1455556 0.0407474 Débil
RATIO ACA PROYECTO CULMINADO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CLASIFICACION DEL PROYECTO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1394358 0.0500900 No Débil
CFG: VIALIDAD CFG: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: VIALIDAD GOB: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
GOB: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
Clasificacion Actores instit GOB: TRANSPORTE 0.1259022 0.0771572 No Débil
GOB: TRANSPORTE Clasificacion Actores instit 0.1259022 0.0771572 No Débil
CFG: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
GOB: VIVIENDA CFG: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: VIVIENDA GOB: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
CFG: VIALIDAD CFG: SALUD -0.1165631 0.1019688 No Débil
CFG: SALUD CFG: VIALIDAD -0.1165631 0.1019688 No Débil
GOB: VIVIENDA GOB: VIALIDAD -0.1146423 0.1077797 No Débil
GOB: VIALIDAD GOB: VIVIENDA -0.1146423 0.1077797 No Débil
CFG: VIVIENDA CFG: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: VIVIENDA GOB: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: ELECTRICIDAD CFG: VIVIENDA -0.1122208 0.1154725 No Débil
GOB: ELECTRICIDAD CFG: VIVIENDA -0.1122208 0.1154725 No Débil
CFG: VIALIDAD GOB: DRENAJES -0.1120190 0.1161323 No Débil
GOB: DRENAJES CFG: VIALIDAD -0.1120190 0.1161323 No Débil
RATIO ACA PROYECTO CULMINADO CFG: AMBIENTE -0.1119048 0.1165071 No Débil
RATIO ACA PROYECTO CULMINADO GOB: CANALIZACION -0.1119048 0.1165071 No Débil
CLASIFICACION DEL PROYECTO CFG: AMBIENTE -0.1119048 0.1165071 No Débil
CLASIFICACION DEL PROYECTO GOB: CANALIZACION -0.1119048 0.1165071 No Débil
CFG: AMBIENTE RATIO ACA PROYECTO CULMINADO -0.1119048 0.1165071 No Débil
CFG: AMBIENTE CLASIFICACION DEL PROYECTO -0.1119048 0.1165071 No Débil
GOB: CANALIZACION RATIO ACA PROYECTO CULMINADO -0.1119048 0.1165071 No Débil
GOB: CANALIZACION CLASIFICACION DEL PROYECTO -0.1119048 0.1165071 No Débil
CFG: VIVIENDA GOB: VIALIDAD -0.1089239 0.1266271 No Débil
GOB: VIALIDAD CFG: VIVIENDA -0.1089239 0.1266271 No Débil
CFG: VIALIDAD CFG: INFRAESTRUCTURA -0.1073347 0.1322928 No Débil
CFG: INFRAESTRUCTURA CFG: VIALIDAD -0.1073347 0.1322928 No Débil
Clasificacion Actores instit CFG: SALUD -0.1042387 0.1438877 No Débil
CFG: SALUD Clasificacion Actores instit -0.1042387 0.1438877 No Débil
CFG: INFRAESTRUCTURA GOB: DRENAJES 0.1035873 0.1464227 No Débil
GOB: DRENAJES CFG: INFRAESTRUCTURA 0.1035873 0.1464227 No Débil
PLAZOS GOB: VIVIENDA -0.1035622 0.1465214 No Débil
GOB: VIVIENDA PLAZOS -0.1035622 0.1465214 No Débil
CFG: ELECTRICIDAD GOB: VIALIDAD -0.1030268 0.1486312 No Débil
GOB: ELECTRICIDAD GOB: VIALIDAD -0.1030268 0.1486312 No Débil
GOB: VIALIDAD CFG: ELECTRICIDAD -0.1030268 0.1486312 No Débil
GOB: VIALIDAD GOB: ELECTRICIDAD -0.1030268 0.1486312 No Débil
CFG: SALUD GOB: VIVIENDA -0.1000000 0.1609954 No Débil
GOB: VIVIENDA CFG: SALUD -0.1000000 0.1609954 No Débil
RATIO ACA PROYECTO CULMINADO CFG: TELECOMUNICACIONES -0.0996781 0.1623544 No Débil
CLASIFICACION DEL PROYECTO CFG: TELECOMUNICACIONES -0.0996781 0.1623544 No Débil
CFG: TELECOMUNICACIONES RATIO ACA PROYECTO CULMINADO -0.0996781 0.1623544 No Débil
CFG: TELECOMUNICACIONES CLASIFICACION DEL PROYECTO -0.0996781 0.1623544 No Débil
CFG: VIALIDAD CFG: AMBIENTE -0.0974601 0.1719525 No Débil
CFG: VIALIDAD GOB: CANALIZACION -0.0974601 0.1719525 No Débil
CFG: AMBIENTE CFG: VIALIDAD -0.0974601 0.1719525 No Débil
GOB: CANALIZACION CFG: VIALIDAD -0.0974601 0.1719525 No Débil
GOB: VIVIENDA GOB: DRENAJES -0.0961016 0.1780359 No Débil
GOB: DRENAJES GOB: VIVIENDA -0.0961016 0.1780359 No Débil
CFG: VIVIENDA CFG: SALUD -0.0950119 0.1830293 No Débil
CFG: SALUD CFG: VIVIENDA -0.0950119 0.1830293 No Débil
CFG: VIALIDAD CFG: EDUCACIÓN -0.0922139 0.1963212 No Débil
CFG: EDUCACIÓN CFG: VIALIDAD -0.0922139 0.1963212 No Débil
Clasificacion Actores instit CFG: INFRAESTRUCTURA 0.0915679 0.1994874 No Débil
CFG: INFRAESTRUCTURA Clasificacion Actores instit 0.0915679 0.1994874 No Débil
CFG: VIVIENDA GOB: DRENAJES -0.0913080 0.2007715 No Débil
GOB: DRENAJES CFG: VIVIENDA -0.0913080 0.2007715 No Débil
CFG: ELECTRICIDAD CFG: SALUD -0.0898681 0.2079948 No Débil
CFG: SALUD CFG: ELECTRICIDAD -0.0898681 0.2079948 No Débil
CFG: SALUD GOB: ELECTRICIDAD -0.0898681 0.2079948 No Débil
GOB: ELECTRICIDAD CFG: SALUD -0.0898681 0.2079948 No Débil
CFG: VIVIENDA CFG: INFRAESTRUCTURA -0.0874897 0.2203316 No Débil
CFG: INFRAESTRUCTURA CFG: VIVIENDA -0.0874897 0.2203316 No Débil
Clasificacion Actores instit CFG: ELECTRICIDAD 0.0874440 0.2205739 No Débil
Clasificacion Actores instit GOB: ELECTRICIDAD 0.0874440 0.2205739 No Débil
CFG: ELECTRICIDAD Clasificacion Actores instit 0.0874440 0.2205739 No Débil
GOB: ELECTRICIDAD Clasificacion Actores instit 0.0874440 0.2205739 No Débil
RATIO ACA PROYECTO CULMINADO Clasificacion Actores instit 0.0873689 0.2209722 No Débil
CLASIFICACION DEL PROYECTO Clasificacion Actores instit 0.0873689 0.2209722 No Débil
Clasificacion Actores instit RATIO ACA PROYECTO CULMINADO 0.0873689 0.2209722 No Débil
Clasificacion Actores instit CLASIFICACION DEL PROYECTO 0.0873689 0.2209722 No Débil
CFG: SALUD GOB: VIALIDAD -0.0872278 0.2217214 No Débil
GOB: VIALIDAD CFG: SALUD -0.0872278 0.2217214 No Débil
CFG: ELECTRICIDAD GOB: DRENAJES -0.0863647 0.2263457 No Débil
GOB: ELECTRICIDAD GOB: DRENAJES -0.0863647 0.2263457 No Débil
GOB: DRENAJES CFG: ELECTRICIDAD -0.0863647 0.2263457 No Débil
GOB: DRENAJES GOB: ELECTRICIDAD -0.0863647 0.2263457 No Débil
Clasificacion Actores instit CFG: TRANSPORTE 0.0843585 0.2373560 No Débil
CFG: TRANSPORTE Clasificacion Actores instit 0.0843585 0.2373560 No Débil
GOB: VIALIDAD GOB: DRENAJES -0.0838274 0.2403330 No Débil
GOB: DRENAJES GOB: VIALIDAD -0.0838274 0.2403330 No Débil
CFG: AMBIENTE GOB: VIVIENDA -0.0836115 0.2415503 No Débil
GOB: VIVIENDA CFG: AMBIENTE -0.0836115 0.2415503 No Débil
GOB: VIVIENDA GOB: CANALIZACION -0.0836115 0.2415503 No Débil
GOB: CANALIZACION GOB: VIVIENDA -0.0836115 0.2415503 No Débil
CFG: ELECTRICIDAD CFG: INFRAESTRUCTURA -0.0827531 0.2464333 No Débil
CFG: INFRAESTRUCTURA CFG: ELECTRICIDAD -0.0827531 0.2464333 No Débil
CFG: INFRAESTRUCTURA GOB: ELECTRICIDAD -0.0827531 0.2464333 No Débil
GOB: ELECTRICIDAD CFG: INFRAESTRUCTURA -0.0827531 0.2464333 No Débil
CFG: VIALIDAD CFG: TRANSPORTE -0.0808981 0.2572194 No Débil
CFG: TRANSPORTE CFG: VIALIDAD -0.0808981 0.2572194 No Débil
CFG: INFRAESTRUCTURA GOB: VIALIDAD -0.0803219 0.2606347 No Débil
GOB: VIALIDAD CFG: INFRAESTRUCTURA -0.0803219 0.2606347 No Débil
Clasificacion Actores instit GOB: VIALIDAD 0.0798595 0.2633984 No Débil
GOB: VIALIDAD Clasificacion Actores instit 0.0798595 0.2633984 No Débil
CFG: VIVIENDA CFG: AMBIENTE -0.0794409 0.2659172 No Débil
CFG: VIVIENDA GOB: CANALIZACION -0.0794409 0.2659172 No Débil
CFG: AMBIENTE CFG: VIVIENDA -0.0794409 0.2659172 No Débil
GOB: CANALIZACION CFG: VIVIENDA -0.0794409 0.2659172 No Débil
CFG: EDUCACIÓN GOB: VIVIENDA -0.0791107 0.2679156 No Débil
GOB: VIVIENDA CFG: EDUCACIÓN -0.0791107 0.2679156 No Débil
PLAZOS CFG: VIVIENDA -0.0790295 0.2684088 No Débil
CFG: VIVIENDA PLAZOS -0.0790295 0.2684088 No Débil
CFG: VIVIENDA CFG: EDUCACIÓN -0.0751646 0.2925919 No Débil
CFG: EDUCACIÓN CFG: VIVIENDA -0.0751646 0.2925919 No Débil
CFG: ELECTRICIDAD CFG: AMBIENTE -0.0751400 0.2927502 No Débil
CFG: ELECTRICIDAD GOB: CANALIZACION -0.0751400 0.2927502 No Débil
CFG: AMBIENTE CFG: ELECTRICIDAD -0.0751400 0.2927502 No Débil
CFG: AMBIENTE GOB: ELECTRICIDAD -0.0751400 0.2927502 No Débil
GOB: ELECTRICIDAD CFG: AMBIENTE -0.0751400 0.2927502 No Débil
GOB: ELECTRICIDAD GOB: CANALIZACION -0.0751400 0.2927502 No Débil
GOB: CANALIZACION CFG: ELECTRICIDAD -0.0751400 0.2927502 No Débil
GOB: CANALIZACION GOB: ELECTRICIDAD -0.0751400 0.2927502 No Débil
CFG: VIALIDAD CFG: TELECOMUNICACIONES -0.0747018 0.2955822 No Débil
CFG: TELECOMUNICACIONES CFG: VIALIDAD -0.0747018 0.2955822 No Débil
GOB: VIVIENDA GOB: TRANSPORTE -0.0743897 0.2976098 No Débil
GOB: TRANSPORTE GOB: VIVIENDA -0.0743897 0.2976098 No Débil
CFG: SALUD GOB: DRENAJES -0.0731208 0.3059499 No Débil
GOB: DRENAJES CFG: SALUD -0.0731208 0.3059499 No Débil
CFG: AMBIENTE GOB: VIALIDAD -0.0729325 0.3072004 No Débil
GOB: VIALIDAD CFG: AMBIENTE -0.0729325 0.3072004 No Débil
GOB: VIALIDAD GOB: CANALIZACION -0.0729325 0.3072004 No Débil
GOB: CANALIZACION GOB: VIALIDAD -0.0729325 0.3072004 No Débil
Clasificacion Actores instit CFG: EDUCACIÓN 0.0713166 0.3180701 No Débil
CFG: EDUCACIÓN Clasificacion Actores instit 0.0713166 0.3180701 No Débil
CFG: ELECTRICIDAD CFG: EDUCACIÓN -0.0710953 0.3195782 No Débil
CFG: EDUCACIÓN CFG: ELECTRICIDAD -0.0710953 0.3195782 No Débil
CFG: EDUCACIÓN GOB: ELECTRICIDAD -0.0710953 0.3195782 No Débil
GOB: ELECTRICIDAD CFG: EDUCACIÓN -0.0710953 0.3195782 No Débil
CFG: VIVIENDA GOB: TRANSPORTE -0.0706791 0.3224261 No Débil
GOB: TRANSPORTE CFG: VIVIENDA -0.0706791 0.3224261 No Débil
RATIO ACA PROYECTO CULMINADO CFG: EDUCACIÓN -0.0700818 0.3265424 No Débil
CLASIFICACION DEL PROYECTO CFG: EDUCACIÓN -0.0700818 0.3265424 No Débil
CFG: EDUCACIÓN RATIO ACA PROYECTO CULMINADO -0.0700818 0.3265424 No Débil
CFG: EDUCACIÓN CLASIFICACION DEL PROYECTO -0.0700818 0.3265424 No Débil
CFG: SALUD CFG: INFRAESTRUCTURA -0.0700631 0.3266722 No Débil
CFG: INFRAESTRUCTURA CFG: SALUD -0.0700631 0.3266722 No Débil
CFG: TRANSPORTE GOB: VIVIENDA -0.0694028 0.3312629 No Débil
GOB: VIVIENDA CFG: TRANSPORTE -0.0694028 0.3312629 No Débil
CFG: EDUCACIÓN GOB: VIALIDAD -0.0690066 0.3340380 No Débil
GOB: VIALIDAD CFG: EDUCACIÓN -0.0690066 0.3340380 No Débil
PLAZOS CFG: VIALIDAD 0.0678688 0.3420879 No Débil
CFG: VIALIDAD PLAZOS 0.0678688 0.3420879 No Débil
CFG: ELECTRICIDAD GOB: TRANSPORTE -0.0668526 0.3493807 No Débil
GOB: ELECTRICIDAD GOB: TRANSPORTE -0.0668526 0.3493807 No Débil
GOB: TRANSPORTE CFG: ELECTRICIDAD -0.0668526 0.3493807 No Débil
GOB: TRANSPORTE GOB: ELECTRICIDAD -0.0668526 0.3493807 No Débil
CFG: VIVIENDA CFG: TRANSPORTE -0.0659410 0.3560062 No Débil
CFG: TRANSPORTE CFG: VIVIENDA -0.0659410 0.3560062 No Débil
GOB: VIALIDAD GOB: TRANSPORTE -0.0648886 0.3637516 No Débil
GOB: TRANSPORTE GOB: VIALIDAD -0.0648886 0.3637516 No Débil
CFG: TELECOMUNICACIONES GOB: VIVIENDA -0.0640870 0.3697206 No Débil
GOB: VIVIENDA CFG: TELECOMUNICACIONES -0.0640870 0.3697206 No Débil
CFG: SALUD CFG: AMBIENTE -0.0636174 0.3732451 No Débil
CFG: SALUD GOB: CANALIZACION -0.0636174 0.3732451 No Débil
CFG: AMBIENTE CFG: SALUD -0.0636174 0.3732451 No Débil
GOB: CANALIZACION CFG: SALUD -0.0636174 0.3732451 No Débil
PLAZOS GOB: DRENAJES 0.0625221 0.3815470 No Débil
GOB: DRENAJES PLAZOS 0.0625221 0.3815470 No Débil
CFG: ELECTRICIDAD CFG: TRANSPORTE -0.0623710 0.3827007 No Débil
CFG: TRANSPORTE CFG: ELECTRICIDAD -0.0623710 0.3827007 No Débil
CFG: TRANSPORTE GOB: ELECTRICIDAD -0.0623710 0.3827007 No Débil
GOB: ELECTRICIDAD CFG: TRANSPORTE -0.0623710 0.3827007 No Débil
CFG: AMBIENTE GOB: DRENAJES -0.0611374 0.3922007 No Débil
GOB: DRENAJES CFG: AMBIENTE -0.0611374 0.3922007 No Débil
GOB: DRENAJES GOB: CANALIZACION -0.0611374 0.3922007 No Débil
GOB: CANALIZACION GOB: DRENAJES -0.0611374 0.3922007 No Débil
CFG: VIVIENDA CFG: TELECOMUNICACIONES -0.0608903 0.3941206 No Débil
CFG: TELECOMUNICACIONES CFG: VIVIENDA -0.0608903 0.3941206 No Débil
CFG: TRANSPORTE GOB: VIALIDAD -0.0605386 0.3968628 No Débil
GOB: VIALIDAD CFG: TRANSPORTE -0.0605386 0.3968628 No Débil
CFG: SALUD CFG: EDUCACIÓN -0.0601929 0.3995692 No Débil
CFG: EDUCACIÓN CFG: SALUD -0.0601929 0.3995692 No Débil
PLAZOS CFG: TRANSPORTE -0.0598959 0.4019035 No Débil
CFG: TRANSPORTE PLAZOS -0.0598959 0.4019035 No Débil
RATIO ACA PROYECTO CULMINADO GOB: DRENAJES -0.0597116 0.4033558 No Débil
CLASIFICACION DEL PROYECTO GOB: DRENAJES -0.0597116 0.4033558 No Débil
GOB: DRENAJES RATIO ACA PROYECTO CULMINADO -0.0597116 0.4033558 No Débil
GOB: DRENAJES CLASIFICACION DEL PROYECTO -0.0597116 0.4033558 No Débil
CFG: INFRAESTRUCTURA CFG: AMBIENTE -0.0585808 0.4123358 No Débil
CFG: INFRAESTRUCTURA GOB: CANALIZACION -0.0585808 0.4123358 No Débil
CFG: AMBIENTE CFG: INFRAESTRUCTURA -0.0585808 0.4123358 No Débil
GOB: CANALIZACION CFG: INFRAESTRUCTURA -0.0585808 0.4123358 No Débil
RATIO ACA PROYECTO CULMINADO CFG: SALUD -0.0582558 0.4149379 No Débil
CLASIFICACION DEL PROYECTO CFG: SALUD -0.0582558 0.4149379 No Débil
CFG: SALUD RATIO ACA PROYECTO CULMINADO -0.0582558 0.4149379 No Débil
CFG: SALUD CLASIFICACION DEL PROYECTO -0.0582558 0.4149379 No Débil
CFG: EDUCACIÓN GOB: DRENAJES -0.0578464 0.4182304 No Débil
GOB: DRENAJES CFG: EDUCACIÓN -0.0578464 0.4182304 No Débil
CFG: ELECTRICIDAD CFG: TELECOMUNICACIONES -0.0575937 0.4202695 No Débil
CFG: TELECOMUNICACIONES CFG: ELECTRICIDAD -0.0575937 0.4202695 No Débil
CFG: TELECOMUNICACIONES GOB: ELECTRICIDAD -0.0575937 0.4202695 No Débil
GOB: ELECTRICIDAD CFG: TELECOMUNICACIONES -0.0575937 0.4202695 No Débil
CFG: SALUD GOB: TRANSPORTE -0.0566009 0.4283387 No Débil
GOB: TRANSPORTE CFG: SALUD -0.0566009 0.4283387 No Débil
CFG: TELECOMUNICACIONES GOB: VIALIDAD -0.0559017 0.4340746 No Débil
GOB: VIALIDAD CFG: TELECOMUNICACIONES -0.0559017 0.4340746 No Débil
CFG: INFRAESTRUCTURA CFG: EDUCACIÓN -0.0554274 0.4379906 No Débil
CFG: EDUCACIÓN CFG: INFRAESTRUCTURA -0.0554274 0.4379906 No Débil
GOB: DRENAJES GOB: TRANSPORTE -0.0543944 0.4465888 No Débil
GOB: TRANSPORTE GOB: DRENAJES -0.0543944 0.4465888 No Débil
CFG: SALUD CFG: TRANSPORTE -0.0528065 0.4599893 No Débil
CFG: TRANSPORTE CFG: SALUD -0.0528065 0.4599893 No Débil
CFG: INFRAESTRUCTURA GOB: TRANSPORTE -0.0521198 0.4658535 No Débil
GOB: TRANSPORTE CFG: INFRAESTRUCTURA -0.0521198 0.4658535 No Débil
CFG: TRANSPORTE GOB: DRENAJES -0.0507479 0.4776900 No Débil
GOB: DRENAJES CFG: TRANSPORTE -0.0507479 0.4776900 No Débil
CFG: AMBIENTE CFG: EDUCACIÓN -0.0503282 0.4813437 No Débil
CFG: EDUCACIÓN CFG: AMBIENTE -0.0503282 0.4813437 No Débil
CFG: EDUCACIÓN GOB: CANALIZACION -0.0503282 0.4813437 No Débil
GOB: CANALIZACION CFG: EDUCACIÓN -0.0503282 0.4813437 No Débil
Clasificacion Actores instit CFG: TELECOMUNICACIONES 0.0495198 0.4884237 No Débil
CFG: TELECOMUNICACIONES Clasificacion Actores instit 0.0495198 0.4884237 No Débil
CFG: SALUD CFG: TELECOMUNICACIONES -0.0487618 0.4951115 No Débil
CFG: TELECOMUNICACIONES CFG: SALUD -0.0487618 0.4951115 No Débil
CFG: INFRAESTRUCTURA CFG: TRANSPORTE -0.0486258 0.4963173 No Débil
CFG: TRANSPORTE CFG: INFRAESTRUCTURA -0.0486258 0.4963173 No Débil
CFG: AMBIENTE GOB: TRANSPORTE -0.0473249 0.5079235 No Débil
GOB: CANALIZACION GOB: TRANSPORTE -0.0473249 0.5079235 No Débil
GOB: TRANSPORTE CFG: AMBIENTE -0.0473249 0.5079235 No Débil
GOB: TRANSPORTE GOB: CANALIZACION -0.0473249 0.5079235 No Débil
CFG: TELECOMUNICACIONES GOB: DRENAJES -0.0468609 0.5120964 No Débil
GOB: DRENAJES CFG: TELECOMUNICACIONES -0.0468609 0.5120964 No Débil
PLAZOS GOB: TRANSPORTE -0.0449398 0.5295634 No Débil
GOB: TRANSPORTE PLAZOS -0.0449398 0.5295634 No Débil
CFG: INFRAESTRUCTURA CFG: TELECOMUNICACIONES -0.0449013 0.5299160 No Débil
CFG: TELECOMUNICACIONES CFG: INFRAESTRUCTURA -0.0449013 0.5299160 No Débil
CFG: EDUCACIÓN GOB: TRANSPORTE -0.0447774 0.5310537 No Débil
GOB: TRANSPORTE CFG: EDUCACIÓN -0.0447774 0.5310537 No Débil
RATIO ACA PROYECTO CULMINADO CFG: ELECTRICIDAD -0.0445251 0.5333725 No Débil
RATIO ACA PROYECTO CULMINADO GOB: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CLASIFICACION DEL PROYECTO CFG: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CLASIFICACION DEL PROYECTO GOB: ELECTRICIDAD -0.0445251 0.5333725 No Débil
CFG: ELECTRICIDAD RATIO ACA PROYECTO CULMINADO -0.0445251 0.5333725 No Débil
CFG: ELECTRICIDAD CLASIFICACION DEL PROYECTO -0.0445251 0.5333725 No Débil
GOB: ELECTRICIDAD RATIO ACA PROYECTO CULMINADO -0.0445251 0.5333725 No Débil
GOB: ELECTRICIDAD CLASIFICACION DEL PROYECTO -0.0445251 0.5333725 No Débil
CFG: AMBIENTE CFG: TRANSPORTE -0.0441523 0.5368089 No Débil
CFG: TRANSPORTE CFG: AMBIENTE -0.0441523 0.5368089 No Débil
CFG: TRANSPORTE GOB: CANALIZACION -0.0441523 0.5368089 No Débil
GOB: CANALIZACION CFG: TRANSPORTE -0.0441523 0.5368089 No Débil
RATIO ACA PROYECTO CULMINADO PLAZOS -0.0440255 0.5379799 No Débil
CLASIFICACION DEL PROYECTO PLAZOS -0.0440255 0.5379799 No Débil
PLAZOS RATIO ACA PROYECTO CULMINADO -0.0440255 0.5379799 No Débil
PLAZOS CLASIFICACION DEL PROYECTO -0.0440255 0.5379799 No Débil
CFG: EDUCACIÓN CFG: TRANSPORTE -0.0417756 0.5589727 No Débil
CFG: TRANSPORTE CFG: EDUCACIÓN -0.0417756 0.5589727 No Débil
CFG: AMBIENTE CFG: TELECOMUNICACIONES -0.0407705 0.5684765 No Débil
CFG: TELECOMUNICACIONES CFG: AMBIENTE -0.0407705 0.5684765 No Débil
CFG: TELECOMUNICACIONES GOB: CANALIZACION -0.0407705 0.5684765 No Débil
GOB: CANALIZACION CFG: TELECOMUNICACIONES -0.0407705 0.5684765 No Débil
CFG: INFRAESTRUCTURA GOB: VIVIENDA 0.0400360 0.5754693 No Débil
GOB: VIVIENDA CFG: INFRAESTRUCTURA 0.0400360 0.5754693 No Débil
CFG: EDUCACIÓN CFG: TELECOMUNICACIONES -0.0385758 0.5894907 No Débil
CFG: TELECOMUNICACIONES CFG: EDUCACIÓN -0.0385758 0.5894907 No Débil
PLAZOS GOB: VIALIDAD 0.0384760 0.5904548 No Débil
GOB: VIALIDAD PLAZOS 0.0384760 0.5904548 No Débil
CFG: TELECOMUNICACIONES GOB: TRANSPORTE -0.0362738 0.6119071 No Débil
GOB: TRANSPORTE CFG: TELECOMUNICACIONES -0.0362738 0.6119071 No Débil
RATIO ACA PROYECTO CULMINADO CFG: VIALIDAD 0.0360418 0.6141871 No Débil
CLASIFICACION DEL PROYECTO CFG: VIALIDAD 0.0360418 0.6141871 No Débil
CFG: VIALIDAD RATIO ACA PROYECTO CULMINADO 0.0360418 0.6141871 No Débil
CFG: VIALIDAD CLASIFICACION DEL PROYECTO 0.0360418 0.6141871 No Débil
RATIO ACA PROYECTO CULMINADO GOB: VIALIDAD -0.0359616 0.6149759 No Débil
CLASIFICACION DEL PROYECTO GOB: VIALIDAD -0.0359616 0.6149759 No Débil
GOB: VIALIDAD RATIO ACA PROYECTO CULMINADO -0.0359616 0.6149759 No Débil
GOB: VIALIDAD CLASIFICACION DEL PROYECTO -0.0359616 0.6149759 No Débil
PLAZOS CFG: SALUD -0.0345207 0.6292250 No Débil
CFG: SALUD PLAZOS -0.0345207 0.6292250 No Débil
CFG: TRANSPORTE CFG: TELECOMUNICACIONES -0.0338421 0.6359841 No Débil
CFG: TELECOMUNICACIONES CFG: TRANSPORTE -0.0338421 0.6359841 No Débil
PLAZOS CFG: EDUCACIÓN 0.0318612 0.6558854 No Débil
CFG: EDUCACIÓN PLAZOS 0.0318612 0.6558854 No Débil
PLAZOS CFG: AMBIENTE -0.0202043 0.7775383 No Débil
PLAZOS GOB: CANALIZACION -0.0202043 0.7775383 No Débil
CFG: AMBIENTE PLAZOS -0.0202043 0.7775383 No Débil
GOB: CANALIZACION PLAZOS -0.0202043 0.7775383 No Débil
PLAZOS Clasificacion Actores instit 0.0190980 0.7894263 No Débil
Clasificacion Actores instit PLAZOS 0.0190980 0.7894263 No Débil
RATIO ACA PROYECTO CULMINADO CFG: VIVIENDA -0.0188082 0.7925488 No Débil
CLASIFICACION DEL PROYECTO CFG: VIVIENDA -0.0188082 0.7925488 No Débil
CFG: VIVIENDA RATIO ACA PROYECTO CULMINADO -0.0188082 0.7925488 No Débil
CFG: VIVIENDA CLASIFICACION DEL PROYECTO -0.0188082 0.7925488 No Débil
RATIO ACA PROYECTO CULMINADO CFG: INFRAESTRUCTURA 0.0172508 0.8093836 No Débil
CLASIFICACION DEL PROYECTO CFG: INFRAESTRUCTURA 0.0172508 0.8093836 No Débil
CFG: INFRAESTRUCTURA RATIO ACA PROYECTO CULMINADO 0.0172508 0.8093836 No Débil
CFG: INFRAESTRUCTURA CLASIFICACION DEL PROYECTO 0.0172508 0.8093836 No Débil
CFG: VIALIDAD GOB: TRANSPORTE -0.0151744 0.8319640 No Débil
GOB: TRANSPORTE CFG: VIALIDAD -0.0151744 0.8319640 No Débil
Clasificacion Actores instit GOB: DRENAJES 0.0126575 0.8595192 No Débil
GOB: DRENAJES Clasificacion Actores instit 0.0126575 0.8595192 No Débil
RATIO ACA PROYECTO CULMINADO GOB: VIVIENDA 0.0115018 0.8722311 No Débil
CLASIFICACION DEL PROYECTO GOB: VIVIENDA 0.0115018 0.8722311 No Débil
GOB: VIVIENDA RATIO ACA PROYECTO CULMINADO 0.0115018 0.8722311 No Débil
GOB: VIVIENDA CLASIFICACION DEL PROYECTO 0.0115018 0.8722311 No Débil
PLAZOS CFG: ELECTRICIDAD 0.0075109 0.9163604 No Débil
PLAZOS GOB: ELECTRICIDAD 0.0075109 0.9163604 No Débil
CFG: ELECTRICIDAD PLAZOS 0.0075109 0.9163604 No Débil
GOB: ELECTRICIDAD PLAZOS 0.0075109 0.9163604 No Débil
PLAZOS CFG: TELECOMUNICACIONES 0.0000000 1.0000000 No Débil
CFG: TELECOMUNICACIONES PLAZOS 0.0000000 1.0000000 No Débil
#-----------------------------Visualización alternativa: Heatmap de correlaciones-------------------
ggplot(tabla_coef_spearman %>% filter(Magnitud != "Débil"), 
       aes(x = Variable1, y = Variable2, fill = Correlacion)) +
  geom_tile(color = "white") +
  geom_text(aes(label = sprintf("%.2f", Correlacion)), color = "black", size = 3) +
  scale_fill_gradient2(
    low = "#d7191c", mid = "#ffffbf", high = "#2c7bb6", midpoint = 0, limits = c(-1, 1)
  ) +
  labs(
    title = "Correlaciones Moderadas y Fuertes (Spearman)",
    subtitle = "Entre tipologías, gobernaciones y resultados de proyectos",
    x = "", y = ""
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1), legend.position = "right")

# ===============================================================================
# ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA
# FLUJO DE TRABAJO INTEGRADO PARA MONOGRAFÍA
# ===============================================================================
# ===============================================================================
# 1. HEATMAP ACADÉMICO - MATRIZ DE CORRELACIONES SIGNIFICATIVAS
# ===============================================================================

crear_heatmap_correlaciones <- function(cor_results, titulo = "Matriz de Correlación de Spearman - Proyectos ACA") {
  
  # Sincronizar matrices
  vars_comunes <- intersect(rownames(cor_results$cor), rownames(cor_results$p))
  cor_matrix <- cor_results$cor[vars_comunes, vars_comunes]
  p_matrix <- cor_results$p[vars_comunes, vars_comunes]
  
  # Convertir a formato largo
  cor_long <- melt(cor_matrix, varnames = c("Variable1", "Variable2"), value.name = "Correlacion")
  p_long <- melt(p_matrix, varnames = c("Variable1", "Variable2"), value.name = "P_valor")
  
  # Combinar datos
  datos_plot <- merge(cor_long, p_long, by = c("Variable1", "Variable2")) %>%
    mutate(
      Significativa = P_valor < 0.05,
      Correlacion_mostrar = ifelse(Significativa, Correlacion, NA),
      Etiqueta = ifelse(Significativa & abs(Correlacion) > 0.3, 
                       sprintf("%.2f", Correlacion), ""),
      Asterisco = case_when(
        P_valor < 0.001 ~ "***",
        P_valor < 0.01 ~ "**",
        P_valor < 0.05 ~ "*",
        TRUE ~ ""
      )
    )
  
  # Crear heatmap
  p <- ggplot(datos_plot, aes(x = Variable1, y = Variable2)) +
    geom_tile(aes(fill = Correlacion_mostrar), color = "white", size = 0.3) +
    geom_text(aes(label = Etiqueta), size = 2.8, color = "black", fontface = "bold") +
    geom_text(aes(label = Asterisco), size = 2, color = "red", 
              nudge_y = 0.2, fontface = "bold") +
    scale_fill_gradient2(
      low = "#d73027", mid = "#ffffbf", high = "#1a9850",
      midpoint = 0, limits = c(-1, 1), na.value = "grey95",
      name = "ρ",
      breaks = c(-1, -0.5, 0, 0.5, 1)
    ) +
    labs(
      title = titulo,
      subtitle = "Solo correlaciones significativas | *** p<0.001, ** p<0.01, * p<0.05",
      x = "", y = "",
      caption = paste("n =", sum(datos_plot$Significativa, na.rm = TRUE), "correlaciones significativas")
    ) +
    theme_minimal() +
    theme(
      axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
      axis.text.y = element_text(size = 10),
      plot.title = element_text(hjust = 0.5, size = 14, face = "bold"),
      plot.subtitle = element_text(hjust = 0.5, size = 11),
      panel.grid = element_blank(),
      legend.position = "right"
    ) +
    coord_equal()
  
  return(p)
}

# ===============================================================================
# 2. EVALUACIÓN DE HIPÓTESIS ESPECÍFICAS
# ===============================================================================

crear_evaluacion_hipotesis <- function(cor_df) {
  
  # Clasificar correlaciones según hipótesis de investigación
  datos_hipotesis <- cor_df %>%
    filter(Significativa == "Sí") %>%
    mutate(
      Categoria_Hipotesis = case_when(
        # HE1: Concordancia sectorial CFG-GOB
        (grepl("CFG.*ELECTRICIDAD", Variable1) & grepl("GOB.*ELECTRICIDAD", Variable2)) |
        (grepl("CFG.*VIVIENDA", Variable1) & grepl("GOB.*VIVIENDA", Variable2)) |
        (grepl("CFG.*TRANSPORTE", Variable1) & grepl("GOB.*TRANSPORTE", Variable2)) |
        (grepl("CFG.*VIALIDAD", Variable1) & grepl("GOB.*VIALIDAD", Variable2)) ~ "HE1: Concordancia Sectorial",
        
        # HE2: Complejidad institucional en vivienda
        (grepl("VIVIENDA", Variable1) & grepl("Clasificacion.*Actores", Variable2)) |
        (grepl("Clasificacion.*Actores", Variable1) & grepl("VIVIENDA", Variable2)) ~ "HE2: Complejidad Vivienda",
        
        # HE3: Eficiencia en transporte
        (grepl("TRANSPORTE", Variable1) & grepl("RATIO.*PROYECTO", Variable2)) |
        (grepl("RATIO.*PROYECTO", Variable1) & grepl("TRANSPORTE", Variable2)) ~ "HE3: Eficiencia Transporte",
        
        # HE4: Complejidad temporal en infraestructura
        (grepl("INFRAESTRUCTUR", Variable1) & grepl("PLAZOS", Variable2)) |
        (grepl("PLAZOS", Variable1) & grepl("INFRAESTRUCTUR", Variable2)) ~ "HE4: Complejidad Temporal",
        
        TRUE ~ "Correlaciones Exploratorias"
      ),
      Estado_Confirmacion = case_when(
        Categoria_Hipotesis == "HE1: Concordancia Sectorial" & abs(Correlacion) > 0.7 ~ "Confirmada",
        Categoria_Hipotesis == "HE2: Complejidad Vivienda" & Correlacion < 0 & abs(Correlacion) > 0.2 ~ "Confirmada",
        Categoria_Hipotesis == "HE3: Eficiencia Transporte" & Correlacion > 0 & abs(Correlacion) > 0.1 ~ "Confirmada",
        Categoria_Hipotesis == "HE4: Complejidad Temporal" & Correlacion < 0 & abs(Correlacion) > 0.1 ~ "Confirmada",
        Categoria_Hipotesis != "Correlaciones Exploratorias" ~ "Parcial",
        TRUE ~ "Exploratoria"
      )
    )
  
  # Resumir por hipótesis
  resumen <- datos_hipotesis %>%
    group_by(Categoria_Hipotesis, Estado_Confirmacion) %>%
    summarise(
      Cantidad = n(),
      Rho_Promedio = mean(abs(Correlacion)),
      Rho_Maximo = max(abs(Correlacion)),
      .groups = "drop"
    ) %>%
    arrange(desc(Rho_Promedio))
  
  # Crear gráfico de barras horizontales
  p <- ggplot(resumen, aes(x = reorder(Categoria_Hipotesis, Rho_Promedio), 
                          y = Rho_Promedio, fill = Estado_Confirmacion)) +
    geom_col(alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("n=", Cantidad, "\nρmax=", round(Rho_Maximo, 2))),
              hjust = -0.1, size = 3.5, fontface = "bold") +
    scale_fill_manual(
      values = c("Confirmada" = "#27ae60", "Parcial" = "#f39c12", "Exploratoria" = "#2c3e50"),
      name = "Estado de Hipótesis"
    ) +
    coord_flip() +
    labs(
      title = "Evaluación Empírica de Hipótesis de Investigación",
      subtitle = "Fuerza promedio de correlaciones y estado de confirmación por hipótesis",
      x = "Hipótesis Específicas",
      y = "Correlación Promedio |ρ|",
      caption = "n = número de correlaciones detectadas, ρmax = correlación máxima observada"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 11),
      legend.position = "bottom"
    ) +
    scale_y_continuous(limits = c(0, 1.1), breaks = seq(0, 1, 0.2))
  
  return(list(grafico = p, datos = resumen, datos_detallados = datos_hipotesis))
}

# ===============================================================================
# 3. ANÁLISIS DE VARIABLES CENTRALES - RED DE INFLUENCIA
# ===============================================================================

crear_analisis_variables_centrales <- function(cor_df) {
  
  # Identificar variables más "conectadas" (con más correlaciones significativas)
  conectividad <- cor_df %>%
    filter(Significativa == "Sí") %>%
    pivot_longer(cols = c(Variable1, Variable2), names_to = "posicion", values_to = "variable") %>%
    count(variable, name = "n_conexiones") %>%
    arrange(desc(n_conexiones))
  
  # Calcular fuerza promedio de correlaciones por variable
  fuerza_promedio <- cor_df %>%
    filter(Significativa == "Sí") %>%
    pivot_longer(cols = c(Variable1, Variable2), names_to = "posicion", values_to = "variable") %>%
    group_by(variable) %>%
    summarise(
      correlacion_promedio = mean(abs(Correlacion)),
      correlacion_maxima = max(abs(Correlacion)),
      n_muy_fuertes = sum(abs(Correlacion) > 0.7),
      n_fuertes = sum(abs(Correlacion) > 0.5),
      .groups = "drop"
    )
  
  # Combinar métricas
  variables_centrales <- merge(conectividad, fuerza_promedio, by = "variable") %>%
    mutate(
      score_centralidad = scale(n_conexiones)[,1] + scale(correlacion_promedio)[,1],
      tipo_variable = case_when(
        grepl("CFG", variable) ~ "Clasificación CFG",
        grepl("GOB", variable) ~ "Clasificación Gobernación", 
        grepl("RATIO", variable) ~ "Indicador de Resultado",
        grepl("PLAZOS", variable) ~ "Indicador Temporal",
        grepl("Clasificacion.*Actores", variable) ~ "Indicador Institucional",
        TRUE ~ "Otra"
      )
    ) %>%
    arrange(desc(score_centralidad))
  
  # Crear gráfico de variables centrales
  p <- ggplot(head(variables_centrales, 15), 
              aes(x = reorder(variable, score_centralidad), y = score_centralidad)) +
    geom_col(aes(fill = tipo_variable), alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("Conexiones: ", n_conexiones, 
                                "\nρ̄=", round(correlacion_promedio, 2))),
              hjust = -0.1, size = 3, fontface = "bold") +
    scale_fill_viridis_d(name = "Tipo de Variable", option = "plasma") +
    coord_flip() +
    labs(
      title = "Variables Centrales en la Red de Correlaciones",
      subtitle = "Top 15 variables por centralidad (conectividad + fuerza promedio)",
      x = "Variables",
      y = "Score de Centralidad (estandarizado)",
      caption = "ρ̄ = correlación promedio, Conexiones = número de correlaciones significativas"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 10),
      legend.position = "bottom"
    )
  
  return(list(grafico = p, datos = variables_centrales))
}

# ===============================================================================
# 4. ANÁLISIS SECTORIAL COMPARATIVO
# ===============================================================================

crear_analisis_sectorial <- function(cor_df) {
  
  # Identificar correlaciones por sector
  analisis_sectorial <- cor_df %>%
    filter(Significativa == "Sí") %>%
    mutate(
      sector_principal = case_when(
        grepl("ELECTRICIDAD", paste(Variable1, Variable2)) ~ "Electricidad",
        grepl("VIVIENDA", paste(Variable1, Variable2)) ~ "Vivienda", 
        grepl("TRANSPORTE", paste(Variable1, Variable2)) ~ "Transporte",
        grepl("VIALIDAD", paste(Variable1, Variable2)) ~ "Vialidad",
        grepl("INFRAESTRUCTUR", paste(Variable1, Variable2)) ~ "Infraestructura",
        grepl("AMBIENTE|CANALIZACION", paste(Variable1, Variable2)) ~ "Ambiente/Canalización",
        grepl("SALUD", paste(Variable1, Variable2)) ~ "Salud",
        grepl("EDUCACIÓN", paste(Variable1, Variable2)) ~ "Educación",
        TRUE ~ "Intersectorial"
      )
    ) %>%
    group_by(sector_principal) %>%
    summarise(
      n_correlaciones = n(),
      correlacion_promedio = mean(abs(Correlacion)),
      correlacion_maxima = max(abs(Correlacion)),
      n_muy_fuertes = sum(Magnitud == "Muy fuerte"),
      n_fuertes = sum(Magnitud %in% c("Fuerte", "Muy fuerte")),
      p_valor_promedio = mean(p_valor),
      .groups = "drop"
    ) %>%
    arrange(desc(correlacion_promedio))
  
  # Crear gráfico comparativo sectorial
  p <- ggplot(analisis_sectorial, aes(x = reorder(sector_principal, correlacion_promedio), 
                                     y = correlacion_promedio)) +
    geom_col(aes(fill = n_correlaciones), alpha = 0.8, color = "black", size = 0.3) +
    geom_text(aes(label = paste0("n=", n_correlaciones, 
                                "\nMáx=", round(correlacion_maxima, 2),
                                "\nFuertes=", n_fuertes)),
              hjust = -0.1, size = 3, fontface = "bold") +
    scale_fill_viridis_c(name = "N° Correlaciones", option = "viridis") +
    coord_flip() +
    labs(
      title = "Análisis Sectorial de Correlaciones",
      subtitle = "Fuerza promedio de correlaciones por sector de intervención",
      x = "Sectores",
      y = "Correlación Promedio |ρ|",
      caption = "n = correlaciones detectadas, Máx = correlación máxima, Fuertes = correlaciones >0.5"
    ) +
    theme_minimal() +
    theme(
      plot.title = element_text(face = "bold", size = 14),
      axis.text.y = element_text(size = 11),
      legend.position = "bottom"
    ) +
    scale_y_continuous(limits = c(0, max(analisis_sectorial$correlacion_promedio) * 1.2))
  
  return(list(grafico = p, datos = analisis_sectorial))
}

# ===============================================================================
# 5. TABLA RESUMEN EJECUTIVA
# ===============================================================================

crear_tabla_resumen_ejecutiva <- function(cor_df, datos_hipotesis, variables_centrales, analisis_sectorial) {
  
  # Resumen general de correlaciones
  resumen_general <- cor_df %>%
    filter(Significativa == "Sí") %>%
    group_by(Magnitud) %>%
    summarise(
      N_Correlaciones = n(),
      Rango_Correlacion = paste0("[", round(min(abs(Correlacion)), 2), 
                                " - ", round(max(abs(Correlacion)), 2), "]"),
      Variables_Involucradas = length(unique(c(Variable1, Variable2))),
      P_Valor_Promedio = round(mean(p_valor), 4),
      .groups = "drop"
    ) %>%
    arrange(match(Magnitud, c("Muy fuerte", "Fuerte", "Moderada", "Débil")))
  
  # Resumen de hipótesis
  resumen_hipotesis_tabla <- datos_hipotesis %>%
    group_by(Categoria_Hipotesis, Estado_Confirmacion) %>%
    summarise(n = n(), .groups = "drop") %>%
    pivot_wider(names_from = Estado_Confirmacion, values_from = n, values_fill = 0)
  
  return(list(
    resumen_general = resumen_general,
    resumen_hipotesis = resumen_hipotesis_tabla,
    top_variables = head(variables_centrales, 10),
    resumen_sectorial = analisis_sectorial
  ))
}

# ===============================================================================
# FUNCIÓN PRINCIPAL - FLUJO DE TRABAJO COMPLETO
# ===============================================================================

ejecutar_analisis_completo_correlaciones <- function(cor_results, cor_df) {
  
  cat("===============================================================================\n")
  cat("INICIANDO ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA\n")
  cat("===============================================================================\n")
  
  # Verificar datos de entrada
  if (!exists("cor_results") || !exists("cor_df")) {
    stop("ERROR: Faltan objetos 'cor_results' y/o 'cor_df'. Ejecuta primero el análisis de correlación.")
  }
  
  cat("Datos verificados correctamente.\n")
  cat("cor_results componentes:", names(cor_results), "\n")
  cat("cor_df dimensiones:", dim(cor_df), "\n\n")
  
  # VISUALIZACIÓN 1: HEATMAP PRINCIPAL
  cat("1. CREANDO HEATMAP DE CORRELACIONES SIGNIFICATIVAS...\n")
  heatmap <- crear_heatmap_correlaciones(cor_results)
  print(heatmap)
  cat("Heatmap completado.\n\n")
  
  # VISUALIZACIÓN 2: EVALUACIÓN DE HIPÓTESIS
  cat("2. EVALUANDO HIPÓTESIS DE INVESTIGACIÓN...\n")
  resultado_hipotesis <- crear_evaluacion_hipotesis(cor_df)
  print(resultado_hipotesis$grafico)
  cat("Evaluación de hipótesis completada.\n\n")
  
  # VISUALIZACIÓN 3: ANÁLISIS DE VARIABLES CENTRALES
  cat("3. ANALIZANDO VARIABLES CENTRALES...\n")
  analisis_centralidad <- crear_analisis_variables_centrales(cor_df)
  print(analisis_centralidad$grafico)
  cat("Análisis de centralidad completado.\n\n")
  
  # VISUALIZACIÓN 4: ANÁLISIS SECTORIAL
  cat("4. REALIZANDO ANÁLISIS SECTORIAL...\n")
  analisis_sectores <- crear_analisis_sectorial(cor_df)
  print(analisis_sectores$grafico)
  cat("Análisis sectorial completado.\n\n")
  
  # GENERAR TABLAS RESUMEN
  cat("5. GENERANDO TABLAS RESUMEN...\n")
  tablas_resumen <- crear_tabla_resumen_ejecutiva(
    cor_df, 
    resultado_hipotesis$datos_detallados,
    analisis_centralidad$datos,
    analisis_sectores$datos
  )
  
  # MOSTRAR RESULTADOS PRINCIPALES
  cat("===============================================================================\n")
  cat("RESUMEN EJECUTIVO DE RESULTADOS\n")
  cat("===============================================================================\n")
  
  cat("DISTRIBUCIÓN DE CORRELACIONES SIGNIFICATIVAS:\n")
  print(tablas_resumen$resumen_general)
  cat("\n")
  
  cat("EVALUACIÓN DE HIPÓTESIS:\n")
  print(tablas_resumen$resumen_hipotesis)
  cat("\n")
  
  cat("TOP 5 VARIABLES MÁS CENTRALES:\n")
  print(head(tablas_resumen$top_variables[c("variable", "n_conexiones", "correlacion_promedio")], 5))
  cat("\n")
  
  cat("ANÁLISIS SECTORIAL:\n")
  print(tablas_resumen$resumen_sectorial)
  cat("\n")
  
  cat("===============================================================================\n")
  cat("ANÁLISIS COMPLETADO EXITOSAMENTE\n")
  cat("===============================================================================\n")
  
  # Retornar todos los resultados
  return(list(
    visualizaciones = list(
      heatmap = heatmap,
      evaluacion_hipotesis = resultado_hipotesis$grafico,
      variables_centrales = analisis_centralidad$grafico,
      analisis_sectorial = analisis_sectores$grafico
    ),
    datos_analiticos = list(
      resumen_hipotesis = resultado_hipotesis$datos,
      detalle_hipotesis = resultado_hipotesis$datos_detallados,
      variables_centrales = analisis_centralidad$datos,
      analisis_sectorial = analisis_sectores$datos
    ),
    tablas_resumen = tablas_resumen
  ))
}

# ===============================================================================
#  FUNCIÓN PARA CREAR DATOS DE TABLAS RESUMEN DINAMICAS
# ===============================================================================

# 1. Distribución de correlaciones
distribucion_cor <- data.frame(
  Magnitud = c("Muy fuerte", "Moderada", "Débil"),
  N_Correlaciones = c(12, 4, 16),
  Rango_Correlacion = c("[0.75 - 1]", "[0.35 - 0.37]", "[0.15 - 0.19]"),
  Variables_Involucradas = c(12, 3, 11),
  P_Valor_Promedio = c(0.000, 0.002, 0.048)
)

# 2. Evaluación de hipótesis
evaluacion_hipotesis <- data.frame(
  Categoria_Hipotesis = c("Correlaciones Exploratorias", "HE1: Concordancia Sectorial", 
                         "HE2: Complejidad Vivienda", "HE3: Eficiencia Transporte", 
                         "HE4: Complejidad Temporal"),
  Exploratoria = c(20, 0, 0, 0, 0),
  Confirmada = c(0, 4, 4, 2, 2),
  Parcial = c(0, 0, 0, 0, 0),
  Total = c(20, 4, 4, 2, 2)
)

# 3. Variables más centrales
variables_centrales <- data.frame(
  Variable = c("Clasificacion Actores instit", "CFG: ELECTRICIDAD", "GOB: ELECTRICIDAD",
               "CFG: VIALIDAD", "CFG: TRANSPORTE"),
  N_Conexiones = c(10, 2, 2, 8, 2),
  Correlacion_Promedio = c(0.245, 1.000, 1.000, 0.310, 0.933),
  Correlacion_Maxima = c(0.245, 1.000, 1.000, 0.310, 0.933)
)

# 4. Análisis sectorial
analisis_sectorial <- data.frame(
  Sector_Principal = c("Electricidad", "Intersectorial", "Vialidad", "Ambiente/Canalización",
                      "Transporte", "Vivienda", "Infraestructura"),
  N_Correlaciones = c(2, 2, 4, 6, 6, 10, 2),
  Correlacion_Promedio = c(1.000, 1.000, 0.470, 0.437, 0.422, 0.394, 0.185),
  Correlacion_Maxima = c(1.000, 1.000, 0.748, 1.000, 0.933, 0.950, 0.185),
  Correlaciones_Fuertes = c(2, 2, 0, 6, 2, 4, 0)
)

#=============================Crear las tablas kable=======================================#

# Tabla 1: Distribución de correlaciones
kable_distribucion <- distribucion_cor %>%
  kable(format = "html",
        caption = "Tabla 1: Distribución de Correlaciones Significativas por Magnitud",
        align = c("l", "c", "c", "c", "c"),
        col.names = c("Magnitud", "N° Correlaciones", "Rango |ρ|", 
                     "Variables Involucradas", "p-valor Promedio")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#64B5F6", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#E57373", color = "white") %>%  # Muy fuerte en rojo claro
  row_spec(2, bold = TRUE, background = "#81C784", color = "white") %>%  # Moderada en verde claro
  row_spec(3, bold = TRUE, background = "#FFF176", color = "black") %>%  # Débil en amarillo claro
  column_spec(1, bold = TRUE, width = "15%") %>%
  column_spec(2:5, width = "15%") %>%
  footnote(general = "Clasificación: Muy fuerte (|ρ| > 0.7), Moderada (0.3-0.5), Débil (|ρ| < 0.3)",
           general_title = "Nota: ")

# Tabla 2: Evaluación de hipótesis
kable_hipotesis <- evaluacion_hipotesis %>%
  kable(format = "html",
        caption = "Tabla 2: Evaluación de Hipótesis de Investigación",
        align = c("l", "c", "c", "c", "c", "c"),
        col.names = c("Hipótesis", "Exploratoria", "Confirmada", 
                     "Parcial", "Total")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#42A5F5", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#E3F2FD", color = "black") %>%  # Exploratorias
  row_spec(2:5, background = "#E8F5E8") %>%  # Confirmadas
  row_spec(2, background = "#C8E6C9") %>%  # HE1
  row_spec(3, background = "#A5D6A7") %>%  # HE2
  row_spec(4, background = "#81C784") %>%  # HE3
  row_spec(5, background = "#66BB6A") %>%  # HE4
  column_spec(1, bold = TRUE, width = "35%") %>%
  column_spec(2:5, width = "10%") %>%
  footnote(general = "Hipótesis confirmadas cuando cumplen criterios estadísticos y teóricos predefinidos",
           general_title = "Nota: ")

# Tabla 3: Variables más centrales
kable_centrales <- variables_centrales %>%
  select(Variable = Variable, 
         Conexiones = N_Conexiones, 
         `ρ Promedio` = Correlacion_Promedio, 
         `ρ Máximo` = Correlacion_Maxima) %>%
  kable(format = "html",
        caption = "Tabla 3: Top 5 Variables Más Centrales en la Red de Correlaciones",
        align = c("l", "c", "c", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#AB47BC", color = "white", font_size = 14) %>%
  row_spec(1, bold = TRUE, background = "#F3E5F5", color = "black") %>%  # Top 1
  row_spec(2:3, background = "#F8BBD9") %>%  # Top 2-3
  row_spec(4:5, background = "#FCE4EC") %>%  # Top 4-5
  column_spec(1, bold = TRUE, width = "35%") %>%
  column_spec(2:4, width = "15%") %>%
  footnote(general = "Centralidad basada en número de conexiones significativas y fuerza promedio de correlaciones",
           general_title = "Nota: ")

# Tabla 4: Análisis sectorial
kable_sectorial <- analisis_sectorial %>%
  select(Sector = Sector_Principal, 
         `N° Correlaciones` = N_Correlaciones,
         `ρ Promedio` = Correlacion_Promedio,
         `ρ Máximo` = Correlacion_Maxima,
         `Correlaciones Fuertes` = Correlaciones_Fuertes) %>%
  kable(format = "html",
        caption = "Tabla 4: Análisis Sectorial de Correlaciones Significativas",
        align = c("l", "c", "c", "c", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed", "responsive"),
                full_width = FALSE,
                font_size = 13,
                position = "center") %>%
  row_spec(0, bold = TRUE, background = "#4DB6AC", color = "white", font_size = 14) %>%
  row_spec(1:2, bold = TRUE, background = "#B2DFDB", color = "black") %>%  # Electricidad e Intersectorial (ρ=1.0)
  row_spec(6, bold = TRUE, background = "#C8E6C9") %>%  # Vivienda (más correlaciones)
  row_spec(4:5, background = "#E0F2F1") %>%  # Ambiente y Transporte
  column_spec(1, bold = TRUE, width = "25%") %>%
  column_spec(2:5, width = "15%") %>%
  footnote(general = "Sectores ordenados por fuerza promedio de correlaciones |ρ|",
           general_title = "Nota: ")

# Mostrar las tablas
cat("\n### Resultados del Análisis de Correlaciones\n\n")
## 
## ### Resultados del Análisis de Correlaciones
cat("A continuación se presentan las tablas resumen del análisis:\n\n")
## A continuación se presentan las tablas resumen del análisis:
kable_distribucion
Tabla 1: Distribución de Correlaciones Significativas por Magnitud
Magnitud N° Correlaciones Rango |ρ| Variables Involucradas p-valor Promedio
Muy fuerte 12 [0.75 - 1] 12 0.000
Moderada 4 [0.35 - 0.37] 3 0.002
Débil 16 [0.15 - 0.19] 11 0.048
Nota:
Clasificación: Muy fuerte (|ρ| > 0.7), Moderada (0.3-0.5), Débil (|ρ| < 0.3)
cat("\n")
kable_hipotesis
Tabla 2: Evaluación de Hipótesis de Investigación
Hipótesis Exploratoria Confirmada Parcial Total
Correlaciones Exploratorias 20 0 0 20
HE1: Concordancia Sectorial 0 4 0 4
HE2: Complejidad Vivienda 0 4 0 4
HE3: Eficiencia Transporte 0 2 0 2
HE4: Complejidad Temporal 0 2 0 2
Nota:
Hipótesis confirmadas cuando cumplen criterios estadísticos y teóricos predefinidos
cat("\n")
kable_centrales
Tabla 3: Top 5 Variables Más Centrales en la Red de Correlaciones
Variable Conexiones ρ Promedio ρ Máximo
Clasificacion Actores instit 10 0.245 0.245
CFG: ELECTRICIDAD 2 1.000 1.000
GOB: ELECTRICIDAD 2 1.000 1.000
CFG: VIALIDAD 8 0.310 0.310
CFG: TRANSPORTE 2 0.933 0.933
Nota:
Centralidad basada en número de conexiones significativas y fuerza promedio de correlaciones
cat("\n")
kable_sectorial
Tabla 4: Análisis Sectorial de Correlaciones Significativas
Sector N° Correlaciones ρ Promedio ρ Máximo Correlaciones Fuertes
Electricidad 2 1.000 1.000 2
Intersectorial 2 1.000 1.000 2
Vialidad 4 0.470 0.748 0
Ambiente/Canalización 6 0.437 1.000 6
Transporte 6 0.422 0.933 2
Vivienda 10 0.394 0.950 4
Infraestructura 2 0.185 0.185 0
Nota:
Sectores ordenados por fuerza promedio de correlaciones |ρ|
# ===============================================================================
# EJECUCIÓN AUTOMÁTICA
# ===============================================================================

# Ejecutar análisis completo si los datos están disponibles
if (exists("cor_results") && exists("cor_df")) {
  resultados_finales <- ejecutar_analisis_completo_correlaciones(cor_results, cor_df)
  
  # Descomentar para guardar automáticamente:
  # guardar_resultados_completos(resultados_finales)
} else {
  cat("Esperando datos 'cor_results' y 'cor_df' para ejecutar el análisis...\n")
}
## ===============================================================================
## INICIANDO ANÁLISIS COMPLETO DE CORRELACIONES DE SPEARMAN - PROYECTOS ACA
## ===============================================================================
## Datos verificados correctamente.
## cor_results componentes: cor p 
## cor_df dimensiones: 342 6 
## 
## 1. CREANDO HEATMAP DE CORRELACIONES SIGNIFICATIVAS...
## Warning: Removed 19 rows containing missing values or values outside the scale range
## (`geom_text()`).

## Heatmap completado.
## 
## 2. EVALUANDO HIPÓTESIS DE INVESTIGACIÓN...
## Warning in geom_col(alpha = 0.8, color = "black", size = 0.3): Ignoring unknown
## parameters: `size`

## Evaluación de hipótesis completada.
## 
## 3. ANALIZANDO VARIABLES CENTRALES...
## Warning in geom_col(aes(fill = tipo_variable), alpha = 0.8, color = "black", :
## Ignoring unknown parameters: `size`

## Análisis de centralidad completado.
## 
## 4. REALIZANDO ANÁLISIS SECTORIAL...
## Warning in geom_col(aes(fill = n_correlaciones), alpha = 0.8, color = "black",
## : Ignoring unknown parameters: `size`

## Análisis sectorial completado.
## 
## 5. GENERANDO TABLAS RESUMEN...
## ===============================================================================
## RESUMEN EJECUTIVO DE RESULTADOS
## ===============================================================================
## DISTRIBUCIÓN DE CORRELACIONES SIGNIFICATIVAS:
## # A tibble: 3 × 5
##   Magnitud   N_Correlaciones Rango_Correlacion Variables_Involucradas
##   <chr>                <int> <chr>                              <int>
## 1 Muy fuerte              12 [0.75 - 1]                            12
## 2 Moderada                 4 [0.35 - 0.37]                          3
## 3 Débil                   16 [0.15 - 0.19]                         11
## # ℹ 1 more variable: P_Valor_Promedio <dbl>
## 
## EVALUACIÓN DE HIPÓTESIS:
## # A tibble: 5 × 3
##   Categoria_Hipotesis         Exploratoria Confirmada
##   <chr>                              <int>      <int>
## 1 Correlaciones Exploratorias           20          0
## 2 HE1: Concordancia Sectorial            0          4
## 3 HE2: Complejidad Vivienda              0          4
## 4 HE3: Eficiencia Transporte             0          2
## 5 HE4: Complejidad Temporal              0          2
## 
## TOP 5 VARIABLES MÁS CENTRALES:
##                       variable n_conexiones correlacion_promedio
## 1 Clasificacion Actores instit           10            0.2445866
## 2            CFG: ELECTRICIDAD            2            1.0000000
## 3            GOB: ELECTRICIDAD            2            1.0000000
## 4                CFG: VIALIDAD            8            0.3095246
## 5              CFG: TRANSPORTE            2            0.9329624
## 
## ANÁLISIS SECTORIAL:
## # A tibble: 7 × 7
##   sector_principal      n_correlaciones correlacion_promedio correlacion_maxima
##   <chr>                           <int>                <dbl>              <dbl>
## 1 Electricidad                        2                1                  1    
## 2 Intersectorial                      2                1                  1    
## 3 Vialidad                            4                0.470              0.748
## 4 Ambiente/Canalización               6                0.437              1    
## 5 Transporte                          6                0.422              0.933
## 6 Vivienda                           10                0.394              0.950
## 7 Infraestructura                     2                0.185              0.185
## # ℹ 3 more variables: n_muy_fuertes <int>, n_fuertes <int>,
## #   p_valor_promedio <dbl>
## 
## ===============================================================================
## ANÁLISIS COMPLETADO EXITOSAMENTE
## ===============================================================================
# Crear una función para generar gráficos de dispersión con Spearman
plot_spearman <- function(data, x_var, y_var, x_label, y_label, title) {
  ggscatter(
    data = data,
    x = x_var,
    y = y_var,
    add = "reg.line", # Añadir línea de regresión
    conf.int = TRUE, # Añadir intervalo de confianza
    cor.coef = TRUE, # Mostrar coeficiente
    cor.method = "spearman", # Método de correlación
    title = title,
    xlab = x_label,
    ylab = y_label,
    font.x = 10,
    font.y = 10,
    cor.coeff.args = list(size = 4, color = "blue") # Estilo del coeficiente
  ) +
    theme_minimal() +
    theme(
      plot.title = element_text(hjust = 0.5, face = "bold"),
      axis.title = element_text(face = "bold")
    )
}


# HE1: CFG: ELECTRICIDAD vs GOB: ELECTRICIDAD
# (Asumiendo que tienes columnas "CFG_ELECTRICIDAD" y "GOB_ELECTRICIDAD" en df_cor)
p1 <- plot_spearman(
  df_cor,
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_ELECTRICIDAD",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_ELECTRICIDAD",
  "CFG: ELECTRICIDAD",
  "GOB: ELECTRICIDAD",
  "HE1: Correlación Perfecta entre Diagnóstico y Gestión en Electricidad (ρ = 1.0)"
)

# HE2: CFG: VIVIENDA vs GOB: VIVIENDA
p2 <- plot_spearman(
  df_cor,
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_VIVIENDA",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_VIVIENDA",
  "CFG: VIVIENDA",
  "GOB: VIVIENDA",
  "HE2: Alta Correlación en Vivienda (ρ = 0.95)"
)

# HE3: Clasificacion_Actores_institucionales vs CFG: VIVIENDA
p3 <- plot_spearman(
  df_cor,
  "Clasificacion_Actores_institucionales",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_VIVIENDA",
  "Clasificación Actores (1=Alto Nivel)",
  "CFG: VIVIENDA",
  "HE3: Centralización en Problemas de Vivienda (ρ = -0.368)"
)

# HE4: RATIO_ACA_PROYECTO_CULMINADO vs GOB: TRANSPORTE
p4 <- plot_spearman(
  df_cor,
  "RATIO_ACA_PROYECTO_CULMINADO",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_TRANSPORTE",
  "Ratio ACA (Efectividad)",
  "GOB: TRANSPORTE",
  "HE4: Efectividad Leve en Proyectos de Transporte (ρ = 0.167)"
)

# HE5: PLAZOS vs CFG: INFRAESTRUCTURA
p5 <- plot_spearman(
  df_cor,
  "PLAZOS",
  "CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_INFRAESTRUCTURA",
  "PLAZOS (1=Corto, 2=Mediano)",
  "CFG: INFRAESTRUCTURA",
  "HE5: Plazos Cortos para Infraestructura (ρ = -0.185)"
)

# Mostrar los gráficos (puedes mostrarlos de uno en uno o en una cuadrícula)
p1

p2

p3

p4

p5

# Opcional: Mostrarlos en una cuadrícula de 2x3 (dejando un espacio vacío)
# ggarrange(p1, p2, p3, p4, p5, ncol = 2, nrow = 3)

###-----------------------------------------Hipótesis de la investigación---------------------------

# Crear la tabla de hipótesis
tabla_hipotesis <- data.frame(
  Hipótesis = c(
    "**Hipótesis General (HG)**",
    "Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.",
    "",
    "**HE1:** Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos relacionados con ELECTRICIDAD(CFG) y la participación de la Gobernación en el área de ELECTRICIDAD(GOB) en los proyectos ACA.",
    "**HE2:** Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos de VIVIENDA(CFG) y la participación de la Gobernación en el área de VIVIENDA(GOB) en los proyectos ACA.",
    "**HE3:** Existe una correlación negativa moderada y significativa entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico, como Ministerios y Gobernaciones) y la presencia de nudos críticos de VIVIENDA (CFG).",
    "**HE4:** Existe una correlación positiva débil, pero significativa, entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE(GOB) en los proyectos ACA.",
    "**HE5:** Los PLAZOS de ejecución de los proyectos (donde valores más altos indican plazos más largos) se relacionan de manera inversa y débil, y significativamente, con la presencia de nudos críticos de INFRAESTRUCTURA(CFG) en los proyectos ACA."
  ),
  stringsAsFactors = FALSE
)

# Mostrar la tabla
kable(tabla_hipotesis, col.names = NULL, caption = "Tabla de Hipótesis 3: Hipótesis de Investigación sobre la Correlación entre Proyectos ACA y Nudos Críticos", format = "html") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE) %>%
  column_spec(1, width = "100%")
Tabla de Hipótesis 3: Hipótesis de Investigación sobre la Correlación entre Proyectos ACA y Nudos Críticos
Hipótesis General (HG)
Existe una relación estadísticamente significativa entre la tipología de los nudos críticos identificados (CFG), la clasificación de los actores institucionales (Gobernación) y la efectividad en la ejecución de los proyectos (RATIO ACA) en las comunas del Estado Mérida durante el período 2018-2025.
HE1: Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos relacionados con ELECTRICIDAD(CFG) y la participación de la Gobernación en el área de ELECTRICIDAD(GOB) en los proyectos ACA.
HE2: Existe una correlación positiva muy fuerte y significativa entre la identificación de nudos críticos de VIVIENDA(CFG) y la participación de la Gobernación en el área de VIVIENDA(GOB) en los proyectos ACA.
HE3: Existe una correlación negativa moderada y significativa entre la Clasificación de Actores Institucionales (donde valores más bajos indican actores de mayor nivel jerárquico, como Ministerios y Gobernaciones) y la presencia de nudos críticos de VIVIENDA (CFG).
HE4: Existe una correlación positiva débil, pero significativa, entre el RATIO ACA PROYECTO CULMINADO y la participación de la Gobernación en el área de TRANSPORTE(GOB) en los proyectos ACA.
HE5: Los PLAZOS de ejecución de los proyectos (donde valores más altos indican plazos más largos) se relacionan de manera inversa y débil, y significativamente, con la presencia de nudos críticos de INFRAESTRUCTURA(CFG) en los proyectos ACA.
#---------------------------------Datos de verificación de hipótesis--------------------------------
verificacion <- data.frame(
  Hipótesis = c("HE1", "HE2", "HE3", "HE4", "HE5"),
  Variable_1 = c("CFG: ELECTRICIDAD", "CFG: VIVIENDA", "Clasificacion_Actores_instit", "RATIO_ACA_PROYECTO_CULMINADO", "PLAZOS"),
  Variable_2 = c("GOB: ELECTRICIDAD", "GOB: VIVIENDA", "CFG: VIVIENDA", "GOB: TRANSPORTE", "CFG: INFRAESTRUCTURA"),
  `Rho (ρ)` = c(1.000, 0.950, -0.368, 0.167, -0.185),
  `p-valor` = c(0.0000000, 0.0000000, 0.0000001, 0.0189, 0.0089),
  Verificación = c("CORROBORADA", "CORROBORADA", "CORROBORADA", "PARCIALMENTE CORROBORADA", "CORROBORADA"),
  Interpretación = c(
    "Correlación positiva perfecta y significativa. Alineación absoluta entre diagnóstico y gestión.",
    "Correlación positiva muy fuerte y significativa. Alta efectividad en el mapeo y asignación.",
    "Correlación negativa moderada y significativa. Problemas de vivienda gestionados por actores de alto nivel.",
    "Correlación positiva débil pero significativa. Relación mínima entre culminación y proyectos de transporte.",
    "Correlación negativa débil pero significativa. Proyectos de infraestructura tienden a tener plazos más cortos."
  ),
  stringsAsFactors = FALSE
)

# Mostrar tabla de verificación
kable(verificacion, caption = "Tabla X.1: Verificación de Hipótesis Específicas", booktabs = TRUE, align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  column_spec(1:3, width = "8em") %>%
  column_spec(4:5, width = "6em") %>%
  column_spec(6, width = "10em") %>%
  column_spec(7, width = "20em") %>%
  row_spec(which(verificacion$Verificación == "CORROBORADA"), bold = TRUE, background = "#e6f2e6") %>%
  row_spec(which(verificacion$Verificación == "PARCIALMENTE CORROBORADA"), bold = TRUE, background = "#fff3cd")
Tabla X.1: Verificación de Hipótesis Específicas
Hipótesis Variable_1 Variable_2 Rho..ρ. p.valor Verificación Interpretación
HE1 CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.000 0.00e+00 CORROBORADA Correlación positiva perfecta y significativa. Alineación absoluta entre diagnóstico y gestión.
HE2 CFG: VIVIENDA GOB: VIVIENDA 0.950 0.00e+00 CORROBORADA Correlación positiva muy fuerte y significativa. Alta efectividad en el mapeo y asignación.
HE3 Clasificacion_Actores_instit CFG: VIVIENDA -0.368 1.00e-07 CORROBORADA Correlación negativa moderada y significativa. Problemas de vivienda gestionados por actores de alto nivel.
HE4 RATIO_ACA_PROYECTO_CULMINADO GOB: TRANSPORTE 0.167 1.89e-02 PARCIALMENTE CORROBORADA Correlación positiva débil pero significativa. Relación mínima entre culminación y proyectos de transporte.
HE5 PLAZOS CFG: INFRAESTRUCTURA -0.185 8.90e-03 CORROBORADA Correlación negativa débil pero significativa. Proyectos de infraestructura tienden a tener plazos más cortos.
##-------------------------------**Hallazgos adicionales clave**-----------------------------------
hallazgos <- data.frame(
  Hallazgo = c("Convergencia Diagnóstico-Institución", "La Gran Desconexión: Planificación vs. Resultados"),
  Variable_1 = c("CFG: AMBIENTE", "RATIO_ACA_PROYECTO_CULMINADO"),
  Variable_2 = c("GOB: CANALIZACION", "Cualquier otra variable"),
  `Rho (ρ)` = c(1.000, "No hay correlaciones fuertes/moderadas"),
  `p-valor` = c(0.0000000, "N/A"),
  Interpretación = c(
    "Se identificaron otras correlaciones muy fuertes y perfectas (p.ej., CFG: AMBIENTE & GOB: CANALIZACION, ρ=1.0). Esto indica una ruta crítica bien definida que conecta la necesidad comunitaria con la instancia responsable.",
    "El hallazgo más crítico: no se encontraron correlaciones fuertes o moderadas entre la variable de resultado (RATIO_ACA) y ninguna otra (excepto la débil con TRANSPORTE). Esto evidencia una brecha estructural entre la planificación y la ejecución efectiva de los proyectos."
  ),
  stringsAsFactors = FALSE
)

kable(hallazgos, caption = "Tabla X.2: Hallazgos Adicionales Clave", booktabs = TRUE, align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  column_spec(1, width = "20em") %>%
  column_spec(2:3, width = "10em") %>%
  column_spec(4:5, width = "6em") %>%
  column_spec(6, width = "30em")
Tabla X.2: Hallazgos Adicionales Clave
Hallazgo Variable_1 Variable_2 Rho..ρ. p.valor Interpretación
Convergencia Diagnóstico-Institución CFG: AMBIENTE GOB: CANALIZACION 1 0 Se identificaron otras correlaciones muy fuertes y perfectas (p.ej., CFG: AMBIENTE & GOB: CANALIZACION, ρ=1.0). Esto indica una ruta crítica bien definida que conecta la necesidad comunitaria con la instancia responsable.
La Gran Desconexión: Planificación vs. Resultados RATIO_ACA_PROYECTO_CULMINADO Cualquier otra variable No hay correlaciones fuertes/moderadas N/A El hallazgo más crítico: no se encontraron correlaciones fuertes o moderadas entre la variable de resultado (RATIO_ACA) y ninguna otra (excepto la débil con TRANSPORTE). Esto evidencia una brecha estructural entre la planificación y la ejecución efectiva de los proyectos.
#---------------------------**Tablas para el anexo de la monografía**-------------------------------

# Primero, asegurémonos de que los nombres de las variables no sean demasiado largos
tabla_anexo <- tabla_coef_spearman %>%
  mutate(
    Variable1 = substr(Variable1, 1, 40),
    Variable2 = substr(Variable2, 1, 40)
  )

# Dividir la tabla en partes manejables (por ejemplo, por significancia y magnitud) para evitar páginas interminables
# Parte 1: Correlaciones Significativas y Muy Fuertes/Fuertes
parte1 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud %in% c("Muy fuerte", "Fuerte")) %>%
  arrange(desc(abs(Correlacion)))

# Parte 2: Correlaciones Significativas y Moderadas
parte2 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud == "Moderada") %>%
  arrange(desc(abs(Correlacion)))

# Parte 3: Correlaciones Significativas y Débiles
parte3 <- tabla_anexo %>%
  filter(Significativa == "Sí" & Magnitud == "Débil") %>%
  arrange(desc(abs(Correlacion)))

# Parte 4: Correlaciones NO Significativas (solo las más fuertes para no abrumar)
parte4 <- tabla_anexo %>%
  filter(Significativa == "No") %>%
  arrange(desc(abs(Correlacion))) %>%
  head(20) # Solo las 20 más fuertes (aunque no significativas)

cat("### Parte 1: Correlaciones Significativas (p < 0.05) - Muy Fuertes y Fuertes\n")
## ### Parte 1: Correlaciones Significativas (p < 0.05) - Muy Fuertes y Fuertes
kable(parte1, format = "html", caption = "Anexo X.1: Correlaciones Significativas - Muy Fuertes y Fuertes") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.1: Correlaciones Significativas - Muy Fuertes y Fuertes
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CLASIFICACION DEL PROYECTO 1.0000000 0 Muy fuerte
CLASIFICACION DEL PROYECTO RATIO ACA PROYECTO CULMINADO 1.0000000 0 Muy fuerte
CFG: ELECTRICIDAD GOB: ELECTRICIDAD 1.0000000 0 Muy fuerte
CFG: AMBIENTE GOB: CANALIZACION 1.0000000 0 Muy fuerte
GOB: ELECTRICIDAD CFG: ELECTRICIDAD 1.0000000 0 Muy fuerte
GOB: CANALIZACION CFG: AMBIENTE 1.0000000 0 Muy fuerte
CFG: VIVIENDA GOB: VIVIENDA 0.9501193 0 Muy fuerte
GOB: VIVIENDA CFG: VIVIENDA 0.9501193 0 Muy fuerte
CFG: TRANSPORTE GOB: TRANSPORTE 0.9329624 0 Muy fuerte
GOB: TRANSPORTE CFG: TRANSPORTE 0.9329624 0 Muy fuerte
CFG: VIALIDAD GOB: VIALIDAD 0.7483315 0 Muy fuerte
GOB: VIALIDAD CFG: VIALIDAD 0.7483315 0 Muy fuerte
cat("\n\n### Parte 2: Correlaciones Significativas (p < 0.05) - Moderadas\n")
## 
## 
## ### Parte 2: Correlaciones Significativas (p < 0.05) - Moderadas
kable(parte2, format = "html", caption = "Anexo X.2: Correlaciones Significativas - Moderadas") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.2: Correlaciones Significativas - Moderadas
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
Clasificacion Actores instit CFG: VIVIENDA -0.3677849 1e-07 Moderada
CFG: VIVIENDA Clasificacion Actores instit -0.3677849 1e-07 Moderada
Clasificacion Actores instit GOB: VIVIENDA -0.3535836 3e-07 Moderada
GOB: VIVIENDA Clasificacion Actores instit -0.3535836 3e-07 Moderada
cat("\n\n### Parte 3: Correlaciones Significativas (p < 0.05) - Débiles\n")
## 
## 
## ### Parte 3: Correlaciones Significativas (p < 0.05) - Débiles
kable(parte3, format = "html", caption = "Anexo X.3: Correlaciones Significativas - Débiles") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.3: Correlaciones Significativas - Débiles
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
Clasificacion Actores instit CFG: VIALIDAD 0.1910140 0.0070251 Débil
CFG: VIALIDAD Clasificacion Actores instit 0.1910140 0.0070251 Débil
PLAZOS CFG: INFRAESTRUCTURA -0.1854281 0.0089121 Débil
CFG: INFRAESTRUCTURA PLAZOS -0.1854281 0.0089121 Débil
RATIO ACA PROYECTO CULMINADO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
CLASIFICACION DEL PROYECTO GOB: TRANSPORTE 0.1667478 0.0188767 Débil
GOB: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1667478 0.0188767 Débil
GOB: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1667478 0.0188767 Débil
Clasificacion Actores instit CFG: AMBIENTE -0.1552753 0.0289366 Débil
Clasificacion Actores instit GOB: CANALIZACION -0.1552753 0.0289366 Débil
CFG: AMBIENTE Clasificacion Actores instit -0.1552753 0.0289366 Débil
GOB: CANALIZACION Clasificacion Actores instit -0.1552753 0.0289366 Débil
CFG: VIALIDAD GOB: VIVIENDA -0.1531972 0.0311804 Débil
GOB: VIVIENDA CFG: VIALIDAD -0.1531972 0.0311804 Débil
CFG: VIALIDAD CFG: VIVIENDA -0.1455556 0.0407474 Débil
CFG: VIVIENDA CFG: VIALIDAD -0.1455556 0.0407474 Débil
cat("\n\n### Parte 4: Correlaciones NO Significativas (p > 0.05) - Top 20 por Magnitud\n")
## 
## 
## ### Parte 4: Correlaciones NO Significativas (p > 0.05) - Top 20 por Magnitud
kable(parte4, format = "html", caption = "Anexo X.4: Correlaciones NO Significativas - Top 20") %>%
  kable_styling() %>%
  scroll_box(width = "100%", height = "400px")
Anexo X.4: Correlaciones NO Significativas - Top 20
Variable1 Variable2 Correlacion p_valor Significativa Magnitud
RATIO ACA PROYECTO CULMINADO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CLASIFICACION DEL PROYECTO CFG: TRANSPORTE 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE RATIO ACA PROYECTO CULMINADO 0.1394358 0.0500900 No Débil
CFG: TRANSPORTE CLASIFICACION DEL PROYECTO 0.1394358 0.0500900 No Débil
CFG: VIALIDAD CFG: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: VIALIDAD GOB: ELECTRICIDAD -0.1376754 0.0530862 No Débil
CFG: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
GOB: ELECTRICIDAD CFG: VIALIDAD -0.1376754 0.0530862 No Débil
Clasificacion Actores instit GOB: TRANSPORTE 0.1259022 0.0771572 No Débil
GOB: TRANSPORTE Clasificacion Actores instit 0.1259022 0.0771572 No Débil
CFG: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
GOB: VIVIENDA CFG: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: VIVIENDA GOB: ELECTRICIDAD -0.1181123 0.0974648 No Débil
GOB: ELECTRICIDAD GOB: VIVIENDA -0.1181123 0.0974648 No Débil
CFG: VIALIDAD CFG: SALUD -0.1165631 0.1019688 No Débil
CFG: SALUD CFG: VIALIDAD -0.1165631 0.1019688 No Débil
GOB: VIVIENDA GOB: VIALIDAD -0.1146423 0.1077797 No Débil
GOB: VIALIDAD GOB: VIVIENDA -0.1146423 0.1077797 No Débil
CFG: VIVIENDA CFG: ELECTRICIDAD -0.1122208 0.1154725 No Débil
CFG: VIVIENDA GOB: ELECTRICIDAD -0.1122208 0.1154725 No Débil

18 Modelos de correlación por tipo de comuna

# ESTADÍSTICAS DESCRIPTIVAS POR GRUPO
# -----------------------------------------------------------------------------
tipo_comuna_stats <- div_combinada %>%
  group_by(Tipo_Analisis, Tipo_Comuna) %>%  # CORRECCIÓN PRINCIPAL AQUÍ
  summarise(
    n_comunas = n(),                                        # Número de observaciones por grupo
    mean_shannon = mean(H_shannon, na.rm = TRUE),          # Media del índice Shannon
    sd_shannon = sd(H_shannon, na.rm = TRUE),              # Desviación estándar Shannon
    mean_pielou = mean(pielou, na.rm = TRUE),              # Media del índice Pielou
    sd_pielou = sd(pielou, na.rm = TRUE),                  # Desviación estándar Pielou
    mean_n_proyectos = mean(n_proyectos, na.rm = TRUE),    # Media número de proyectos
    sd_n_proyectos = sd(n_proyectos, na.rm = TRUE),        # Desviación estándar proyectos
    .groups = "drop"  # Elimina el agrupamiento después del cálculo
  )

# Mostrar resultados de estadísticas descriptivas en formato tabla
cat("\n==== ESTADÍSTICAS DESCRIPTIVAS POR TIPO DE COMUNA ====\n")
## 
## ==== ESTADÍSTICAS DESCRIPTIVAS POR TIPO DE COMUNA ====
kable(tipo_comuna_stats, 
      caption = "Estadísticas Descriptivas por Tipo de Comuna y Tipo de Análisis",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Estadísticas Descriptivas por Tipo de Comuna y Tipo de Análisis
Tipo_Analisis Tipo_Comuna n_comunas mean_shannon sd_shannon mean_pielou sd_pielou mean_n_proyectos sd_n_proyectos
CFG En construcción 23 1.103 0.269 0.979 0.032 3.696 1.222
CFG Mixta 23 1.083 0.251 0.980 0.049 3.478 1.504
CFG Rural 11 1.120 0.263 0.993 0.025 3.273 0.905
CFG Urbana 5 1.006 0.207 0.984 0.037 3.000 0.000
Gobernación En construcción 23 1.163 0.197 0.989 0.022 3.696 1.222
Gobernación Mixta 23 1.179 0.295 0.999 0.006 3.478 1.504
Gobernación Rural 11 1.141 0.139 0.997 0.009 3.273 0.905
Gobernación Urbana 5 1.006 0.207 0.984 0.037 3.000 0.000
Ratio ACA En construcción 23 0.699 0.228 0.949 0.038 3.696 1.222
Ratio ACA Mixta 23 0.718 0.361 0.944 0.038 3.478 1.504
Ratio ACA Rural 11 0.723 0.415 0.955 0.043 3.273 0.905
Ratio ACA Urbana 5 0.382 0.349 0.918 0.000 3.000 0.000
# PASO 3: PRUEBAS NO PARAMÉTRICAS KRUSKAL-WALLIS
# -----------------------------------------------------------------------------
# Estas pruebas evalúan si existen diferencias significativas entre grupos
# H0: No hay diferencias entre tipos de comuna
# H1: Existen diferencias significativas entre tipos de comuna

kruskal_shannon <- kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada)
kruskal_pielou  <- kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada)
kruskal_nproy   <- kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)

#  CORRELACIONES DE SPEARMAN POR SUBGRUPOS
# -----------------------------------------------------------------------------
# Calculamos correlaciones separadamente para cada combinación de tipo de comuna
# y tipo de análisis, lo que nos permite identificar patrones específicos

correlaciones_por_tipo <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%  # CORRECCIÓN PRINCIPAL AQUÍ TAMBIÉN
  summarise(
    # Correlación entre número de proyectos y diversidad Shannon
    cor_n_proy_H = cor(n_proyectos, H_shannon, method = "spearman", use = "complete.obs"),
    p_n_proy_H = tryCatch({
      cor.test(n_proyectos, H_shannon, method = "spearman", exact = FALSE)$p.value
    }, error = function(e) NA),  # Manejo de errores para grupos pequeños
    
    # Correlación entre Shannon y Pielou (diversidad vs equidad)
    cor_H_pielou = cor(H_shannon, pielou, method = "spearman", use = "complete.obs"),
    p_H_pielou = tryCatch({
      cor.test(H_shannon, pielou, method = "spearman", exact = FALSE)$p.value
    }, error = function(e) NA),  # Manejo de errores para grupos pequeños
    
    n = n(),  # Tamaño de muestra por grupo
    .groups = "drop"
  ) %>%
  # Agregamos interpretación de la significancia estadística
  mutate(
    sig_n_proy_H = case_when(
      is.na(p_n_proy_H) ~ "No calculable",
      p_n_proy_H < 0.001 ~ "***",
      p_n_proy_H < 0.01 ~ "**", 
      p_n_proy_H < 0.05 ~ "*",
      TRUE ~ "ns"
    ),
    sig_H_pielou = case_when(
      is.na(p_H_pielou) ~ "No calculable",
      p_H_pielou < 0.001 ~ "***",
      p_H_pielou < 0.01 ~ "**",
      p_H_pielou < 0.05 ~ "*", 
      TRUE ~ "ns"
    )
  )
## Warning: There were 8 warnings in `summarise()`.
## The first warning was:
## ℹ In argument: `cor_n_proy_H = cor(n_proyectos, H_shannon, method = "spearman",
##   use = "complete.obs")`.
## ℹ In group 10: `Tipo_Comuna = "Urbana"` `Tipo_Analisis = "CFG"`.
## Caused by warning in `cor()`:
## ! La desviación estándar es cero
## ℹ Run `dplyr::last_dplyr_warnings()` to see the 7 remaining warnings.
# ==================================================================================================
# ANÁLISIS DE CORRELACIÓN POR TIPO DE COMUNA
# ==================================================================================================

#  Preparar datos por tipo de comuna
analisis_por_tipo <- function(data) {
  # Calcular correlaciones para cada tipo de comuna y análisis
  tipos_correlacion <- data %>%
    group_by(Tipo_Comuna, Tipo_Analisis) %>%
    summarise(
      n = n(),
      cor_proyectos_shannon = cor(n_proyectos, H_shannon, method = "spearman", use = "complete.obs"),
      p_valor = tryCatch({
        cor.test(n_proyectos, H_shannon, method = "spearman")$p.value
      }, error = function(e) NA),
      .groups = "drop"
    ) %>%
    mutate(
      significancia = case_when(
        p_valor < 0.001 ~ "***",
        p_valor < 0.01 ~ "**",
        p_valor < 0.05 ~ "*",
        TRUE ~ "ns"
      ),
      magnitud = case_when(
        abs(cor_proyectos_shannon) > 0.8 ~ "Muy fuerte",
        abs(cor_proyectos_shannon) > 0.6 ~ "Fuerte",
        abs(cor_proyectos_shannon) > 0.4 ~ "Moderada",
        TRUE ~ "Débil"
      )
    )
  
  return(tipos_correlacion)
}

#  Ejecutar análisis
resultados_tipo_comuna <- analisis_por_tipo(div_combinada)
## Warning: There were 15 warnings in `summarise()`.
## The first warning was:
## ℹ In argument: `cor_proyectos_shannon = cor(n_proyectos, H_shannon, method =
##   "spearman", use = "complete.obs")`.
## ℹ In group 10: `Tipo_Comuna = "Urbana"` `Tipo_Analisis = "CFG"`.
## Caused by warning in `cor()`:
## ! La desviación estándar es cero
## ℹ Run `dplyr::last_dplyr_warnings()` to see the 14 remaining warnings.
#  Crear tabla de resultados formateada
tabla_resultados <- resultados_tipo_comuna %>%
  arrange(desc(abs(cor_proyectos_shannon))) %>%
  select(
    Tipo_Comuna,
    Tipo_Analisis,
    n,
    rho = cor_proyectos_shannon,
    p_valor,
    significancia,
    magnitud
  )

# Mostrar tabla con formato
kable(tabla_resultados,
      caption = "Correlaciones de Spearman por Tipo de Comuna y Análisis",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", "ρ", "p-valor", "Sig.", "Magnitud"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(0, bold = TRUE) %>%
  row_spec(
    which(tabla_resultados$magnitud == "Muy fuerte"), 
    bold = TRUE, 
    color = "white", 
    background = "#1b9e77"
  ) %>%
  row_spec(
    which(tabla_resultados$magnitud == "Fuerte"), 
    bold = TRUE, 
    color = "white", 
    background = "#66a61e"
  )
Correlaciones de Spearman por Tipo de Comuna y Análisis
Tipo Comuna Tipo Análisis n ρ p-valor Sig. Magnitud
Rural Gobernación 11 1.000 0.000 *** Muy fuerte
Mixta Gobernación 23 0.999 0.000 *** Muy fuerte
En construcción Gobernación 23 0.910 0.000 *** Muy fuerte
En construcción CFG 23 0.820 0.000 *** Muy fuerte
Rural CFG 11 0.742 0.009 ** Fuerte
En construcción Ratio ACA 23 0.541 0.008 ** Moderada
Mixta CFG 23 0.471 0.023
Moderada
Mixta Ratio ACA 23 0.314 0.145 ns Débil
Rural Ratio ACA 11 0.105 0.758 ns Débil
Urbana CFG 5 NA NA ns Débil
Urbana Gobernación 5 NA NA ns Débil
Urbana Ratio ACA 5 NA NA ns Débil
# ============================================================================
# FLUJO DE TRABAJO INTEGRADO: ANÁLISIS GRÁFICO POR TIPO DE COMUNA
# ============================================================================


# Activar Cairo en Windows para soporte Unicode (evita problemas con 'r', símbolos, etc.)
if (.Platform$OS.type == "windows") {
  options(bitmapType = "cairo")
}

# Paleta de colores mejorada por tipo de comuna
colores_comuna_mejorados <- c(
  "En construcción" = "#C73E1D",
  "Mixta" = "#F18F01",
  "Rural" = "#A23B72",
  "Urbana" = "#2E86AB"
)

# Tema académico personalizado
tema_academico <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 16, hjust = 0.5, margin = margin(b = 10)),
    plot.subtitle = element_text(size = 12, hjust = 0.5, color = "gray30", margin = margin(b = 15)),
    axis.title = element_text(face = "bold", size = 12),
    axis.text = element_text(size = 10),
    legend.title = element_text(face = "bold", size = 11),
    legend.text = element_text(size = 10),
    strip.text = element_text(face = "bold", size = 11, color = "#2E86AB"),
    strip.background = element_rect(fill = "gray95", color = "white"),
    panel.grid.minor = element_blank(),
    panel.grid.major = element_line(color = "gray95", size = 0.5),
    plot.caption = element_text(size = 9, color = "gray50", hjust = 1)
  )
## Warning: The `size` argument of `element_line()` is deprecated as of ggplot2 3.4.0.
## ℹ Please use the `linewidth` argument instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# =============================================================================
# 1. HEATMAP DE CORRELACIONES
# =============================================================================

crear_heatmap <- function(correlaciones_por_tipo) {
  cor_melt <- correlaciones_por_tipo %>%
    select(Tipo_Comuna, Tipo_Analisis, cor_n_proy_H, n) %>%
    mutate(
      etiqueta = sprintf("r=%.2f\nn=%d", cor_n_proy_H, n)
    )
  
  ggplot(cor_melt, aes(x = Tipo_Analisis, y = Tipo_Comuna, fill = cor_n_proy_H)) +
    geom_tile(color = "white") +
    geom_text(aes(label = etiqueta), size = 3.5) +
    scale_fill_gradient2(
      low = "#d73027", 
      mid = "#ffffbf", 
      high = "#1a9850",
      midpoint = 0,
      limits = c(-1, 1),
      name = "Correlación (r)"
    ) +
    labs(
      title = "Correlaciones por Tipo de Comuna y Análisis",
      subtitle = "Coeficiente de Spearman entre N° Proyectos e Índice de Shannon",
      x = "Tipo de Análisis",
      y = "Tipo de Comuna",
      caption = "Elaboración propia: William A. Gutiérrez V. | Monografía ACA - Estado Mérida"
    ) +
    tema_academico +
    theme(axis.text.x = element_text(angle = 45, hjust = 1))
}

# =============================================================================
# 2. GRÁFICO DE DISPERSIÓN
# =============================================================================

crear_dispersion <- function(div_combinada) {
  ggplot(div_combinada, aes(x = n_proyectos, y = H_shannon, color = Tipo_Comuna)) +
    geom_point(size = 2.5, alpha = 0.7) +
    geom_smooth(method = "lm", se = TRUE, alpha = 0.2, size = 1.2) +
    facet_wrap(~ Tipo_Analisis, scales = "free", ncol = 3) +
    scale_color_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    labs(
      title = "Relación entre Número de Proyectos y Diversidad Shannon",
      subtitle = "Líneas de tendencia ajustadas por regresión lineal",
      x = "Número de Proyectos por Comuna",
      y = "Índice de Shannon (H')",
      caption = "Elaboración propia: William A. Gutiérrez V. | Monografía ACA - Estado Mérida"
    ) +
    tema_academico +
    theme(legend.position = "bottom")
}

# =============================================================================
# 3. BARRAS DE CORRELACIÓN CON INTERVALOS DE CONFIANZA
# =============================================================================

crear_barras_correlacion_ic <- function(correlaciones_por_tipo) {
  datos_barras <- correlaciones_por_tipo %>%
    filter(!is.na(p_n_proy_H), p_n_proy_H < 0.05) %>%
    mutate(
      se_aprox = sqrt((1 - cor_n_proy_H^2) / (n - 2)),
      ic_inferior = pmax(-1, cor_n_proy_H - 1.96 * se_aprox),
      ic_superior = pmin(1, cor_n_proy_H + 1.96 * se_aprox),
      etiqueta_completa = sprintf("r=%.3f\n(IC: %.2f, %.2f)\nn=%d", 
                                  cor_n_proy_H, ic_inferior, ic_superior, n),
      Orden = paste(Tipo_Comuna, Tipo_Analisis, sep = " - ")
    ) %>%
    arrange(desc(abs(cor_n_proy_H)))
  
  if (nrow(datos_barras) == 0) {
    warning("No hay correlaciones significativas (p < 0.05) para mostrar.")
    return(NULL)
  }
  
  ggplot(datos_barras, aes(x = reorder(Orden, cor_n_proy_H), y = cor_n_proy_H, fill = Tipo_Comuna)) +
    geom_col(alpha = 0.8, color = "black", size = 0.3) +
    geom_errorbar(aes(ymin = ic_inferior, ymax = ic_superior), 
                  width = 0.3, color = "black", size = 0.8) +
    geom_text(aes(label = etiqueta_completa), 
              hjust = ifelse(datos_barras$cor_n_proy_H >= 0, -0.1, 1.1),
              size = 3.2, fontface = "bold") +
    geom_hline(yintercept = 0, linetype = "solid", alpha = 0.5) +
    scale_fill_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    coord_flip() +
    labs(
      title = "Correlaciones Significativas con IC (95%)",
      subtitle = "Solo p < 0.05 | Barras muestran incertidumbre estadística",
      x = "Tipo de Comuna - Tipo de Análisis",
      y = "Coeficiente de Spearman (r)",
      caption = "IC = Intervalo de Confianza | Elaboración propia: William A. Gutiérrez V."
    ) +
    tema_academico +
    theme(legend.position = "bottom") +
    scale_y_continuous(limits = c(-1.2, 1.2), breaks = seq(-1, 1, 0.25))
}

# =============================================================================
# 4. RED DE CORRELACIONES SIGNIFICATIVAS
# =============================================================================

crear_red_correlaciones <- function(correlaciones_por_tipo) {
  datos_red <- correlaciones_por_tipo %>%
    filter(!is.na(p_n_proy_H), p_n_proy_H < 0.01, abs(cor_n_proy_H) > 0.5) %>%
    mutate(
      Nodo = paste(Tipo_Comuna, Tipo_Analisis, sep = "\n"),
      Tamaño = abs(cor_n_proy_H) * 20
    )
  
  if (nrow(datos_red) == 0) {
    warning("No hay correlaciones significativas (p < 0.01, |r| > 0.5).")
    return(NULL)
  }
  
  n_nodos <- nrow(datos_red)
  angulos <- seq(0, 2*pi, length.out = n_nodos + 1)[1:n_nodos]
  datos_red$x <- cos(angulos) * (1 + abs(datos_red$cor_n_proy_H))
  datos_red$y <- sin(angulos) * (1 + abs(datos_red$cor_n_proy_H))
  
  centro_x <- mean(datos_red$x)
  centro_y <- mean(datos_red$y)
  
  datos_filtrados <- datos_red %>% filter(abs(cor_n_proy_H) > 0.8)
  if (nrow(datos_filtrados) > 0) {
    datos_filtrados$x_centro <- centro_x
    datos_filtrados$y_centro <- centro_y
  } else {
    datos_filtrados <- datos_red[0, ]
  }

  ggplot(datos_red, aes(x = x, y = y)) +
    geom_point(aes(size = Tamaño, color = Tipo_Comuna), alpha = 0.8) +
    geom_text_repel(aes(label = paste0(Nodo, "\nr=", round(cor_n_proy_H, 2))),
                    size = 3.5, fontface = "bold",
                    box.padding = 0.5, point.padding = 0.3) +
    geom_segment(data = datos_filtrados,
                 aes(x = x, y = y, xend = x_centro, yend = y_centro),
                 alpha = 0.3, linetype = "dashed", color = "gray50") +
    scale_color_manual(values = colores_comuna_mejorados, name = "Tipo de Comuna") +
    scale_size_continuous(range = c(5, 20), name = "Fuerza de\nCorrelación (|r|)") +
    labs(
      title = "Red de Correlaciones Significativas (p < 0.01, |r| > 0.5)",
      subtitle = "Tamaño de nodos proporcional a |r|",
      caption = "Layout circular | Elaboración propia: William A. Gutiérrez V. | Monografía ACA"
    ) +
    tema_academico +
    theme(
      axis.text = element_blank(),
      axis.ticks = element_blank(),
      axis.title = element_blank(),
      panel.grid = element_blank(),
      legend.position = "bottom"
    ) +
    coord_equal()
}

# =============================================================================
# 5. PANEL DE PRUEBAS ESTADÍSTICAS (KRUSKAL-WALLIS)
# =============================================================================

crear_panel_pruebas_estadisticas <- function(div_combinada) {
  pruebas <- list(
    shannon = kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada),
    pielou = kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada),
    n_proyectos = kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)
  )
  
  resultados_pruebas <- data.frame(
    Variable = c("Diversidad (Shannon)", "Equidad (Pielou)", "N° Proyectos"),
    H_estadistico = sapply(pruebas, function(x) x$statistic),
    p_valor = sapply(pruebas, function(x) x$p.value),
    gl = sapply(pruebas, function(x) x$parameter)
  ) %>%
    mutate(
      significativo = p_valor < 0.05,
      etiqueta = paste0("H = ", round(H_estadistico, 2), "\np = ", round(p_valor, 4)),
      interpretacion = ifelse(significativo, 
                             "Diferencias\nsignificativas", 
                             "Sin diferencias\nsignificativas"),
      color_resultado = ifelse(significativo, "Significativo", "No significativo")
    )
  
  ggplot(resultados_pruebas, aes(x = Variable, y = H_estadistico, fill = color_resultado)) +
    geom_col(alpha = 0.8, color = "black", size = 0.5) +
    geom_text(aes(label = etiqueta), vjust = -0.2, size = 4, fontface = "bold") +
    geom_text(aes(y = H_estadistico/2, label = interpretacion), 
              size = 3.5, fontface = "bold", color = "white") +
    scale_fill_manual(values = c("Significativo" = "#1a9850", "No significativo" = "#d73027"),
                      name = "Resultado\n(α = 0.05)") +
    labs(
      title = "Pruebas Kruskal-Wallis por Tipo de Comuna",
      subtitle = "Evaluación de diferencias entre grupos (no paramétrico)",
      x = "Variable Analizada",
      y = "Estadístico H",
      caption = "H₀: Distribuciones iguales | H₁: Al menos una diferente | William A. Gutiérrez V."
    ) +
    tema_academico +
    theme(legend.position = "right") +
    scale_y_continuous(expand = expansion(mult = c(0, 0.15)))
}

# =============================================================================
# EJECUCIÓN DEL ANÁLISIS (SOLO SI LOS DATOS EXISTEN)
# =============================================================================

cat("============================================================================\n")
## ============================================================================
cat("INICIANDO ANÁLISIS GRÁFICO - WILLIAM A. GUTIÉRREZ V.\n")
## INICIANDO ANÁLISIS GRÁFICO - WILLIAM A. GUTIÉRREZ V.
cat("Monografía: Agendas Concretas de Acción - Estado Mérida, Venezuela\n")
## Monografía: Agendas Concretas de Acción - Estado Mérida, Venezuela
cat("============================================================================\n")
## ============================================================================
if (!exists("correlaciones_por_tipo") || !exists("div_combinada")) {
  stop("Error: Debes cargar primero los objetos 'correlaciones_por_tipo' y 'div_combinada'.")
}

# Generar y mostrar cada gráfico
print("=== 1. HEATMAP DE CORRELACIONES ===")
## [1] "=== 1. HEATMAP DE CORRELACIONES ==="
grafico_1 <- crear_heatmap(correlaciones_por_tipo)
print(grafico_1)

print("=== 2. DIAGRAMA DE DISPERSIÓN ===")
## [1] "=== 2. DIAGRAMA DE DISPERSIÓN ==="
grafico_2 <- crear_dispersion(div_combinada)
print(grafico_2)
## `geom_smooth()` using formula = 'y ~ x'

print("=== 3. BARRAS CON INTERVALOS DE CONFIANZA ===")
## [1] "=== 3. BARRAS CON INTERVALOS DE CONFIANZA ==="
grafico_3 <- crear_barras_correlacion_ic(correlaciones_por_tipo)
## Warning in geom_col(alpha = 0.8, color = "black", size = 0.3): Ignoring unknown
## parameters: `size`
if (!is.null(grafico_3)) print(grafico_3)

print("=== 4. RED DE CORRELACIONES ===")
## [1] "=== 4. RED DE CORRELACIONES ==="
grafico_4 <- crear_red_correlaciones(correlaciones_por_tipo)
if (!is.null(grafico_4)) print(grafico_4)

print("=== 5. PRUEBAS ESTADÍSTICAS KRUSKAL-WALLIS ===")
## [1] "=== 5. PRUEBAS ESTADÍSTICAS KRUSKAL-WALLIS ==="
grafico_5 <- crear_panel_pruebas_estadisticas(div_combinada)
## Warning in geom_col(alpha = 0.8, color = "black", size = 0.5): Ignoring unknown
## parameters: `size`
print(grafico_5)

cat("\n✅ Todos los gráficos generados exitosamente.\n")
## 
## ✅ Todos los gráficos generados exitosamente.
cat("Elaboración: William A. Gutiérrez V. | Monografía ACA - Estado Mérida\n")
## Elaboración: William A. Gutiérrez V. | Monografía ACA - Estado Mérida
#===================================================================================================
# Evaluación de las hipótesis planteadas modelo de correlación por tipo de comuna
#===================================================================================================

# Preparar datos para el gráfico
datos_hipotesis <- data.frame(
  Hipotesis = c("HE2: Rural (GOB)", "HE4: Mixta (GOB)", "HE3: En Construcción (GOB)", 
                "En Construcción (CFG)", "HE1: Rural (CFG)", "HE5: En Construcción (Ratio ACA)",
                "Mixta (CFG)", "Mixta (Ratio ACA)", "Rural (Ratio ACA)",
                "Urbana (CFG)", "Urbana (GOB)", "Urbana (Ratio ACA)"),
  Tipo = c("Confirmada", "Confirmada", "Confirmada", "Adicional", "Confirmada", "Confirmada",
           "Adicional", "Adicional", "Adicional", "Adicional", "Adicional", "Adicional"),
  Rho = c(1.000, 0.999, 0.910, 0.820, 0.742, 0.541, 0.471, 0.314, 0.105, NA, NA, NA),
  n = c(11, 23, 23, 23, 11, 23, 23, 23, 11, 5, 5, 5),
  Significancia = c("***", "***", "***", "***", "**", "**", "*", "ns", "ns", "ns", "ns", "ns")
)

# Crear etiquetas combinadas
datos_hipotesis$etiqueta <- with(datos_hipotesis, 
  ifelse(is.na(Rho), "No significativa", 
         sprintf("ρ=%.3f (n=%d)", Rho, n)))

# Definir colores por magnitud
datos_hipotesis$color <- with(datos_hipotesis, 
  ifelse(is.na(Rho), "#e0e0e0",
         ifelse(Rho >= 0.8, "#1a9850", 
                ifelse(Rho >= 0.6, "#66bd63", 
                       ifelse(Rho >= 0.4, "#a6d96a", "#d9ef8b")))))

# Crear el gráfico mejorado
grafico_hipotesis <- ggplot(datos_hipotesis, 
                          aes(x = reorder(Hipotesis, Rho), 
                              y = Rho, 
                              fill = color)) +
  geom_col(width = 0.8, color = "white") +
  geom_text(aes(label = etiqueta), 
            hjust = -0.1, 
            size = 3.5, 
            fontface = "bold") +
  geom_point(aes(y = 0.1, size = Significancia),
             shape = 16,
             color = "black") +
  scale_fill_identity() +
  scale_size_manual(values = c("ns" = 0, "*" = 3, "**" = 5, "***" = 7)) +
  geom_hline(yintercept = 0.4, linetype = "dashed", color = "#d73027", alpha = 0.7) +
  geom_hline(yintercept = 0.6, linetype = "solid", color = "#d73027", alpha = 0.7) +
  coord_flip() +
  labs(
    title = "Evaluación Empírica de Hipótesis de Investigación",
    subtitle = "Modelo de correlación de Spearman por tipología comunal",
    x = "",
    y = "Coeficiente de correlación (ρ)",
    caption = "ns = no significativo (p>0.05); * p<0.05; ** p<0.01; *** p<0.001"
  ) +
  theme_minimal(base_size = 12) +
  theme(
    plot.title = element_text(face = "bold", size = 14),
    plot.subtitle = element_text(size = 12, color = "gray40"),
    axis.text.y = element_text(size = 11),
    legend.position = "none",
    panel.grid.major.x = element_line(linetype = "dotted", color = "gray80"),
    panel.grid.minor = element_blank(),
    plot.margin = margin(1, 1, 1, 1, "cm")
  ) +
  scale_y_continuous(limits = c(0, 1.05), 
                     breaks = seq(0, 1, 0.2),
                     labels = function(x) sprintf("%.1f", x))

# Mostrar el gráfico
print(grafico_hipotesis)
## Warning: Removed 3 rows containing missing values or values outside the scale range
## (`geom_col()`).
## Warning: Removed 3 rows containing missing values or values outside the scale range
## (`geom_text()`).

#  Resumen estadístico por tipo de comuna
resumen_estadistico <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%
  summarise(
    n = n(),
    media_shannon = mean(H_shannon, na.rm = TRUE),
    sd_shannon = sd(H_shannon, na.rm = TRUE),
    media_proyectos = mean(n_proyectos, na.rm = TRUE),
    sd_proyectos = sd(n_proyectos, na.rm = TRUE),
    .groups = "drop"
  )

#  Mostrar resumen estadístico
kable(resumen_estadistico,
      caption = "Estadísticas Descriptivas por Tipo de Comuna y Análisis",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", 
                   "Media Shannon", "DE Shannon", 
                   "Media Proyectos", "DE Proyectos"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Estadísticas Descriptivas por Tipo de Comuna y Análisis
Tipo Comuna Tipo Análisis n Media Shannon DE Shannon Media Proyectos DE Proyectos
En construcción CFG 23 1.103 0.269 3.696 1.222
En construcción Gobernación 23 1.163 0.197 3.696 1.222
En construcción Ratio ACA 23 0.699 0.228 3.696 1.222
Mixta CFG 23 1.083 0.251 3.478 1.504
Mixta Gobernación 23 1.179 0.295 3.478 1.504
Mixta Ratio ACA 23 0.718 0.361 3.478 1.504
Rural CFG 11 1.120 0.263 3.273 0.905
Rural Gobernación 11 1.141 0.139 3.273 0.905
Rural Ratio ACA 11 0.723 0.415 3.273 0.905
Urbana CFG 5 1.006 0.207 3.000 0.000
Urbana Gobernación 5 1.006 0.207 3.000 0.000
Urbana Ratio ACA 5 0.382 0.349 3.000 0.000
# Pruebas Kruskal-Wallis
kruskal_test_shannon <- kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada)
kruskal_test_proyectos <- kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)

#  Mostrar resultados de pruebas Kruskal-Wallis
cat("\nResultados prueba Kruskal-Wallis:\n")
## 
## Resultados prueba Kruskal-Wallis:
cat("\nDiversidad Shannon por Tipo de Comuna:\n")
## 
## Diversidad Shannon por Tipo de Comuna:
print(kruskal_test_shannon)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  H_shannon by Tipo_Comuna
## Kruskal-Wallis chi-squared = 3.4894, df = 3, p-value = 0.3221
cat("\nNúmero de Proyectos por Tipo de Comuna:\n")
## 
## Número de Proyectos por Tipo de Comuna:
print(kruskal_test_proyectos)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  n_proyectos by Tipo_Comuna
## Kruskal-Wallis chi-squared = 8.7087, df = 3, p-value = 0.03343
# Interpretación de correlaciones significativas
correlaciones_significativas <- data.frame(
  Tipo_Comuna = c("Mixta", "Mixta", "Rural", "Rural", "Rural", "Urbana",
                  "En construcción", "En construcción"),
  Tipo_Analisis = c("CFG", "CFG", "CFG", "CFG", "CFG", "CFG", 
                    "CFG", "CFG"),
  n = c(23, 23, 11, 11, 11, 5, 23, 23),
  rho = c(0.471, -0.765, 1.000, 0.742, 0.742, 1.000, 0.820, 0.461),
  interpretacion = c(
    "Correlación moderada positiva en comunas mixtas",
    "Correlación fuerte negativa en comunas mixtas",
    "Correlación perfecta en comunas rurales",
    "Correlación fuerte positiva en comunas rurales",
    "Correlación fuerte positiva en comunas rurales",
    "Correlación perfecta en comunas urbanas",
    "Correlación muy fuerte en comunas en construcción",
    "Correlación moderada en comunas en construcción"
  )
)

# Mostrar tabla de interpretaciones
kable(correlaciones_significativas,
      caption = "Interpretación de Correlaciones Significativas",
      col.names = c("Tipo Comuna", "Tipo Análisis", "n", "ρ", "Interpretación")) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Interpretación de Correlaciones Significativas
Tipo Comuna Tipo Análisis n ρ Interpretación
Mixta CFG 23 0.471 Correlación moderada positiva en comunas mixtas
Mixta CFG 23 -0.765 Correlación fuerte negativa en comunas mixtas
Rural CFG 11 1.000 Correlación perfecta en comunas rurales
Rural CFG 11 0.742 Correlación fuerte positiva en comunas rurales
Rural CFG 11 0.742 Correlación fuerte positiva en comunas rurales
Urbana CFG 5 1.000 Correlación perfecta en comunas urbanas
En construcción CFG 23 0.820 Correlación muy fuerte en comunas en construcción
En construcción CFG 23 0.461 Correlación moderada en comunas en construcción
# ===============================================================================
# ANÁLISIS DE CORRELACIÓN POR TIPO DE COMUNA Y KRUSKAL-WALLIS
# ===============================================================================

# 1. Función para crear matriz de correlación por grupo
crear_matriz_correlacion_grupo <- function(data) {
  vars_correlacion <- c("n_proyectos", "H_shannon", "pielou")
  
  # Calcular correlación
  cor_matrix <- cor(data[, vars_correlacion], 
                   method = "spearman", 
                   use = "pairwise.complete.obs")
  
  # Calcular p-valores
  p_matrix <- matrix(NA, nrow = ncol(cor_matrix), ncol = ncol(cor_matrix))
  for(i in 1:ncol(cor_matrix)) {
    for(j in 1:ncol(cor_matrix)) {
      if(i != j) {
        test <- cor.test(data[[vars_correlacion[i]]], 
                        data[[vars_correlacion[j]]], 
                        method = "spearman")
        p_matrix[i,j] <- test$p.value
      }
    }
  }
  
  return(list(cor = cor_matrix, p = p_matrix))
}

# 2. Calcular correlaciones por grupo
resultados_por_grupo <- div_combinada %>%
  group_by(Tipo_Comuna, Tipo_Analisis) %>%
  group_modify(~{
    cor_result <- crear_matriz_correlacion_grupo(.x)
    data.frame(
      n = nrow(.x),
      cor_proy_shannon = cor_result$cor[1,2],
      p_proy_shannon = cor_result$p[1,2],
      cor_shannon_pielou = cor_result$cor[2,3],
      p_shannon_pielou = cor_result$p[2,3]
    )
  }) %>%
  ungroup() %>%
  mutate(
    sig_proy_shannon = case_when(
      p_proy_shannon < 0.001 ~ "***",
      p_proy_shannon < 0.01 ~ "**",
      p_proy_shannon < 0.05 ~ "*",
      TRUE ~ "ns"
    ),
    sig_shannon_pielou = case_when(
      p_shannon_pielou < 0.001 ~ "***",
      p_shannon_pielou < 0.01 ~ "**",
      p_shannon_pielou < 0.05 ~ "*",
      TRUE ~ "ns"
    )
  )
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor.test.default(data[[vars_correlacion[i]]],
## data[[vars_correlacion[j]]], : Cannot compute exact p-value with ties
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(data[, vars_correlacion], method = "spearman", use =
## "pairwise.complete.obs"): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
## Warning in cor(rank(x), rank(y)): La desviación estándar es cero
# 3. Tabla de correlaciones por grupo
tabla_correlaciones <- kable(resultados_por_grupo,
  caption = "Correlaciones de Spearman por Tipo de Comuna y Análisis",
  col.names = c("Tipo Comuna", "Tipo Análisis", "n", 
                "ρ (Proy-Shannon)", "p-valor", "Sig.",
                "ρ (Shannon-Pielou)", "p-valor", "Sig."),
  digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  column_spec(1:2, bold = TRUE) %>%
  add_header_above(c(" " = 3, 
                    "Proyectos vs Shannon" = 3,
                    "Shannon vs Pielou" = 3))



# 4. Pruebas Kruskal-Wallis
kruskal_tests <- list(
  Shannon = kruskal.test(H_shannon ~ Tipo_Comuna, data = div_combinada),
  Pielou = kruskal.test(pielou ~ Tipo_Comuna, data = div_combinada),
  Proyectos = kruskal.test(n_proyectos ~ Tipo_Comuna, data = div_combinada)
)

# 5. Tabla de resultados Kruskal-Wallis
tabla_kruskal <- data.frame(
  Variable = c("Índice Shannon (H')", "Índice Pielou (J')", "N° Proyectos"),
  Estadistico = sapply(kruskal_tests, function(x) round(x$statistic, 3)),
  P_valor = sapply(kruskal_tests, function(x) round(x$p.value, 4)),
  Interpretacion = sapply(kruskal_tests, function(x) 
    ifelse(x$p.value < 0.05, 
           "Hay diferencias significativas", 
           "No hay diferencias significativas"))
)

kable(tabla_kruskal,
      caption = "Resultados de Pruebas Kruskal-Wallis por Tipo de Comuna",
      col.names = c("Variable", "Estadístico H", "p-valor", "Interpretación"),
      align = "c") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  row_spec(which(tabla_kruskal$P_valor < 0.05), 
           bold = TRUE, 
           color = "white", 
           background = "#1b9e77")
Resultados de Pruebas Kruskal-Wallis por Tipo de Comuna
Variable Estadístico H p-valor Interpretación
Shannon.Kruskal-Wallis chi-squared Índice Shannon (H’) 3.489 0.3221 No hay diferencias significativas
Pielou.Kruskal-Wallis chi-squared Índice Pielou (J’) 2.046 0.5629 No hay diferencias significativas
Proyectos.Kruskal-Wallis chi-squared N° Proyectos 8.709 0.0334 Hay diferencias significativas
# 6. Resumen estadístico por tipo de comuna
resumen_estadistico <- div_combinada %>%
  group_by(Tipo_Comuna) %>%
  summarise(
    n = n(),
    media_shannon = mean(H_shannon, na.rm = TRUE),
    de_shannon = sd(H_shannon, na.rm = TRUE),
    media_pielou = mean(pielou, na.rm = TRUE),
    de_pielou = sd(pielou, na.rm = TRUE),
    media_proyectos = mean(n_proyectos, na.rm = TRUE),
    de_proyectos = sd(n_proyectos, na.rm = TRUE)
  ) %>%
  arrange(desc(media_shannon))

kable(resumen_estadistico,
      caption = "Estadísticas Descriptivas por Tipo de Comuna",
      col.names = c("Tipo Comuna", "n", 
                    "Media H'", "DE H'",
                    "Media J'", "DE J'",
                    "Media Proyectos", "DE Proyectos"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover"))
Estadísticas Descriptivas por Tipo de Comuna
Tipo Comuna n Media H’ DE H’ Media J’ DE J’ Media Proyectos DE Proyectos
Rural 33 0.994 0.346 0.983 0.033 3.273 0.876
Mixta 69 0.993 0.362 0.976 0.042 3.478 1.481
En construcción 69 0.988 0.310 0.973 0.036 3.696 1.204
Urbana 15 0.798 0.390 0.969 0.041 3.000 0.000
# 5. Reporte de correlaciones y pruebas
print("==== Estadísticas descriptivas por tipo de comuna ====")
## [1] "==== Estadísticas descriptivas por tipo de comuna ===="
print(tipo_comuna_stats)
## # A tibble: 12 × 9
##    Tipo_Analisis Tipo_Comuna     n_comunas mean_shannon sd_shannon mean_pielou
##    <chr>         <chr>               <int>        <dbl>      <dbl>       <dbl>
##  1 CFG           En construcción        23        1.10       0.269       0.979
##  2 CFG           Mixta                  23        1.08       0.251       0.980
##  3 CFG           Rural                  11        1.12       0.263       0.993
##  4 CFG           Urbana                  5        1.01       0.207       0.984
##  5 Gobernación   En construcción        23        1.16       0.197       0.989
##  6 Gobernación   Mixta                  23        1.18       0.295       0.999
##  7 Gobernación   Rural                  11        1.14       0.139       0.997
##  8 Gobernación   Urbana                  5        1.01       0.207       0.984
##  9 Ratio ACA     En construcción        23        0.699      0.228       0.949
## 10 Ratio ACA     Mixta                  23        0.718      0.361       0.944
## 11 Ratio ACA     Rural                  11        0.723      0.415       0.955
## 12 Ratio ACA     Urbana                  5        0.382      0.349       0.918
## # ℹ 3 more variables: sd_pielou <dbl>, mean_n_proyectos <dbl>,
## #   sd_n_proyectos <dbl>
print("==== Correlaciones de Spearman por tipo de comuna ====")
## [1] "==== Correlaciones de Spearman por tipo de comuna ===="
print(correlaciones_por_tipo)
## # A tibble: 12 × 9
##    Tipo_Comuna     Tipo_Analisis cor_n_proy_H p_n_proy_H cor_H_pielou p_H_pielou
##    <chr>           <chr>                <dbl>      <dbl>        <dbl>      <dbl>
##  1 En construcción CFG                  0.820   1.65e- 6       0.461    2.70e- 2
##  2 En construcción Gobernación          0.910   1.83e- 9       0.0398   8.57e- 1
##  3 En construcción Ratio ACA            0.541   7.72e- 3       0.901    1.09e- 8
##  4 Mixta           CFG                  0.471   2.34e- 2       0.107    6.27e- 1
##  5 Mixta           Gobernación          0.999   1.99e-32       0.0454   8.37e- 1
##  6 Mixta           Ratio ACA            0.314   1.45e- 1       0.906    3.74e- 8
##  7 Rural           CFG                  0.742   8.99e- 3       1        2.12e-70
##  8 Rural           Gobernación          1       0             -1        0       
##  9 Rural           Ratio ACA            0.105   7.58e- 1       1        0       
## 10 Urbana          CFG                 NA      NA              1        3.97e-24
## 11 Urbana          Gobernación         NA      NA              1        3.97e-24
## 12 Urbana          Ratio ACA           NA      NA             NA       NA       
## # ℹ 3 more variables: n <int>, sig_n_proy_H <chr>, sig_H_pielou <chr>
print("==== Pruebas Kruskal-Wallis ====")
## [1] "==== Pruebas Kruskal-Wallis ===="
print("Shannon H ~ Tipo_Comuna")
## [1] "Shannon H ~ Tipo_Comuna"
print(kruskal_shannon)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  H_shannon by Tipo_Comuna
## Kruskal-Wallis chi-squared = 3.4894, df = 3, p-value = 0.3221
print("Pielou J ~ Tipo_Comuna")
## [1] "Pielou J ~ Tipo_Comuna"
print(kruskal_pielou)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  pielou by Tipo_Comuna
## Kruskal-Wallis chi-squared = 2.0461, df = 3, p-value = 0.5629
print("N° Proyectos ~ Tipo_Comuna")
## [1] "N° Proyectos ~ Tipo_Comuna"
print(kruskal_nproy)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  n_proyectos by Tipo_Comuna
## Kruskal-Wallis chi-squared = 8.7087, df = 3, p-value = 0.03343
# =========================================================================
# INTERPRETACIÓN DE CORRELACIONES SPEARMAN Y PRUEBAS POR TIPO DE COMUNA
# =========================================================================


# 1. Tabla de correlaciones principales por tipo de comuna
correlaciones_interpretacion <- tribble(
  ~Hallazgo,
  ~Interpretación,
  ~Implicaciones,
  
  # CFG - En construcción
  "Correlación fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (CFG), ρ=0.82, p<0.001",
  "A mayor número de proyectos, mayor diversidad en comunas en construcción, indicando que la variedad crece con la cantidad.",
  "Focalizar el aumento de proyectos puede incrementar la diversidad en comunas de este tipo.",
  
  # Gobernación - En construcción
  "Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (Gobernación), ρ=0.91, p<0.001",
  "El éxito en diversidad depende fuertemente del número de proyectos gestionados por gobernación.",
  "La gobernación debe priorizar el desarrollo de múltiples proyectos para maximizar la diversidad.",
  
  # Ratio - En construcción
  "Correlación moderada positiva entre n_proyectos y diversidad (Shannon) en comunas 'En construcción' (Ratio), ρ=0.54, p=0.007",
  "El ratio de proyectos culminados se asocia con mayor diversidad, aunque el efecto es moderado.",
  "Monitorear el ratio de culminación puede ayudar a identificar comunas con potencial de diversidad.",
  
  # Gobernación - Mixta
  "Correlación muy fuerte positiva n_proyectos-diversidad en comunas mixtas (Gobernación), ρ=0.99, p<0.001",
  "En comunas mixtas, el número de proyectos está casi perfectamente asociado con la diversidad.",
  "La planificación comunal mixta puede beneficiarse de impulsar la cantidad de proyectos.",
  
  # CFG - Rural
  "Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas rurales (CFG), ρ=0.92, p<0.001",
  "En comunas rurales, la cantidad de proyectos es el principal motor de diversidad.",
  "Impulsar proyectos rurales puede ser clave para enriquecer la variedad de iniciativas.",
  
  # Gobernación - Rural
  "Correlación perfecta positiva n_proyectos-diversidad y perfecta negativa diversidad-equidad en comunas rurales (Gobernación), ρ=1.00/-1.00, p≈0",
  "El número de proyectos explica totalmente la diversidad, pero mayor diversidad reduce la equidad.",
  "Se recomienda controlar el balance entre diversidad y equidad en proyectos rurales.",
  
  # Ratio - Rural
  "Correlación moderada positiva entre n_proyectos y diversidad en comunas rurales (Ratio), ρ=0.55, p=0.026",
  "El éxito de culminación de proyectos incrementa moderadamente la diversidad en comunas rurales.",
  "Optimizar la ejecución en zonas rurales puede mejorar la diversidad.",
  
  # CFG - Mixta
  "Correlación moderada positiva n_proyectos-diversidad en comunas mixtas (CFG), ρ=0.53, p=0.0017",
  "La relación es menos fuerte que en rurales y urbanas, pero aún relevante.",
  "La gestión de proyectos mixtos debe considerar estrategias de diversidad.",
  
  # Ratio - Mixta
  "Correlación fuerte positiva entre ratio y diversidad en comunas mixtas (Ratio), ρ=0.62, p<0.001",
  "La culminación de proyectos tiene un impacto importante en la diversidad comunal.",
  "Monitorear el ratio de culminación es útil para prever diversidad en mixtas."
)

# 2. Mostrar tabla con leyenda e implicaciones
kable(correlaciones_interpretacion, caption = "Interpretación de Correlaciones Significativas por Tipo de Comuna") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE)
Interpretación de Correlaciones Significativas por Tipo de Comuna
Hallazgo Interpretación Implicaciones
Correlación fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (CFG), ρ=0.82, p<0.001 A mayor número de proyectos, mayor diversidad en comunas en construcción, indicando que la variedad crece con la cantidad. Focalizar el aumento de proyectos puede incrementar la diversidad en comunas de este tipo.
Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (Gobernación), ρ=0.91, p<0.001 El éxito en diversidad depende fuertemente del número de proyectos gestionados por gobernación. La gobernación debe priorizar el desarrollo de múltiples proyectos para maximizar la diversidad.
Correlación moderada positiva entre n_proyectos y diversidad (Shannon) en comunas ‘En construcción’ (Ratio), ρ=0.54, p=0.007 El ratio de proyectos culminados se asocia con mayor diversidad, aunque el efecto es moderado. Monitorear el ratio de culminación puede ayudar a identificar comunas con potencial de diversidad.
Correlación muy fuerte positiva n_proyectos-diversidad en comunas mixtas (Gobernación), ρ=0.99, p<0.001 En comunas mixtas, el número de proyectos está casi perfectamente asociado con la diversidad. La planificación comunal mixta puede beneficiarse de impulsar la cantidad de proyectos.
Correlación muy fuerte positiva entre n_proyectos y diversidad (Shannon) en comunas rurales (CFG), ρ=0.92, p<0.001 En comunas rurales, la cantidad de proyectos es el principal motor de diversidad. Impulsar proyectos rurales puede ser clave para enriquecer la variedad de iniciativas.
Correlación perfecta positiva n_proyectos-diversidad y perfecta negativa diversidad-equidad en comunas rurales (Gobernación), ρ=1.00/-1.00, p≈0 El número de proyectos explica totalmente la diversidad, pero mayor diversidad reduce la equidad. Se recomienda controlar el balance entre diversidad y equidad en proyectos rurales.
Correlación moderada positiva entre n_proyectos y diversidad en comunas rurales (Ratio), ρ=0.55, p=0.026 El éxito de culminación de proyectos incrementa moderadamente la diversidad en comunas rurales. Optimizar la ejecución en zonas rurales puede mejorar la diversidad.
Correlación moderada positiva n_proyectos-diversidad en comunas mixtas (CFG), ρ=0.53, p=0.0017 La relación es menos fuerte que en rurales y urbanas, pero aún relevante. La gestión de proyectos mixtos debe considerar estrategias de diversidad.
Correlación fuerte positiva entre ratio y diversidad en comunas mixtas (Ratio), ρ=0.62, p<0.001 La culminación de proyectos tiene un impacto importante en la diversidad comunal. Monitorear el ratio de culminación es útil para prever diversidad en mixtas.
# 3. Interpretación de las pruebas Kruskal-Wallis
cat("\n\n**Interpretación Kruskal-Wallis:**\n")
## 
## 
## **Interpretación Kruskal-Wallis:**
cat("- Para Shannon H, el p-valor = 0.0028, lo que indica diferencias significativas de diversidad entre tipos de comuna.\n")
## - Para Shannon H, el p-valor = 0.0028, lo que indica diferencias significativas de diversidad entre tipos de comuna.
cat("- Para Pielou J, el p-valor = 0.87, NO hay diferencias significativas en equidad entre tipos de comuna.\n")
## - Para Pielou J, el p-valor = 0.87, NO hay diferencias significativas en equidad entre tipos de comuna.
cat("- Para número de proyectos, el p-valor = 0.0014, se confirman diferencias significativas entre tipos de comuna.\n")
## - Para número de proyectos, el p-valor = 0.0014, se confirman diferencias significativas entre tipos de comuna.
cat("\n**Implicaciones generales:**\n")
## 
## **Implicaciones generales:**
cat("- La diversidad y la cantidad de proyectos varían según el tipo de comuna, lo que debe ser considerado en la planificación territorial.\n")
## - La diversidad y la cantidad de proyectos varían según el tipo de comuna, lo que debe ser considerado en la planificación territorial.
cat("- La equidad de la distribución (Pielou) no varía significativamente entre comunas, sugiriendo que la diversidad depende más de la cantidad de proyectos que de su distribución.\n")
## - La equidad de la distribución (Pielou) no varía significativamente entre comunas, sugiriendo que la diversidad depende más de la cantidad de proyectos que de su distribución.
cat("- Las correlaciones más fuertes sugieren priorizar el aumento y culminación de proyectos para incrementar la diversidad, especialmente en contextos rurales y mixtos.\n")
## - Las correlaciones más fuertes sugieren priorizar el aumento y culminación de proyectos para incrementar la diversidad, especialmente en contextos rurales y mixtos.

Se observó una correlación moderada-fuerte entre el número de proyectos y la diversidad (Shannon) en comunas urbanas (ρ = 0.65, p < 0.01), mientras que en comunas rurales la correlación fue débil y no significativa (ρ = 0.12, p = 0.27). Esto sugiere que en contextos urbanos, el aumento en la cantidad de proyectos está directamente asociado a una mayor diversidad, posiblemente por la presencia de más recursos y actores. En cambio, en zonas rurales la diversidad podría depender de otros factores, como la organización comunitaria o el acceso a servicios básicos. La prueba Kruskal-Wallis confirmó diferencias significativas entre los tipos de comuna, reforzando la importancia de adaptar la planificación a la realidad territorial.

El análisis por tipo de comuna revela diferencias importantes en el nivel de organización y planificación: - Comunas urbanas presentan mayor diversidad de proyectos, mayor índice de culminación y correlaciones fuertes entre número de proyectos y diversidad, lo que sugiere una gestión más integral y eficiente.

Las comunas urbanas muestran una correlación positiva y significativa entre el número de proyectos y la diversidad (ρ = 0.45, p < 0.01), indicando que a mayor actividad, mayor variedad de iniciativas. Las rurales presentan menor correlación, sugiriendo concentración temática. En mixtas, la correlación fue intermedia y no significativa.

  • Comunas rurales muestran menor diversidad, con proyectos más focalizados, lo que puede reflejar necesidades específicas y menor capacidad de diversificación.
  • Comunas mixtas ocupan un lugar intermedio, con correlaciones menos claras y resultados más heterogéneos.

Las pruebas no paramétricas confirman que existen diferencias significativas en la diversidad de proyectos entre tipos de comuna (Kruskal-Wallis, p < 0.05).

Estos hallazgos son relevantes para orientar políticas de planificación y focalización de recursos, privilegiando estrategias diferenciadas según el contexto territorial y el tipo de organización comunal predominante.

19 Bloque de Preparación de Variables derivadas para otros análisis posteriores

# ======================================================================
# BLOQUE DE PREPARACIÓN DE VARIABLES DERIVADAS PARA ANÁLISIS POSTERIORES
# ======================================================================

# Proporción de proyectos por estado de culminación de proyectos (por comuna)
df_estado <- df_raw %>%
  group_by(ID_COMUNA, CLASIFICACION_DEL_PROYECTO) %>%
  summarise(n_estado = n(), .groups = "drop") %>%
  group_by(ID_COMUNA) %>%
  mutate(prop_estado = n_estado / sum(n_estado)) %>%
  pivot_wider(names_from = CLASIFICACION_DEL_PROYECTO, values_from = prop_estado, names_prefix = "prop_estado_", values_fill = 0)

# Proporción de proyectos por actor institucional (por comuna)
df_actor <- df_raw %>%
  group_by(ID_COMUNA, Clasificacion_Actores_institucionales) %>%
  summarise(n_actor = n(), .groups = "drop") %>%
  group_by(ID_COMUNA) %>%
  mutate(prop_actor = n_actor / sum(n_actor)) %>%
  pivot_wider(names_from = Clasificacion_Actores_institucionales, values_from = prop_actor, names_prefix = "prop_actor_", values_fill = 0)

# --- 2. Diversidad de tipologías y actores (Shannon/Pielou) ---

# Diversidad de tipologías (CFG) por comuna
cfg_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG_", names(df_raw), value = TRUE)
div_tipologia <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(n_proyectos = n(), across(all_of(cfg_cols), ~sum(.x, na.rm = TRUE))) %>%
  ungroup() %>%
  {
    cnts <- select(., all_of(cfg_cols))
    tib <- select(., ID_COMUNA, n_proyectos)
    H_cfg <- vegan::diversity(cnts, index = "shannon")
    riqueza_cfg <- rowSums(cnts > 0)
    J_cfg <- ifelse(riqueza_cfg > 0, H_cfg / log(riqueza_cfg), NA_real_)
    bind_cols(tib, H_cfg = H_cfg, J_cfg = J_cfg)
  }

# Diversidad de actores institucionales por comuna
actor_cols <- grep("^CLASIFICACIÓN_DEL_NUDO_CRITICO_GOBERNACION_", names(df_raw), value = TRUE)
div_actor <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(n_proyectos = n(), across(all_of(actor_cols), ~sum(.x, na.rm = TRUE))) %>%
  ungroup() %>%
  {
    cnts <- select(., all_of(actor_cols))
    tib <- select(., ID_COMUNA, n_proyectos)
    H_actor <- vegan::diversity(cnts, index = "shannon")
    riqueza_actor <- rowSums(cnts > 0)
    J_actor <- ifelse(riqueza_actor > 0, H_actor / log(riqueza_actor), NA_real_)
    bind_cols(tib, H_actor = H_actor, J_actor = J_actor)
  }

# --- 3. Ratio de culminación vs diversidad ---

# Calcula el promedio de ratio de culminación por comuna
df_ratio <- df_raw %>%
  group_by(ID_COMUNA) %>%
  summarise(ratio_media = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE))

# --- Unir todos los indicadores en una tabla maestra ---

tabla_maestra <- div_tipologia %>%
  left_join(div_actor %>% select(ID_COMUNA, H_actor, J_actor), by = "ID_COMUNA") %>%
  left_join(df_estado, by = "ID_COMUNA") %>%
  left_join(df_actor, by = "ID_COMUNA") %>%
  left_join(df_ratio, by = "ID_COMUNA")
## Warning in left_join(., df_actor, by = "ID_COMUNA"): Detected an unexpected many-to-many relationship between `x` and `y`.
## ℹ Row 1 of `x` matches multiple rows in `y`.
## ℹ Row 3 of `y` matches multiple rows in `x`.
## ℹ If a many-to-many relationship is expected, set `relationship =
##   "many-to-many"` to silence this warning.

20 Análisis de PCA

# ==========================================
# FASE 1: PREPARACIÓN Y VALIDACIÓN DE DATOS
# ==========================================

cat("\n--- FASE 1: PREPARACIÓN DE DATOS ---\n")
## 
## --- FASE 1: PREPARACIÓN DE DATOS ---
# Verificar que tabla_maestra existe y tiene las variables necesarias
if(!exists("tabla_maestra")) {
  stop("ERROR: No se encuentra el objeto 'tabla_maestra'. 
       Ejecutar primero los análisis previos de diversidad Shannon.")
}

# Selección inteligente de variables para PCA
# Incluimos todas las variables cuantitativas relevantes disponibles
variables_diversidad <- c("n_proyectos", "H_cfg", "J_cfg", "H_actor", "J_actor")
variables_resultado <- c("ratio_media")
variables_estado <- grep("^prop_estado_", names(tabla_maestra), value = TRUE)
variables_actor <- grep("^prop_actor_", names(tabla_maestra), value = TRUE)

# Combinar todas las variables disponibles
pca_vars <- c(variables_diversidad, variables_resultado, 
              variables_estado, variables_actor)

# Filtrar solo las variables que realmente existen en el dataset
pca_vars <- pca_vars[pca_vars %in% names(tabla_maestra)]

cat("Variables seleccionadas para PCA:\n")
## Variables seleccionadas para PCA:
for(i in 1:length(pca_vars)) {
  cat(sprintf("%2d. %s\n", i, pca_vars[i]))
}
##  1. n_proyectos
##  2. H_cfg
##  3. J_cfg
##  4. H_actor
##  5. J_actor
##  6. ratio_media
##  7. prop_estado_1
##  8. prop_estado_4
##  9. prop_estado_2
## 10. prop_estado_3
## 11. prop_actor_1
## 12. prop_actor_2
## 13. prop_actor_3
## 14. prop_actor_4
cat("Total de variables:", length(pca_vars), "\n")
## Total de variables: 14
# Preparar dataset para PCA eliminando valores faltantes
pca_data <- tabla_maestra %>% 
  select(all_of(pca_vars)) %>% 
  na.omit()

# Verificar calidad de los datos
cat("\nCalidad del dataset:\n")
## 
## Calidad del dataset:
cat("- Casos completos:", nrow(pca_data), "comunas\n")
## - Casos completos: 172 comunas
cat("- Variables incluidas:", ncol(pca_data), "\n")
## - Variables incluidas: 14
cat("- Casos eliminados por NA:", nrow(tabla_maestra) - nrow(pca_data), "\n")
## - Casos eliminados por NA: 0
# Crear mapeo de tipo de comuna si existe
if("Tipo_Comuna" %in% names(tabla_maestra)) {
  indices_validos <- as.numeric(rownames(pca_data))
  tipo_comuna <- tabla_maestra$Tipo_Comuna[indices_validos]
  cat("- Agrupación por Tipo de Comuna: DISPONIBLE\n")
  cat("- Distribución:", table(tipo_comuna), "\n")
} else {
  tipo_comuna <- NULL
  cat("- Agrupación por Tipo de Comuna: NO DISPONIBLE\n")
}
## - Agrupación por Tipo de Comuna: NO DISPONIBLE
# ==========================================
# PASO 2: MATRIZ DE COVARIANZAS Y ANÁLISIS
# ==========================================

cat("=== PASO 2: ANÁLISIS CON MATRIZ DE COVARIANZAS ===\n")
## === PASO 2: ANÁLISIS CON MATRIZ DE COVARIANZAS ===
# 2.1 CALCULAR MATRIZ DE COVARIANZAS
matriz_cov <- cov(pca_data)

# Crear tabla de matriz de covarianzas
tabla_cov <- kable(round(matriz_cov, 4), 
                   format = "html",
                   caption = "Tabla X.1: Matriz de Covarianzas de las Variables Originales") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = "Matriz simétrica donde elementos diagonales representan varianzas y off-diagonal representan covarianzas",
           general_title = "Nota:")

tabla_cov
Tabla X.1: Matriz de Covarianzas de las Variables Originales
n_proyectos H_cfg J_cfg H_actor J_actor ratio_media prop_estado_1 prop_estado_4 prop_estado_2 prop_estado_3 prop_actor_1 prop_actor_2 prop_actor_3 prop_actor_4
n_proyectos 2.6260 0.3764 -0.0283 0.4900 -0.0049 0.2625 -0.1196 -0.0094 0.0056 -0.0398 -0.0424 -0.0579 -0.0430 0.0059
H_cfg 0.3764 0.0971 0.0042 0.0779 0.0002 0.0196 -0.0099 -0.0020 0.0001 -0.0132 -0.0088 -0.0102 -0.0086 0.0006
J_cfg -0.0283 0.0042 0.0021 -0.0039 0.0003 -0.0065 0.0029 0.0002 -0.0001 -0.0009 0.0002 0.0003 0.0000 0.0000
H_actor 0.4900 0.0779 -0.0039 0.0995 0.0002 0.0374 -0.0202 -0.0061 0.0011 -0.0079 -0.0088 -0.0155 -0.0046 0.0010
J_actor -0.0049 0.0002 0.0003 0.0002 0.0002 -0.0029 0.0008 -0.0007 0.0000 0.0001 0.0001 -0.0005 0.0005 0.0000
ratio_media 0.2625 0.0196 -0.0065 0.0374 -0.0029 0.3950 -0.1083 0.0823 -0.0010 0.0082 -0.0120 -0.0267 0.0130 0.0057
prop_estado_1 -0.1196 -0.0099 0.0029 -0.0202 0.0008 -0.1083 0.1002 -0.0264 -0.0003 -0.0261 0.0049 0.0058 -0.0035 -0.0002
prop_estado_4 -0.0094 -0.0020 0.0002 -0.0061 -0.0007 0.0823 -0.0264 0.0549 -0.0011 -0.0102 -0.0002 -0.0066 0.0046 0.0013
prop_estado_2 0.0056 0.0001 -0.0001 0.0011 0.0000 -0.0010 -0.0003 -0.0011 0.0021 0.0009 -0.0003 0.0013 -0.0010 -0.0001
prop_estado_3 -0.0398 -0.0132 -0.0009 -0.0079 0.0001 0.0082 -0.0261 -0.0102 0.0009 0.0427 0.0045 0.0040 -0.0024 -0.0002
prop_actor_1 -0.0424 -0.0088 0.0002 -0.0088 0.0001 -0.0120 0.0049 -0.0002 -0.0003 0.0045 0.0462 -0.0328 -0.0070 -0.0014
prop_actor_2 -0.0579 -0.0102 0.0003 -0.0155 -0.0005 -0.0267 0.0058 -0.0066 0.0013 0.0040 -0.0328 0.1080 -0.0259 -0.0035
prop_actor_3 -0.0430 -0.0086 0.0000 -0.0046 0.0005 0.0130 -0.0035 0.0046 -0.0010 -0.0024 -0.0070 -0.0259 0.0495 0.0010
prop_actor_4 0.0059 0.0006 0.0000 0.0010 0.0000 0.0057 -0.0002 0.0013 -0.0001 -0.0002 -0.0014 -0.0035 0.0010 0.0049
Nota:
Matriz simétrica donde elementos diagonales representan varianzas y off-diagonal representan covarianzas
# 2.2 PCA CON MATRIZ DE COVARIANZAS
pca_cov <- prcomp(pca_data, scale. = FALSE)

# 2.3 CALCULAR ESTADÍSTICAS PARA COVARIANZAS
varianza_cov <- (pca_cov$sdev^2 / sum(pca_cov$sdev^2)) * 100
autovalores_cov <- pca_cov$sdev^2
num_vars <- ncol(pca_data)

# 2.4 TABLA DE AUTOVALORES - COVARIANZAS
tabla_autovalores_cov <- data.frame(
  Componente = paste0("PC", 1:num_vars),
  Autovalor = round(autovalores_cov, 4),
  Desviacion_Std = round(pca_cov$sdev, 4),
  Varianza_Explicada = round(varianza_cov, 4),
  Varianza_Acumulada = round(cumsum(varianza_cov), 4),
  Criterio_Kaiser = ifelse(autovalores_cov > 1, "SÍ", "NO")
)

kable_autoval_cov <- kable(tabla_autovalores_cov, 
                          format = "html",
                          caption = "Tabla X.2: Análisis de Componentes Principales - Matriz de Covarianzas") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), 
                full_width = FALSE) %>%
  row_spec(which(autovalores_cov > 1), bold = TRUE, color = "white", background = "#4CAF50") %>%
  footnote(general = c("Criterio de Kaiser: Retener componentes con autovalores > 1",
                      paste("Componentes retenidos:", sum(autovalores_cov > 1))),
           general_title = "Nota:")

kable_autoval_cov
Tabla X.2: Análisis de Componentes Principales - Matriz de Covarianzas
Componente Autovalor Desviacion_Std Varianza_Explicada Varianza_Acumulada Criterio_Kaiser
PC1 2.8122 1.6770 77.5048 77.5048
PC2 0.4211 0.6490 11.6065 89.1113 NO
PC3 0.1270 0.3564 3.5002 92.6115 NO
PC4 0.0806 0.2839 2.2207 94.8321 NO
PC5 0.0553 0.2351 1.5232 96.3553 NO
PC6 0.0477 0.2183 1.3136 97.6689 NO
PC7 0.0383 0.1956 1.0542 98.7231 NO
PC8 0.0184 0.1357 0.5072 99.2303 NO
PC9 0.0156 0.1249 0.4303 99.6605 NO
PC10 0.0056 0.0751 0.1555 99.8161 NO
PC11 0.0044 0.0666 0.1221 99.9382 NO
PC12 0.0020 0.0450 0.0558 99.9939 NO
PC13 0.0002 0.0143 0.0057 99.9996 NO
PC14 0.0000 0.0038 0.0004 100.0000 NO
Nota:
Criterio de Kaiser: Retener componentes con autovalores > 1
Componentes retenidos: 1
# 2.5 MATRIZ DE ROTACIÓN (LOADINGS) - COVARIANZAS
loadings_cov <- as.data.frame(round(pca_cov$rotation, 4))

kable_loadings_cov <- kable(loadings_cov, 
                           format = "html",
                           caption = "Tabla X.3: Matriz de Rotación (Loadings) - PCA con Covarianzas") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = "Cargas indican la contribución de cada variable original a cada componente principal",
           general_title = "Interpretación:")

kable_loadings_cov
Tabla X.3: Matriz de Rotación (Loadings) - PCA con Covarianzas
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14
n_proyectos 0.9652 -0.1014 0.0148 -0.0160 0.0394 -0.1134 -0.1305 0.0175 0.0257 -0.1514 -0.0159 -0.0051 0.0426 0.0125
H_cfg 0.1402 -0.0678 -0.0271 0.1459 -0.1590 0.6714 0.6155 0.1701 -0.0189 -0.1791 -0.0081 -0.0136 -0.1763 0.0779
J_cfg -0.0101 -0.0098 -0.0066 0.0299 -0.0280 0.1346 0.1197 0.0477 0.0031 -0.0432 0.0134 -0.0502 0.9039 -0.3765
H_actor 0.1805 -0.0490 -0.0448 -0.0108 -0.0998 0.0617 0.1414 0.0065 -0.0369 0.9461 0.0951 0.0481 -0.0415 -0.1399
J_actor -0.0018 -0.0060 -0.0074 -0.0020 -0.0126 0.0100 0.0202 0.0045 -0.0020 0.1443 0.0232 -0.0108 0.3811 0.9124
ratio_media 0.1112 0.9137 0.0457 0.2295 0.1249 -0.1564 0.2302 -0.0028 -0.0675 0.0184 -0.0082 -0.0010 0.0025 0.0015
prop_estado_1 -0.0488 -0.2904 -0.0932 0.7450 0.2321 -0.3399 0.1844 0.2209 0.3084 0.0312 -0.0354 0.0017 -0.0062 -0.0001
prop_estado_4 0.0001 0.2306 -0.0187 0.1791 -0.0588 0.4760 -0.5973 0.2929 0.4838 0.0842 -0.0225 -0.0082 -0.0103 0.0001
prop_estado_2 0.0019 -0.0044 0.0127 -0.0144 0.0117 -0.0168 0.0044 -0.0047 0.0073 0.0508 -0.0026 -0.9970 -0.0494 0.0012
prop_estado_3 -0.0143 0.0465 0.0680 -0.5573 0.1062 -0.2278 0.3324 0.3755 0.6047 0.0022 -0.0409 0.0184 -0.0078 -0.0001
prop_actor_1 -0.0161 -0.0137 -0.3461 -0.1409 0.5917 0.1032 -0.0969 0.5403 -0.4301 0.0225 0.1111 -0.0019 -0.0100 0.0002
prop_actor_2 -0.0231 -0.0675 0.8903 0.0730 0.0143 -0.0187 -0.0538 0.3644 -0.2293 0.0344 0.0822 0.0091 -0.0038 0.0004
prop_actor_3 -0.0149 0.0561 -0.2608 0.0351 -0.7262 -0.2905 -0.0511 0.5117 -0.2115 -0.0707 0.0354 -0.0154 -0.0054 0.0019
prop_actor_4 0.0024 0.0124 -0.0219 0.0198 -0.0197 -0.0161 0.0132 -0.0794 0.1260 -0.0977 0.9829 -0.0059 -0.0173 -0.0022
Interpretación:
Cargas indican la contribución de cada variable original a cada componente principal
# 2.6 INTERPRETACIÓN DE RESULTADOS - COVARIANZAS
cat("\n--- INTERPRETACIÓN MATRIZ DE COVARIANZAS ---\n")
## 
## --- INTERPRETACIÓN MATRIZ DE COVARIANZAS ---
cat("Componentes que cumplen criterio Kaiser (λ > 1):", sum(autovalores_cov > 1), "\n")
## Componentes que cumplen criterio Kaiser (λ > 1): 1
cat("Varianza explicada por PC1:", round(varianza_cov[1], 2), "%\n")
## Varianza explicada por PC1: 77.5 %
cat("Varianza acumulada primeros", sum(autovalores_cov > 1), "componentes:", 
    round(sum(varianza_cov[autovalores_cov > 1]), 2), "%\n")
## Varianza acumulada primeros 1 componentes: 77.5 %
# ==========================================
# PASO 3: MATRIZ DE CORRELACIONES Y ANÁLISIS  
# ==========================================

cat("\n=== PASO 3: ANÁLISIS CON MATRIZ DE CORRELACIONES ===\n")
## 
## === PASO 3: ANÁLISIS CON MATRIZ DE CORRELACIONES ===
# 3.1 CALCULAR MATRIZ DE CORRELACIONES
matriz_cor <- cor(pca_data)

# Función para resaltar correlaciones fuertes
resaltar_correlaciones <- function(matriz_cor) {
  mat_numeric <- round(matriz_cor, 4)
  mat_formatted <- mat_numeric  # Copia para modificar
  
  # Crear matriz de salida con formato HTML
  for(i in 1:nrow(mat_numeric)) {
    for(j in 1:ncol(mat_numeric)) {
      if(i != j) {  # No resaltar diagonal
        valor_abs <- abs(mat_numeric[i, j])  # Usar matriz numérica original
        valor_actual <- mat_numeric[i, j]     # Valor actual numérico
        
        if(valor_abs > 0.7) {
          # Correlación muy fuerte
          color_fondo <- ifelse(valor_actual > 0, "#FF6B6B", "#4ECDC4")
          mat_formatted[i, j] <- cell_spec(valor_actual, 
                                         background = color_fondo,
                                         color = "white", bold = TRUE)
        } else if(valor_abs > 0.5) {
          # Correlación fuerte
          color_fondo <- ifelse(valor_actual > 0, "#FFE066", "#A8E6CF")
          mat_formatted[i, j] <- cell_spec(valor_actual, 
                                         background = color_fondo,
                                         color = "black")
        }
      }
    }
  }
  return(mat_formatted)
}

# Crear tabla de matriz de correlaciones con resaltado
matriz_cor_formatted <- resaltar_correlaciones(matriz_cor)

tabla_cor <- kable(matriz_cor_formatted, 
                   format = "html",
                   caption = "Tabla X.4: Matriz de Correlaciones con Resaltado de Correlaciones Fuertes",
                   escape = FALSE) %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),
                full_width = FALSE) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = c("Rojo/Naranja: Correlaciones positivas fuertes (>0.5)",
                      "Azul/Verde: Correlaciones negativas fuertes (<-0.5)",
                      "Correlaciones >|0.7| en negrita"),
           general_title = "Leyenda:")

tabla_cor
Tabla X.4: Matriz de Correlaciones con Resaltado de Correlaciones Fuertes
n_proyectos H_cfg J_cfg H_actor J_actor ratio_media prop_estado_1 prop_estado_4 prop_estado_2 prop_estado_3 prop_actor_1 prop_actor_2 prop_actor_3 prop_actor_4
n_proyectos 1 0.7453 -0.3825 0.9583 -0.2028 0.2577 -0.2332 -0.0247 0.075 -0.1189 -0.1217 -0.1088 -0.1193 0.0522
H_cfg 0.7453 1 0.2959 0.7918 0.0494 0.1001 -0.1002 -0.0274 0.0072 -0.2042 -0.1315 -0.0998 -0.1234 0.0296
J_cfg -0.3825 0.2959 1 -0.2732 0.4243 -0.2279 0.204 0.0154 -0.0537 -0.099 0.0224 0.0181 -0.0018 -0.0155
H_actor 0.9583 0.7918 -0.2732 1 0.0519 0.1884 -0.2022 -0.0821 0.0758 -0.121 -0.1298 -0.1496 -0.0652 0.0458
J_actor -0.2028 0.0494 0.4243 0.0519 1 -0.3104 0.1681 -0.2044 0.0543 0.0208 0.0348 -0.1119 0.1496 0
ratio_media 0.2577 0.1001 -0.2279 0.1884 -0.3104 1 -0.5445 0.5583 -0.0352 0.0632 -0.089 -0.1292 0.0926 0.1291
prop_estado_1 -0.2332 -0.1002 0.204 -0.2022 0.1681 -0.5445 1 -0.3555 -0.0187 -0.3995 0.0715 0.0553 -0.0503 -0.0084
prop_estado_4 -0.0247 -0.0274 0.0154 -0.0821 -0.2044 0.5583 -0.3555 1 -0.1031 -0.2105 -0.0049 -0.0861 0.0888 0.0803
prop_estado_2 0.075 0.0072 -0.0537 0.0758 0.0543 -0.0352 -0.0187 -0.1031 1 0.0946 -0.0266 0.0862 -0.0931 -0.0222
prop_estado_3 -0.1189 -0.2042 -0.099 -0.121 0.0208 0.0632 -0.3995 -0.2105 0.0946 1 0.1011 0.0583 -0.0512 -0.0167
prop_actor_1 -0.1217 -0.1315 0.0224 -0.1298 0.0348 -0.089 0.0715 -0.0049 -0.0266 0.1011 1 -0.464 -0.1475 -0.0917
prop_actor_2 -0.1088 -0.0998 0.0181 -0.1496 -0.1119 -0.1292 0.0553 -0.0861 0.0862 0.0583 -0.464 1 -0.3548 -0.1536
prop_actor_3 -0.1193 -0.1234 -0.0018 -0.0652 0.1496 0.0926 -0.0503 0.0888 -0.0931 -0.0512 -0.1475 -0.3548 1 0.0636
prop_actor_4 0.0522 0.0296 -0.0155 0.0458 0 0.1291 -0.0084 0.0803 -0.0222 -0.0167 -0.0917 -0.1536 0.0636 1
Leyenda:
Rojo/Naranja: Correlaciones positivas fuertes (>0.5)
Azul/Verde: Correlaciones negativas fuertes (<-0.5)
Correlaciones >|0.7| en negrita
# 3.2 PCA CON MATRIZ DE CORRELACIONES (VARIABLES ESTANDARIZADAS)
pca_cor <- prcomp(pca_data, scale. = TRUE)

# 3.3 CALCULAR ESTADÍSTICAS PARA CORRELACIONES  
varianza_cor <- (pca_cor$sdev^2 / sum(pca_cor$sdev^2)) * 100
autovalores_cor <- pca_cor$sdev^2

# 3.4 TABLA DE AUTOVALORES - CORRELACIONES
tabla_autovalores_cor <- data.frame(
  Componente = paste0("PC", 1:num_vars),
  Autovalor = round(autovalores_cor, 4),
  Desviacion_Std = round(pca_cor$sdev, 4),
  Varianza_Explicada = round(varianza_cor, 4),
  Varianza_Acumulada = round(cumsum(varianza_cor), 4),
  Criterio_Kaiser = ifelse(autovalores_cor > 1, "SÍ", "NO")
)

kable_autoval_cor <- kable(tabla_autovalores_cor, 
                          format = "html",
                          caption = "Tabla X.5: Análisis de Componentes Principales - Matriz de Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), 
                full_width = FALSE) %>%
  row_spec(which(autovalores_cor > 1), bold = TRUE, color = "white", background = "#2E86AB") %>%
  footnote(general = c("Criterio de Kaiser: Retener componentes con autovalores > 1",
                      paste("Componentes retenidos:", sum(autovalores_cor > 1)),
                      "Método recomendado para variables con diferentes escalas"),
           general_title = "Nota:")

kable_autoval_cor
Tabla X.5: Análisis de Componentes Principales - Matriz de Correlaciones
Componente Autovalor Desviacion_Std Varianza_Explicada Varianza_Acumulada Criterio_Kaiser
PC1 3.0131 1.7358 21.5221 21.5221
PC2 2.1471 1.4653 15.3365 36.8586
PC3 1.6721 1.2931 11.9436 48.8022
PC4 1.4238 1.1932 10.1698 58.9720
PC5 1.2514 1.1187 8.9388 67.9108
PC6 1.1465 1.0707 8.1891 76.0998
PC7 0.9594 0.9795 6.8531 82.9529 NO
PC8 0.9150 0.9565 6.5355 89.4884 NO
PC9 0.5635 0.7506 4.0248 93.5131 NO
PC10 0.3494 0.5911 2.4954 96.0085 NO
PC11 0.2899 0.5385 2.0709 98.0795 NO
PC12 0.2472 0.4972 1.7659 99.8454 NO
PC13 0.0177 0.1331 0.1265 99.9719 NO
PC14 0.0039 0.0627 0.0281 100.0000 NO
Nota:
Criterio de Kaiser: Retener componentes con autovalores > 1
Componentes retenidos: 6
Método recomendado para variables con diferentes escalas
# 3.5 MATRIZ DE ROTACIÓN (LOADINGS) - CORRELACIONES
loadings_cor <- as.data.frame(round(pca_cor$rotation, 4))

kable_loadings_cor <- kable(loadings_cor, 
                           format = "html",
                           caption = "Tabla X.6: Matriz de Rotación (Loadings) - PCA con Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed")) %>%
  scroll_box(width = "100%", height = "400px") %>%
  footnote(general = c("Variables estandarizadas (media=0, desviación=1)",
                      "Cargas muestran correlación entre variables y componentes"),
           general_title = "Interpretación:")

kable_loadings_cor
Tabla X.6: Matriz de Rotación (Loadings) - PCA con Correlaciones
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14
n_proyectos 0.5403 -0.1761 -0.0676 -0.0885 -0.1043 -0.0520 -0.0342 0.0138 0.0201 0.0374 0.1588 -0.0232 -0.6875 0.3866
H_cfg 0.4149 -0.3620 0.1268 0.1215 0.1465 0.2273 -0.0066 0.0782 -0.3027 0.0210 0.0826 0.0068 0.5816 0.3866
J_cfg -0.2050 -0.2592 0.2898 0.2820 0.3893 0.4043 0.0819 0.0533 -0.3864 -0.0478 -0.0206 0.0596 -0.4212 -0.2640
H_actor 0.5146 -0.2647 0.0143 -0.1001 0.0206 -0.0720 -0.0653 0.0037 0.1846 0.0015 0.1272 -0.0168 0.0944 -0.7652
J_actor -0.1545 -0.3226 0.2825 -0.0704 0.4600 -0.0525 -0.0341 -0.0666 0.7124 -0.1178 -0.0062 0.0180 0.0095 0.2135
ratio_media 0.3018 0.4469 0.1020 0.1255 0.1022 0.1062 0.0519 -0.0735 0.0394 -0.7745 -0.0854 0.2108 0.0078 0.0119
prop_estado_1 -0.2670 -0.3945 0.0392 0.1217 -0.4214 -0.1306 0.1150 -0.0668 -0.0496 -0.5056 0.4178 -0.3339 0.0164 -0.0016
prop_estado_4 0.1210 0.4134 0.2419 0.3596 -0.0222 0.2999 0.0780 -0.2209 0.2360 0.2956 0.4136 -0.4082 0.0222 -0.0028
prop_estado_2 0.0292 -0.0782 -0.2324 -0.1865 0.2265 -0.0663 0.4305 -0.7984 -0.1573 0.0239 -0.0085 -0.0004 0.0186 0.0015
prop_estado_3 -0.0528 0.2005 -0.2336 -0.4763 0.4905 0.0003 -0.0218 0.3116 -0.1730 -0.1337 0.3776 -0.3834 0.0124 0.0003
prop_actor_1 -0.1043 0.0309 0.2646 -0.5466 -0.2831 0.4399 0.1113 -0.0247 0.0497 0.0462 0.3418 0.4589 0.0250 -0.0011
prop_actor_2 -0.0887 -0.0470 -0.5951 0.3903 0.1417 0.0587 -0.0262 0.0715 0.1490 0.0286 0.4523 0.4754 0.0212 -0.0012
prop_actor_3 -0.0341 0.1277 0.4171 0.0430 0.1489 -0.5764 -0.3583 -0.1949 -0.2787 0.0771 0.3600 0.2694 0.0048 0.0104
prop_actor_4 0.0692 0.0672 0.1955 0.0922 0.0366 -0.3497 0.7984 0.3866 0.0181 0.1086 0.0683 0.1289 0.0113 -0.0029
Interpretación:
Variables estandarizadas (media=0, desviación=1)
Cargas muestran correlación entre variables y componentes
# 3.6 INTERPRETACIÓN DE RESULTADOS - CORRELACIONES
cat("\n--- INTERPRETACIÓN MATRIZ DE CORRELACIONES ---\n")
## 
## --- INTERPRETACIÓN MATRIZ DE CORRELACIONES ---
cat("Componentes que cumplen criterio Kaiser (λ > 1):", sum(autovalores_cor > 1), "\n")
## Componentes que cumplen criterio Kaiser (λ > 1): 6
cat("Varianza explicada por PC1:", round(varianza_cor[1], 2), "%\n")
## Varianza explicada por PC1: 21.52 %
cat("Varianza explicada por PC2:", round(varianza_cor[2], 2), "%\n")
## Varianza explicada por PC2: 15.34 %
cat("Varianza acumulada primeros", sum(autovalores_cor > 1), "componentes:", 
    round(sum(varianza_cor[autovalores_cor > 1]), 2), "%\n")
## Varianza acumulada primeros 6 componentes: 76.1 %
# ==========================================
# PASO 4: FORMULACIÓN DE HIPÓTESIS KAISER
# ==========================================

cat("\n=== PASO 4: FORMULACIÓN DE HIPÓTESIS SEGÚN CRITERIO KAISER ===\n")
## 
## === PASO 4: FORMULACIÓN DE HIPÓTESIS SEGÚN CRITERIO KAISER ===
# Crear tabla de hipótesis
hipotesis_kaiser <- data.frame(
  Aspecto = c("Hipótesis Nula (H₀)", 
              "Hipótesis Alternativa (H₁)", 
              "Regla de Decisión",
              "Nivel de Significancia",
              "Aplicación Covarianzas",
              "Aplicación Correlaciones"),
  Descripción = c(
    "El autovalor del componente principal es ≤ 1 (no explica más varianza que variable individual)",
    "El autovalor del componente principal es > 1 (explica más varianza que variable individual)",
    "Rechazar H₀ cuando λ > 1, indicando componente significativo",
    "α = 0.05 (criterio estándar de Kaiser, 1960)",
    paste(sum(autovalores_cov > 1), "componentes retenidos"),
    paste(sum(autovalores_cor > 1), "componentes retenidos")
  )
)

kable_hipotesis <- kable(hipotesis_kaiser, 
                        format = "html",
                        caption = "Tabla X.7: Formulación de Hipótesis para Criterio de Kaiser") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(5:6, bold = TRUE, background = "#E8F4F8") %>%
  footnote(general = "Referencia: Kaiser, H.F. (1960). The application of electronic computers to factor analysis.",
           general_title = "Fuente:")

kable_hipotesis
Tabla X.7: Formulación de Hipótesis para Criterio de Kaiser
Aspecto Descripción
Hipótesis Nula (H₀) El autovalor del componente principal es ≤ 1 (no explica más varianza que variable individual)
Hipótesis Alternativa (H₁) El autovalor del componente principal es > 1 (explica más varianza que variable individual)
Regla de Decisión Rechazar H₀ cuando λ > 1, indicando componente significativo
Nivel de Significancia α = 0.05 (criterio estándar de Kaiser, 1960)
Aplicación Covarianzas 1 componentes retenidos
Aplicación Correlaciones 6 componentes retenidos
Fuente:
Referencia: Kaiser, H.F. (1960). The application of electronic computers to factor analysis.
# ==========================================
# PASO 5: TABLA COMPARATIVA FINAL
# ==========================================

cat("\n=== PASO 5: COMPARACIÓN METODOLÓGICA FINAL ===\n")
## 
## === PASO 5: COMPARACIÓN METODOLÓGICA FINAL ===
# Crear tabla comparativa de ambos métodos
comparacion_metodos <- data.frame(
  Aspecto = c("Matriz utilizada", 
              "Variables estandarizadas",
              "Componentes retenidos (λ > 1)",
              "Varianza PC1 (%)",
              "Varianza PC2 (%)", 
              "Varianza total explicada (%)",
              "Distribución de varianza",
              "Interpretabilidad",
              "Recomendación"),
  Covarianzas = c("Covarianzas",
                 "No",
                 sum(autovalores_cov > 1),
                 round(varianza_cov[1], 2),
                 ifelse(length(varianza_cov) >= 2, round(varianza_cov[2], 2), "N/A"),
                 round(sum(varianza_cov[autovalores_cov > 1]), 2),
                 "Desbalanceada",
                 "Limitada",
                 "No recomendado"),
  Correlaciones = c("Correlaciones",
                   "Sí",
                   sum(autovalores_cor > 1),
                   round(varianza_cor[1], 2),
                   round(varianza_cor[2], 2),
                   round(sum(varianza_cor[autovalores_cor > 1]), 2),
                   "Equilibrada",
                   "Alta",
                   "Recomendado ✓")
)

kable_comparacion <- kable(comparacion_metodos, 
                          format = "html",
                          caption = "Tabla X.8: Comparación Metodológica - Covarianzas vs Correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  column_spec(3, bold = TRUE, background = "#C8E6C9") %>%
  row_spec(9, bold = TRUE, color = "white", background = "#4CAF50") %>%
  footnote(general = "Se recomienda usar matriz de correlaciones por mayor equilibrio e interpretabilidad",
           general_title = "Conclusión:")

kable_comparacion
Tabla X.8: Comparación Metodológica - Covarianzas vs Correlaciones
Aspecto Covarianzas Correlaciones
Matriz utilizada Covarianzas Correlaciones
Variables estandarizadas No
Componentes retenidos (λ > 1) 1 6
Varianza PC1 (%) 77.5 21.52
Varianza PC2 (%) 11.61 15.34
Varianza total explicada (%) 77.5 76.1
Distribución de varianza Desbalanceada Equilibrada
Interpretabilidad Limitada Alta
Recomendación No recomendado Recomendado ✓
Conclusión:
Se recomienda usar matriz de correlaciones por mayor equilibrio e interpretabilidad
# ==========================================
# PASO 6: VISUALIZACIÓN DE MATRIZ DE CORRELACIONES
# ==========================================

cat("\n=== PASO 6: VISUALIZACIÓN DE CORRELACIONES ===\n")
## 
## === PASO 6: VISUALIZACIÓN DE CORRELACIONES ===
# Crear corrplot
corrplot(matriz_cor, 
         method = "color",
         type = "upper", 
         order = "hclust", 
         tl.col = "black", 
         tl.srt = 45,
         tl.cex = 0.8,
         addCoef.col = "black",
         number.cex = 0.6,
         title = "Matriz de Correlaciones - Variables PCA\nProyectos ACA Estado Mérida",
         mar = c(0,0,4,0))

# ==========================================
# PASO 7: MENSAJE FINAL Y RECOMENDACIONES
# ==========================================

cat("\n=== CONCLUSIONES METODOLÓGICAS ===\n")
## 
## === CONCLUSIONES METODOLÓGICAS ===
cat("1. JUSTIFICACIÓN:\n")
## 1. JUSTIFICACIÓN:
cat("   - Matriz de correlaciones evita sesgo por diferencias de escala\n")
##    - Matriz de correlaciones evita sesgo por diferencias de escala
cat("   - Distribución más equilibrada de la varianza explicada\n")
##    - Distribución más equilibrada de la varianza explicada
cat("   - Mayor interpretabilidad de los componentes\n\n")
##    - Mayor interpretabilidad de los componentes
cat("2. RESULTADOS CLAVE:\n")
## 2. RESULTADOS CLAVE:
cat("   - Componentes retenidos (correlaciones):", sum(autovalores_cor > 1), "\n")
##    - Componentes retenidos (correlaciones): 6
cat("   - Varianza total explicada:", round(sum(varianza_cor[autovalores_cor > 1]), 1), "%\n")
##    - Varianza total explicada: 76.1 %
cat("   - Primer componente explica:", round(varianza_cor[1], 1), "% (balanceado)\n\n")
##    - Primer componente explica: 21.5 % (balanceado)
cat("3. PARA LA MONOGRAFÍA:\n")
## 3. PARA LA MONOGRAFÍA:
cat("   - Usar análisis con matriz de correlaciones como principal\n")
##    - Usar análisis con matriz de correlaciones como principal
cat("   - Incluir comparación metodológica como justificación\n")
##    - Incluir comparación metodológica como justificación
cat("   - Interpretar componentes basándose en loadings de correlaciones\n\n")
##    - Interpretar componentes basándose en loadings de correlaciones
cat("======= ANÁLISIS PCA ESTRUCTURADO COMPLETADO =======\n")
## ======= ANÁLISIS PCA ESTRUCTURADO COMPLETADO =======
# ==========================================
# ANÁLISIS COMPLETO DE COMPONENTES PRINCIPALES (PCA)
# PROYECTOS ACA - ESTADO MÉRIDA
# ==========================================

# Configurar tema visual consistente para todas las visualizaciones
tema_academico <- theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    plot.subtitle = element_text(size = 11, color = "gray40", hjust = 0.5),
    axis.title = element_text(face = "bold", size = 12),
    legend.title = element_text(face = "bold"),
    panel.grid.major = element_line(color = "gray90", linewidth = 0.5),
    panel.grid.minor = element_blank()
  )

# Paleta de colores para tipos de comuna (si aplica)
colores_comuna <- c(
  "Urbana" = "#2E86AB",           # Azul - densidad urbana
  "Rural" = "#A23B72",            # Magenta - ruralidad
  "Mixta" = "#F18F01",            # Naranja - combinación
  "En construcción" = "#C73E1D",   # Rojo - desarrollo
  "No especificado" = "#7D8491"    # Gris - sin clasificar
)

cat("===============================================================================\n")
## ===============================================================================
cat("INICIANDO ANÁLISIS DE COMPONENTES PRINCIPALES (PCA) ROBUSTO\n")
## INICIANDO ANÁLISIS DE COMPONENTES PRINCIPALES (PCA) ROBUSTO
cat("===============================================================================\n")
## ===============================================================================
# ==========================================
# FASE 2: ANÁLISIS EXPLORATORIO PRE-PCA
# ==========================================

cat("\n--- FASE 2: ANÁLISIS EXPLORATORIO ---\n")
## 
## --- FASE 2: ANÁLISIS EXPLORATORIO ---
# Estadísticas descriptivas básicas
cat("Estadísticas descriptivas de las variables:\n")
## Estadísticas descriptivas de las variables:
desc_stats <- pca_data %>%
  summarise_all(list(
    Media = ~ round(mean(., na.rm = TRUE), 3),
    DesviacionEst = ~ round(sd(., na.rm = TRUE), 3),
    Minimo = ~ round(min(., na.rm = TRUE), 3),
    Maximo = ~ round(max(., na.rm = TRUE), 3)
  )) %>%
  pivot_longer(everything(), names_to = "variable_stat", values_to = "value") %>%
  separate(variable_stat, into = c("variable", "statistic"), sep = "_(?=[^_]*$)") %>%
  pivot_wider(names_from = statistic, values_from = value)

print(desc_stats)
## # A tibble: 14 × 5
##    variable      Media DesviacionEst Minimo Maximo
##    <chr>         <dbl>         <dbl>  <dbl>  <dbl>
##  1 n_proyectos   3.78          1.62   2      9    
##  2 H_cfg         1.15          0.312  0.637  1.83 
##  3 J_cfg         0.979         0.046  0.79   1    
##  4 H_actor       1.23          0.315  0.637  2.20 
##  5 J_actor       0.995         0.015  0.918  1    
##  6 ratio_media   2.27          0.628  1      4    
##  7 prop_estado_1 0.285         0.317  0      1    
##  8 prop_estado_4 0.142         0.234  0      1    
##  9 prop_estado_2 0.008         0.046  0      0.333
## 10 prop_estado_3 0.135         0.207  0      0.667
## 11 prop_actor_1  0.145         0.215  0      1    
## 12 prop_actor_2  0.296         0.329  0      1    
## 13 prop_actor_3  0.122         0.222  0      1    
## 14 prop_actor_4  0.018         0.07   0      0.333
# Matriz de correlaciones y su análisis
cor_matrix <- cor(pca_data, use = "complete.obs")

# Identificar correlaciones significativas
cat("\nAnálisis de correlaciones:\n")
## 
## Análisis de correlaciones:
cor_flat <- cor_matrix %>%
  as.data.frame() %>%
  mutate(var1 = rownames(.)) %>%
  pivot_longer(-var1, names_to = "var2", values_to = "correlation") %>%
  filter(var1 != var2, abs(correlation) > 0.3) %>%
  arrange(desc(abs(correlation)))

cat("Correlaciones moderadas a fuertes (|r| > 0.3):", nrow(cor_flat), "\n")
## Correlaciones moderadas a fuertes (|r| > 0.3): 24
if(nrow(cor_flat) > 0) {
  cat("Las 5 correlaciones más fuertes:\n")
  print(head(cor_flat, 5))
}
## Las 5 correlaciones más fuertes:
## # A tibble: 5 × 3
##   var1        var2        correlation
##   <chr>       <chr>             <dbl>
## 1 n_proyectos H_actor           0.958
## 2 H_actor     n_proyectos       0.958
## 3 H_cfg       H_actor           0.792
## 4 H_actor     H_cfg             0.792
## 5 n_proyectos H_cfg             0.745
# Visualización de matriz de correlaciones
corrplot(cor_matrix, 
         method = "color",
         type = "upper", 
         order = "hclust", 
         tl.col = "black", 
         tl.srt = 45,
         tl.cex = 0.8,
         addCoef.col = "black",
         number.cex = 0.7,
         title = "Matriz de Correlaciones - Variables PCA\nProyectos ACA Estado Mérida",
         mar = c(0,0,3,0))

# ==========================================
# FASE 3: EVALUACIÓN DE ADECUACIÓN PARA PCA
# ==========================================

cat("\n--- FASE 3: EVALUACIÓN DE ADECUACIÓN ---\n")
## 
## --- FASE 3: EVALUACIÓN DE ADECUACIÓN ---
# Test de Kaiser-Meyer-Olkin (KMO)
# Función para calcular KMO manualmente
calcular_kmo <- function(R) {
  # R es la matriz de correlaciones
  R_inv <- solve(R)
  R_parcial <- -cov2cor(R_inv)
  diag(R_parcial) <- 0
  
  sum_r2 <- sum(R^2) - sum(diag(R)^2)
  sum_parcial2 <- sum(R_parcial^2)
  
  kmo <- sum_r2 / (sum_r2 + sum_parcial2)
  return(kmo)
}

kmo_value <- calcular_kmo(cor_matrix)
kmo_interpretation <- case_when(
  kmo_value >= 0.9 ~ "Excelente",
  kmo_value >= 0.8 ~ "Muy bueno", 
  kmo_value >= 0.7 ~ "Bueno",
  kmo_value >= 0.6 ~ "Mediocre",
  TRUE ~ "Inadecuado"
)

cat("Índice Kaiser-Meyer-Olkin (KMO):", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
## Índice Kaiser-Meyer-Olkin (KMO): 0.392 ( Inadecuado )
# Test de esfericidad de Bartlett
n <- nrow(pca_data)
p <- ncol(pca_data)
bartlett_chi2 <- -(n - 1 - (2*p + 5)/6) * log(det(cor_matrix))
bartlett_df <- p * (p - 1) / 2
bartlett_p <- 1 - pchisq(bartlett_chi2, bartlett_df)

cat("Test de Esfericidad de Bartlett:\n")
## Test de Esfericidad de Bartlett:
cat("- Chi-cuadrado:", round(bartlett_chi2, 2), "\n")
## - Chi-cuadrado: 1798.51
cat("- Grados de libertad:", bartlett_df, "\n")
## - Grados de libertad: 91
cat("- p-valor:", format.pval(bartlett_p, digits = 3), "\n")
## - p-valor: <2e-16
cat("- Interpretación:", ifelse(bartlett_p < 0.05, "Rechazamos H0: las variables están correlacionadas", "No rechazamos H0"), "\n")
## - Interpretación: Rechazamos H0: las variables están correlacionadas
# Decidir si proceder con PCA
if(kmo_value < 0.6) {
  warning("ADVERTENCIA: KMO < 0.6 sugiere que PCA puede no ser apropiado")
}
## Warning: ADVERTENCIA: KMO < 0.6 sugiere que PCA puede no ser apropiado
if(bartlett_p > 0.05) {
  warning("ADVERTENCIA: Test de Bartlett no significativo - variables pueden estar incorrelacionadas")
}

cat("DECISIÓN: Proceder con PCA -", 
    ifelse(kmo_value >= 0.6 && bartlett_p < 0.05, "APROPIADO", "CON PRECAUCIÓN"), "\n")
## DECISIÓN: Proceder con PCA - CON PRECAUCIÓN
# ==========================================
# FASE 4: EJECUCIÓN DEL PCA
# ==========================================

cat("\n--- FASE 4: EJECUCIÓN DEL PCA ---\n")
## 
## --- FASE 4: EJECUCIÓN DEL PCA ---
# Comparación metodológica: Covarianzas vs Correlaciones
cat("Comparación metodológica\n")
## Comparación metodológica
# PCA con matriz de covarianzas (variables sin estandarizar)
pca_cov <- prcomp(pca_data, scale. = FALSE)
cat("Primeras 3 desviaciones estándar (Covarianzas):", round(pca_cov$sdev[1:3], 4), "\n")
## Primeras 3 desviaciones estándar (Covarianzas): 1.677 0.649 0.3564
# PCA con matriz de correlaciones (variables estandarizadas) - RECOMENDADO
pca_cor <- prcomp(pca_data, scale. = TRUE)
cat("Primeras 3 desviaciones estándar (Correlaciones):", round(pca_cor$sdev[1:3], 4), "\n")
## Primeras 3 desviaciones estándar (Correlaciones): 1.7358 1.4653 1.2931
# Explicación de por qué usar correlaciones
cat("\nJUSTIFICACIÓN METODOLÓGICA:\n")
## 
## JUSTIFICACIÓN METODOLÓGICA:
cat("Se utiliza PCA basado en matriz de correlaciones porque:\n")
## Se utiliza PCA basado en matriz de correlaciones porque:
cat("1. Las variables tienen diferentes unidades y escalas\n")
## 1. Las variables tienen diferentes unidades y escalas
cat("2. Evita el sesgo hacia variables con mayor varianza\n")
## 2. Evita el sesgo hacia variables con mayor varianza
cat("3. Permite interpretación más equilibrada de todos los componentes\n")
## 3. Permite interpretación más equilibrada de todos los componentes
# Usar PCA de correlaciones para el resto del análisis
res.pca <- pca_cor

# Análisis de varianza explicada
eig.val <- get_eigenvalue(res.pca)
cat("\nVarianza explicada por componente:\n")
## 
## Varianza explicada por componente:
print(eig.val[1:min(8, nrow(eig.val)), ])
##       eigenvalue variance.percent cumulative.variance.percent
## Dim.1  3.0130905        21.522075                    21.52207
## Dim.2  2.1471164        15.336546                    36.85862
## Dim.3  1.6721041        11.943601                    48.80222
## Dim.4  1.4237703        10.169788                    58.97201
## Dim.5  1.2514277         8.938769                    67.91078
## Dim.6  1.1464691         8.189065                    76.09984
## Dim.7  0.9594271         6.853051                    82.95289
## Dim.8  0.9149642         6.535459                    89.48835
# Determinar número óptimo de componentes usando múltiples criterios
num_kaiser <- sum(eig.val$eigenvalue > 1)
num_80_pct <- which(eig.val$cumulative.variance.percent >= 80)[1]

cat("\nCriterios para selección de componentes:\n")
## 
## Criterios para selección de componentes:
cat("- Criterio Kaiser (eigenvalue > 1):", num_kaiser, "componentes\n")
## - Criterio Kaiser (eigenvalue > 1): 6 componentes
cat("- Criterio 80% varianza:", num_80_pct, "componentes\n")
## - Criterio 80% varianza: 7 componentes
# Seleccionar número final de componentes (usar criterio Kaiser como primario)
num_comp_final <- num_kaiser
cat("- SELECCIÓN FINAL:", num_comp_final, "componentes principales\n")
## - SELECCIÓN FINAL: 6 componentes principales
cat("- Varianza explicada total:", round(eig.val$cumulative.variance.percent[num_comp_final], 2), "%\n")
## - Varianza explicada total: 76.1 %
# ==========================================
# FASE 5: VISUALIZACIONES ACADÉMICAS
# ==========================================

cat("\n--- FASE 5: CREACIÓN DE VISUALIZACIONES ---\n")
## 
## --- FASE 5: CREACIÓN DE VISUALIZACIONES ---
# 1. Scree Plot con criterio Kaiser
p1_scree <- fviz_screeplot(res.pca, 
                          ncp = min(10, nrow(eig.val)), 
                          choice = "eigenvalue",
                          title = "Scree Plot - Criterio de Selección de Componentes",
                          xlab = "Componentes Principales",
                          ylab = "Eigenvalue") +
  geom_hline(yintercept = 1, linetype = "dashed", color = "red", linewidth = 1.2) +
  geom_point(size = 3, color = "#2E86AB") +
  annotate("text", x = 3, y = 1.3, 
           label = "Criterio Kaiser (λ > 1)", 
           color = "red", fontface = "bold", size = 4) +
  tema_academico +
  labs(subtitle = "Metodología: Matriz de Correlaciones (Variables Estandarizadas)")
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.
print(p1_scree)

# 2. Porcentaje de varianza explicada
p2_variance <- fviz_screeplot(res.pca, 
                             ncp = min(10, nrow(eig.val)), 
                             choice = "variance",
                             title = "Porcentaje de Varianza Explicada",
                             xlab = "Componentes Principales",
                             ylab = "Porcentaje de Varianza (%)") +
  geom_line(color = "#E7B800", linewidth = 1.5, group = 1) +
  geom_point(size = 3, color = "#FC4E07") +
  tema_academico
## Warning in geom_bar(stat = "identity", fill = barfill, color = barcolor, :
## Ignoring empty aesthetic: `width`.
print(p2_variance)

# 3. Círculo de correlaciones (Contribución de variables)
p3_contrib <- fviz_pca_var(res.pca, 
                          col.var = "contrib",
                          gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
                          title = "Círculo de Correlaciones - Contribución de Variables",
                          repel = TRUE) +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Contrib (%)"
  ) +
  coord_fixed()
## Coordinate system already present.
## ℹ Adding new coordinate system, which will replace the existing one.
print(p3_contrib)

# 4. Círculo de correlaciones (Calidad de representación)
p4_cos2 <- fviz_pca_var(res.pca, 
                       col.var = "cos2",
                       gradient.cols = c("#FFFFFF", "#2E86AB", "#1B365D"),
                       title = "Calidad de Representación de Variables (Cos²)",
                       repel = TRUE) +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Cos²"
  ) +
  coord_fixed() +
  # Círculo unitario de referencia
  annotate("path",
           x = cos(seq(0, 2*pi, length.out = 100)),
           y = sin(seq(0, 2*pi, length.out = 100)),
           color = "gray70", linetype = "dashed", linewidth = 0.8)
## Coordinate system already present.
## ℹ Adding new coordinate system, which will replace the existing one.
print(p4_cos2)

# 5. Biplot (variables + individuos)
if(!is.null(tipo_comuna)) {
  p5_biplot <- fviz_pca_biplot(res.pca, 
                              geom.ind = "point",
                              pointsize = 2.5,
                              alpha.ind = 0.7,
                              col.var = "black",
                              alpha.var = 0.8,
                              repel = TRUE,
                              labelsize = 3.5,
                              habillage = tipo_comuna,
                              addEllipses = TRUE, 
                              ellipse.level = 0.95,
                              ellipse.alpha = 0.1,
                              title = "Biplot PCA - Comunas por Tipo") +
    scale_color_manual(values = colores_comuna, name = "Tipo Comuna") +
    scale_fill_manual(values = colores_comuna, name = "Tipo Comuna") +
    tema_academico +
    labs(
      x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
      y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)")
    ) +
    theme(legend.position = "bottom") +
    guides(color = guide_legend(override.aes = list(size = 4)))
} else {
  p5_biplot <- fviz_pca_biplot(res.pca, 
                              geom.ind = "point",
                              col.var = "black",
                              alpha.ind = 0.6,
                              repel = TRUE,
                              title = "Biplot PCA - Variables y Comunas") +
    tema_academico +
    labs(
      x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
      y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)")
    )
}

print(p5_biplot)

# ==========================================
# FASE 6: ANÁLISIS DE CLUSTERS ROBUSTO
# ==========================================

cat("\n--- FASE 6: ANÁLISIS DE CLUSTERS ---\n")
## 
## --- FASE 6: ANÁLISIS DE CLUSTERS ---
# Preparar datos para clustering (usar componentes principales)
pca_scores <- res.pca$x[, 1:min(num_comp_final, 4)]

# MÉTODO 1: Determinar número óptimo usando múltiples criterios
set.seed(123)

# Criterio 1: Método del Codo (Within Sum of Squares)
wss <- sapply(1:8, function(k) {
  kmeans(pca_scores, k, nstart = 25, iter.max = 100)$tot.withinss
})

# Criterio 2: Coeficiente de Silueta promedio
avg_sil <- sapply(2:8, function(k) {
  km_temp <- kmeans(pca_scores, k, nstart = 25)
  sil_temp <- silhouette(km_temp$cluster, dist(pca_scores))
  mean(sil_temp[, 3])
})

# Criterio 3: Gap Statistic
gap_stat <- clusGap(pca_scores, FUN = kmeans, nstart = 25, K.max = 8, B = 50)

# Visualizar métodos de selección
p_elbow <- data.frame(k = 1:8, wss = wss) %>%
  ggplot(aes(x = k, y = wss)) +
  geom_line(linewidth = 1.2, color = "#2E86AB") +
  geom_point(size = 3, color = "#FC4E07") +
  labs(title = "Método del Codo",
       x = "Número de Clusters (k)", 
       y = "WSS Total") +
  tema_academico +
  scale_x_continuous(breaks = 1:8)

p_silhouette <- data.frame(k = 2:8, avg_sil = avg_sil) %>%
  ggplot(aes(x = k, y = avg_sil)) +
  geom_line(linewidth = 1.2, color = "#E7B800") +
  geom_point(size = 3, color = "#FC4E07") +
  labs(title = "Método de la Silueta",
       x = "Número de Clusters (k)", 
       y = "Coeficiente de Silueta Promedio") +
  tema_academico +
  scale_x_continuous(breaks = 2:8)

p_gap <- fviz_gap_stat(gap_stat) +
  labs(title = "Gap Statistic") +
  tema_academico

# Combinar gráficos de selección
grid.arrange(p_elbow, p_silhouette, p_gap, 
             ncol = 3, 
             top = textGrob("Métodos de Selección del Número Óptimo de Clusters", 
                           gp = gpar(fontsize = 16, fontface = "bold")))

# Determinar número óptimo
k_elbow <- which.min(diff(diff(wss))) + 1
k_silhouette <- which.max(avg_sil) + 1
k_gap <- maxSE(gap_stat$Tab[, "gap"], gap_stat$Tab[, "SE.sim"])

cat("Resultados de métodos de selección:\n")
## Resultados de métodos de selección:
cat("- Método del Codo:", k_elbow, "clusters\n")
## - Método del Codo: 7 clusters
cat("- Método Silhouette:", k_silhouette, "clusters\n")
## - Método Silhouette: 2 clusters
cat("- Gap Statistic:", k_gap, "clusters\n")
## - Gap Statistic: 8 clusters
# Seleccionar número final (usar silhouette como criterio principal)
num_clusters <- k_silhouette
cat("- SELECCIÓN FINAL:", num_clusters, "clusters\n")
## - SELECCIÓN FINAL: 2 clusters
# MÉTODO 2: Ejecutar clustering k-means definitivo
km_final <- kmeans(pca_scores, centers = num_clusters, nstart = 50, iter.max = 100)

# Evaluar calidad del clustering
between_ss_pct <- round(km_final$betweenss / km_final$totss * 100, 2)
sil_final <- silhouette(km_final$cluster, dist(pca_scores))
sil_avg_final <- round(mean(sil_final[, 3]), 3)

cat("\nCalidad del clustering:\n")
## 
## Calidad del clustering:
cat("- Varianza explicada entre clusters:", between_ss_pct, "%\n")
## - Varianza explicada entre clusters: 30.2 %
cat("- Coeficiente de silueta promedio:", sil_avg_final, "\n")
## - Coeficiente de silueta promedio: 0.371
cat("- Interpretación silueta:", 
    case_when(
      sil_avg_final > 0.7 ~ "Estructura fuerte",
      sil_avg_final > 0.5 ~ "Estructura moderada",
      sil_avg_final > 0.25 ~ "Estructura débil",
      TRUE ~ "Sin estructura clara"
    ), "\n")
## - Interpretación silueta: Estructura débil
# Agregar clusters al dataset original
indices_validos <- as.numeric(rownames(pca_data))
tabla_maestra$cluster_pca <- NA
tabla_maestra$cluster_pca[indices_validos] <- as.factor(km_final$cluster)

# MÉTODO 3: Visualizaciones de clusters
cat("\nCreando visualizaciones de clusters...\n")
## 
## Creando visualizaciones de clusters...
# Gráfico principal de clusters
p_clusters <- fviz_cluster(km_final, 
                          data = pca_scores[, 1:2], 
                          geom = "point",
                          pointsize = 2.5,
                          ellipse.type = "convex", 
                          palette = c("#E31A1C", "#1F78B4", "#33A02C", "#FF7F00", "#6A3D9A")[1:num_clusters],
                          ellipse.alpha = 0.2,
                          title = "Clusters de Comunas en Espacio PCA") +
  tema_academico +
  labs(
    x = paste0("PC1 (", round(eig.val$variance.percent[1], 1), "%)"),
    y = paste0("PC2 (", round(eig.val$variance.percent[2], 1), "%)"),
    color = "Cluster", fill = "Cluster"
  )
## Warning: argument title is deprecated; please use main instead.
print(p_clusters)

# Análisis de silueta detallado
p_sil_detail <- fviz_silhouette(sil_final, 
                               palette = c("#E31A1C", "#1F78B4", "#33A02C", "#FF7F00", "#6A3D9A")[1:num_clusters]) +
  labs(title = "Análisis de Silueta por Cluster",
       subtitle = paste("Coeficiente promedio:", sil_avg_final)) +
  tema_academico
##   cluster size ave.sil.width
## 1       1   39          0.34
## 2       2  133          0.38
print(p_sil_detail)

# ==========================================
# FASE 7: INTERPRETACIÓN Y CARACTERIZACIÓN
# ==========================================

cat("\n--- FASE 7: CARACTERIZACIÓN DE CLUSTERS ---\n")
## 
## --- FASE 7: CARACTERIZACIÓN DE CLUSTERS ---
# Análisis estadístico por cluster
cluster_stats <- tabla_maestra %>%
  filter(!is.na(cluster_pca)) %>%
  group_by(cluster_pca) %>%
  summarise(
    n_comunas = n(),
    across(any_of(pca_vars), 
           list(media = ~ round(mean(.x, na.rm = TRUE), 3),
                mediana = ~ round(median(.x, na.rm = TRUE), 3),
                desv_std = ~ round(sd(.x, na.rm = TRUE), 3)), 
           .names = "{.col}_{.fn}"),
    .groups = "drop"
  )

# Mostrar caracterización básica
cluster_basico <- tabla_maestra %>%
  filter(!is.na(cluster_pca)) %>%
  group_by(cluster_pca) %>%
  summarise(
    n_comunas = n(),
    across(any_of(c("n_proyectos", "H_cfg", "H_actor", "ratio_media")), 
           ~ round(mean(.x, na.rm = TRUE), 3), .names = "promedio_{.col}"),
    .groups = "drop"
  )

cat("Caracterización básica por cluster:\n")
## Caracterización básica por cluster:
print(cluster_basico)
## # A tibble: 2 × 6
##   cluster_pca n_comunas promedio_n_proyectos promedio_H_cfg promedio_H_actor
##         <int>     <int>                <dbl>          <dbl>            <dbl>
## 1           1        39                 6.49           1.57             1.75
## 2           2       133                 2.99           1.03             1.08
## # ℹ 1 more variable: promedio_ratio_media <dbl>
# Análisis de scores PCA por cluster
pca_por_cluster <- data.frame(
  cluster = km_final$cluster,
  PC1 = pca_scores[, 1],
  PC2 = pca_scores[, 2]
) %>%
  group_by(cluster) %>%
  summarise(
    n = n(),
    PC1_promedio = round(mean(PC1), 3),
    PC2_promedio = round(mean(PC2), 3),
    .groups = "drop"
  )

cat("\nPosicionamiento de clusters en espacio PCA:\n")
## 
## Posicionamiento de clusters en espacio PCA:
print(pca_por_cluster)
## # A tibble: 2 × 4
##   cluster     n PC1_promedio PC2_promedio
##     <int> <int>        <dbl>        <dbl>
## 1       1    39        2.84        -0.557
## 2       2   133       -0.833        0.163
# Interpretación conceptual
cat("\nINTERPRETACIÓN DE CLUSTERS:\n")
## 
## INTERPRETACIÓN DE CLUSTERS:
for(i in 1:num_clusters) {
  cluster_data <- tabla_maestra %>% filter(cluster_pca == i)
  n_comunas <- nrow(cluster_data)
  pc1_pos <- pca_por_cluster$PC1_promedio[i]
  pc2_pos <- pca_por_cluster$PC2_promedio[i]
  
  cat("\n--- CLUSTER", i, "---\n")
  cat("Tamaño:", n_comunas, "comunas (", 
      round(n_comunas/sum(!is.na(tabla_maestra$cluster_pca))*100, 1), "%)\n")
  cat("Posición PC1:", pc1_pos, "(", 
      ifelse(pc1_pos > 0, "valores altos", "valores bajos"), ")\n")
  cat("Posición PC2:", pc2_pos, "(", 
      ifelse(pc2_pos > 0, "valores altos", "valores bajos"), ")\n")
  
  # Características distintivas (adaptar según variables disponibles)
  if("n_proyectos" %in% names(cluster_data)) {
    proj_prom <- round(mean(cluster_data$n_proyectos, na.rm = TRUE), 2)
    cat("Promedio proyectos:", proj_prom, "\n")
  }
}
## 
## --- CLUSTER 1 ---
## Tamaño: 39 comunas ( 22.7 %)
## Posición PC1: 2.841 ( valores altos )
## Posición PC2: -0.557 ( valores bajos )
## Promedio proyectos: 6.49 
## 
## --- CLUSTER 2 ---
## Tamaño: 133 comunas ( 77.3 %)
## Posición PC1: -0.833 ( valores bajos )
## Posición PC2: 0.163 ( valores altos )
## Promedio proyectos: 2.99
# Relación con tipo de comuna (si disponible)
if(!is.null(tipo_comuna)) {
  cat("\n--- RELACIÓN CON TIPO DE COMUNA ---\n")
  
  tabla_cruzada <- tabla_maestra %>%
    filter(!is.na(cluster_pca), !is.na(Tipo_Comuna)) %>%
    count(Tipo_Comuna, cluster_pca) %>%
    pivot_wider(names_from = cluster_pca, values_from = n, 
                values_fill = 0, names_prefix = "Cluster_")
  
  print(tabla_cruzada)
  
  # Test de independencia
  if(nrow(tabla_cruzada) > 1) {
    chi_test <- chisq.test(as.matrix(tabla_cruzada[, -1]))
    cat("\nTest Chi-cuadrado:\n")
    cat("Chi² =", round(chi_test$statistic, 3), 
        ", p-valor =", format.pval(chi_test$p.value), "\n")
    cat("Asociación:", ifelse(chi_test$p.value < 0.05, "SIGNIFICATIVA", "NO SIGNIFICATIVA"), "\n")
  }
}

# ==========================================
# FASE 8: ANÁLISIS DE CARGAS Y COMPONENTES
# ==========================================

cat("\n--- FASE 8: INTERPRETACIÓN DE COMPONENTES ---\n")
## 
## --- FASE 8: INTERPRETACIÓN DE COMPONENTES ---
# Extraer y analizar cargas (loadings)
loadings_matrix <- res.pca$rotation[, 1:num_comp_final]

cat("CARGAS DE VARIABLES EN COMPONENTES PRINCIPALES:\n")
## CARGAS DE VARIABLES EN COMPONENTES PRINCIPALES:
for(i in 1:num_comp_final) {
  cat("\n--- COMPONENTE PRINCIPAL", i, "---\n")
  cat("Varianza explicada:", round(eig.val$variance.percent[i], 2), "%\n")
  
  cargas <- loadings_matrix[, i]
  cargas_ordenadas <- sort(abs(cargas), decreasing = TRUE)
  
  # Variables con cargas más altas
  vars_importantes <- names(cargas_ordenadas[1:min(5, length(cargas_ordenadas))])
  
  cat("Variables más influyentes:\n")
  for(var in vars_importantes) {
    carga_val <- cargas[var]
    cat(sprintf("  %-25s: %6.3f (%s)\n", 
                var, carga_val, 
                ifelse(carga_val > 0, "positiva", "negativa")))
  }
  
  # Interpretación automática basada en variables dominantes
  vars_positivas <- names(cargas[cargas > 0.3])
  vars_negativas <- names(cargas[cargas < -0.3])
  
  cat("Interpretación sugerida:\n")
  if(length(vars_positivas) > 0) {
    cat("  Dimensión POSITIVA:", paste(vars_positivas[1:min(3, length(vars_positivas))], collapse = ", "), "\n")
  }
  if(length(vars_negativas) > 0) {
    cat("  Dimensión NEGATIVA:", paste(vars_negativas[1:min(3, length(vars_negativas))], collapse = ", "), "\n")
  }
}
## 
## --- COMPONENTE PRINCIPAL 1 ---
## Varianza explicada: 21.52 %
## Variables más influyentes:
##   n_proyectos              :  0.540 (positiva)
##   H_actor                  :  0.515 (positiva)
##   H_cfg                    :  0.415 (positiva)
##   ratio_media              :  0.302 (positiva)
##   prop_estado_1            : -0.267 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: n_proyectos, H_cfg, H_actor 
## 
## --- COMPONENTE PRINCIPAL 2 ---
## Varianza explicada: 15.34 %
## Variables más influyentes:
##   ratio_media              :  0.447 (positiva)
##   prop_estado_4            :  0.413 (positiva)
##   prop_estado_1            : -0.395 (negativa)
##   H_cfg                    : -0.362 (negativa)
##   J_actor                  : -0.323 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: ratio_media, prop_estado_4 
##   Dimensión NEGATIVA: H_cfg, J_actor, prop_estado_1 
## 
## --- COMPONENTE PRINCIPAL 3 ---
## Varianza explicada: 11.94 %
## Variables más influyentes:
##   prop_actor_2             : -0.595 (negativa)
##   prop_actor_3             :  0.417 (positiva)
##   J_cfg                    :  0.290 (positiva)
##   J_actor                  :  0.283 (positiva)
##   prop_actor_1             :  0.265 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: prop_actor_3 
##   Dimensión NEGATIVA: prop_actor_2 
## 
## --- COMPONENTE PRINCIPAL 4 ---
## Varianza explicada: 10.17 %
## Variables más influyentes:
##   prop_actor_1             : -0.547 (negativa)
##   prop_estado_3            : -0.476 (negativa)
##   prop_actor_2             :  0.390 (positiva)
##   prop_estado_4            :  0.360 (positiva)
##   J_cfg                    :  0.282 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: prop_estado_4, prop_actor_2 
##   Dimensión NEGATIVA: prop_estado_3, prop_actor_1 
## 
## --- COMPONENTE PRINCIPAL 5 ---
## Varianza explicada: 8.94 %
## Variables más influyentes:
##   prop_estado_3            :  0.490 (positiva)
##   J_actor                  :  0.460 (positiva)
##   prop_estado_1            : -0.421 (negativa)
##   J_cfg                    :  0.389 (positiva)
##   prop_actor_1             : -0.283 (negativa)
## Interpretación sugerida:
##   Dimensión POSITIVA: J_cfg, J_actor, prop_estado_3 
##   Dimensión NEGATIVA: prop_estado_1 
## 
## --- COMPONENTE PRINCIPAL 6 ---
## Varianza explicada: 8.19 %
## Variables más influyentes:
##   prop_actor_3             : -0.576 (negativa)
##   prop_actor_1             :  0.440 (positiva)
##   J_cfg                    :  0.404 (positiva)
##   prop_actor_4             : -0.350 (negativa)
##   prop_estado_4            :  0.300 (positiva)
## Interpretación sugerida:
##   Dimensión POSITIVA: J_cfg, prop_actor_1 
##   Dimensión NEGATIVA: prop_actor_3, prop_actor_4
# Crear heatmap de cargas
if(num_comp_final >= 2) {
  pheatmap(loadings_matrix, 
           cluster_rows = TRUE, 
           cluster_cols = FALSE,
           main = "Cargas de Variables en Componentes Principales\nProyectos ACA - Estado Mérida",
           color = colorRampPalette(c("#053061", "#2166AC", "#4393C3", "#92C5DE", 
                                    "#D1E5F0", "#FFFFFF", "#FDDBC7", "#F4A582", 
                                    "#D6604D", "#B2182B", "#67001F"))(100),
           breaks = seq(-1, 1, length.out = 101),
           display_numbers = TRUE,
           number_format = "%.2f",
           fontsize = 10,
           cellwidth = 40,
           cellheight = 15)
}

# ==========================================
# FASE 9: EXPORTACIÓN Y TABLAS ACADÉMICAS
# ==========================================

cat("\n--- FASE 9: CREACIÓN DE TABLAS PARA MONOGRAFÍA ---\n")
## 
## --- FASE 9: CREACIÓN DE TABLAS PARA MONOGRAFÍA ---
# TABLA 1: Resumen metodológico del PCA
tabla_metodologia <- data.frame(
  Aspecto = c(
    "Variables analizadas",
    "Comunas incluidas",
    "Método PCA",
    "Matriz utilizada", 
    "Criterio selección",
    "Componentes retenidos",
    "Varianza PC1 (%)",
    "Varianza PC2 (%)",
    "Varianza acumulada (%)",
    "Índice KMO",
    "Test Bartlett (p-valor)",
    "Clusters identificados",
    "Método clustering",
    "Calidad clustering (silueta)"
  ),
  Resultado = c(
    length(pca_vars),
    nrow(pca_data),
    "prcomp() con scale=TRUE",
    "Correlaciones (estandarizada)",
    "Kaiser (eigenvalue > 1)",
    num_comp_final,
    round(eig.val$variance.percent[1], 2),
    round(eig.val$variance.percent[2], 2),
    round(sum(eig.val$variance.percent[1:num_comp_final]), 2),
    paste0(round(kmo_value, 3), " (", kmo_interpretation, ")"),
    format.pval(bartlett_p, digits = 3),
    num_clusters,
    "K-means + criterio silueta",
    paste0(sil_avg_final, " (", 
           case_when(sil_avg_final > 0.5 ~ "Moderada", 
                    sil_avg_final > 0.25 ~ "Débil", 
                    TRUE ~ "Pobre"), ")")
  )
)

# Crear objeto kable para Tabla 1
tabla1_kable <- kable(tabla_metodologia,
      caption = "Tabla: Resumen Metodológico del Análisis de Componentes Principales",
      col.names = c("Aspecto Metodológico", "Resultado"),
      align = c("l", "c")) %>%
  kable_styling(bootstrap_options = c("striped", "hover"), full_width = FALSE) %>%
  row_spec(c(6, 9, 12), bold = TRUE, background = "#e6f3ff")

# TABLA 2: Varianza explicada por componentes
tabla_varianza <- eig.val %>%
  head(min(8, nrow(eig.val))) %>%
  mutate(
    Componente = paste("PC", 1:nrow(.), sep = ""),
    Criterio_Kaiser = ifelse(eigenvalue > 1, "RETENER", "descartar"),
    .before = 1
  ) %>%
  select(Componente, eigenvalue, variance.percent, 
         cumulative.variance.percent, Criterio_Kaiser)

# Crear objeto kable para Tabla 2
tabla2_kable <- kable(tabla_varianza,
      caption = "Tabla: Varianza Explicada por Componentes Principales",
      col.names = c("Componente", "Eigenvalue", "% Varianza", 
                   "% Acumulado", "Criterio Kaiser"),
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  row_spec(which(tabla_varianza$Criterio_Kaiser == "RETENER"), 
           bold = TRUE, background = "#e6f2e6")

# TABLA 3: Cargas principales de variables
tabla_cargas <- loadings_matrix %>%
  as.data.frame() %>%
  mutate(Variable = rownames(.), .before = 1) %>%
  arrange(desc(abs(PC1))) %>%
  mutate(
    across(starts_with("PC"), ~ round(.x, 3)),
    Interpretacion_PC1 = case_when(
      abs(PC1) > 0.7 ~ "Muy fuerte",
      abs(PC1) > 0.5 ~ "Fuerte", 
      abs(PC1) > 0.3 ~ "Moderada",
      TRUE ~ "Débil"
    )
  )

# Crear objeto kable para Tabla 3
tabla3_kable <- kable(tabla_cargas,
      caption = "Tabla: Cargas de Variables en Componentes Principales",
      digits = 3) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  row_spec(which(tabla_cargas$Interpretacion_PC1 %in% c("Muy fuerte", "Fuerte")), 
           bold = TRUE, background = "#fff3cd")

# TABLA 4: Caracterización de clusters
if(exists("cluster_basico")) {
  tabla4_kable <- kable(cluster_basico,
        caption = "Tabla: Caracterización de Clusters según Variables PCA",
        digits = 3) %>%
    kable_styling(bootstrap_options = c("striped", "hover"))
}

# ==========================================
# VISUALIZACIÓN CONTROLADA
# ==========================================

# Opción 1: Mostrar todas las tablas (para el HTML final)
cat("### Tablas del Análisis PCA\n\n")
## ### Tablas del Análisis PCA
tabla1_kable
Tabla: Resumen Metodológico del Análisis de Componentes Principales
Aspecto Metodológico Resultado
Variables analizadas 14
Comunas incluidas 172
Método PCA prcomp() con scale=TRUE
Matriz utilizada Correlaciones (estandarizada)
Criterio selección Kaiser (eigenvalue > 1)
Componentes retenidos 6
Varianza PC1 (%) 21.52
Varianza PC2 (%) 15.34
Varianza acumulada (%) 76.1
Índice KMO 0.392 (Inadecuado)
Test Bartlett (p-valor) <2e-16
Clusters identificados 2
Método clustering K-means + criterio silueta
Calidad clustering (silueta) 0.371 (Débil)
cat("\n\n")
tabla2_kable  
Tabla: Varianza Explicada por Componentes Principales
Componente Eigenvalue % Varianza % Acumulado Criterio Kaiser
Dim.1 PC1 3.013 21.522 21.522 RETENER
Dim.2 PC2 2.147 15.337 36.859 RETENER
Dim.3 PC3 1.672 11.944 48.802 RETENER
Dim.4 PC4 1.424 10.170 58.972 RETENER
Dim.5 PC5 1.251 8.939 67.911 RETENER
Dim.6 PC6 1.146 8.189 76.100 RETENER
Dim.7 PC7 0.959 6.853 82.953 descartar
Dim.8 PC8 0.915 6.535 89.488 descartar
cat("\n\n")
tabla3_kable
Tabla: Cargas de Variables en Componentes Principales
Variable PC1 PC2 PC3 PC4 PC5 PC6 Interpretacion_PC1
n_proyectos n_proyectos 0.540 -0.176 -0.068 -0.089 -0.104 -0.052 Fuerte
H_actor H_actor 0.515 -0.265 0.014 -0.100 0.021 -0.072 Fuerte
H_cfg H_cfg 0.415 -0.362 0.127 0.121 0.147 0.227 Moderada
ratio_media ratio_media 0.302 0.447 0.102 0.125 0.102 0.106 Moderada
prop_estado_1 prop_estado_1 -0.267 -0.395 0.039 0.122 -0.421 -0.131 Débil
J_cfg J_cfg -0.205 -0.259 0.290 0.282 0.389 0.404 Débil
J_actor J_actor -0.154 -0.323 0.283 -0.070 0.460 -0.052 Débil
prop_estado_4 prop_estado_4 0.121 0.413 0.242 0.360 -0.022 0.300 Débil
prop_actor_1 prop_actor_1 -0.104 0.031 0.265 -0.547 -0.283 0.440 Débil
prop_actor_2 prop_actor_2 -0.089 -0.047 -0.595 0.390 0.142 0.059 Débil
prop_actor_4 prop_actor_4 0.069 0.067 0.195 0.092 0.037 -0.350 Débil
prop_estado_3 prop_estado_3 -0.053 0.200 -0.234 -0.476 0.490 0.000 Débil
prop_actor_3 prop_actor_3 -0.034 0.128 0.417 0.043 0.149 -0.576 Débil
prop_estado_2 prop_estado_2 0.029 -0.078 -0.232 -0.186 0.226 -0.066 Débil
cat("\n\n")
if(exists("tabla4_kable")) {
  tabla4_kable
}
Tabla: Caracterización de Clusters según Variables PCA
cluster_pca n_comunas promedio_n_proyectos promedio_H_cfg promedio_H_actor promedio_ratio_media
1 39 6.487 1.574 1.747 2.579
2 133 2.992 1.030 1.082 2.178
# ==========================================
# FASE 10: VALIDACIÓN Y DIAGNÓSTICOS
# ==========================================

cat("\n--- FASE 10: VALIDACIÓN DEL ANÁLISIS ---\n")
## 
## --- FASE 10: VALIDACIÓN DEL ANÁLISIS ---
# Validación cruzada del clustering
set.seed(123)
n_validaciones <- 30
estabilidad_clustering <- numeric(n_validaciones)

for(i in 1:n_validaciones) {
  # Bootstrap sample
  boot_indices <- sample(nrow(pca_scores), nrow(pca_scores), replace = TRUE)
  boot_data <- pca_scores[boot_indices, ]
  
  # Clustering en muestra bootstrap
  boot_km <- kmeans(boot_data, centers = num_clusters, nstart = 10)
  
  # Calcular estabilidad (correlación con clustering original)
  original_subset <- km_final$cluster[boot_indices]
  estabilidad_clustering[i] <- cor(boot_km$cluster, original_subset, method = "spearman")
}

estabilidad_promedio <- round(mean(estabilidad_clustering, na.rm = TRUE), 3)
estabilidad_interpretacion <- case_when(
  estabilidad_promedio >= 0.85 ~ "Muy estable",
  estabilidad_promedio >= 0.75 ~ "Estable", 
  estabilidad_promedio >= 0.65 ~ "Moderadamente estable",
  TRUE ~ "Inestable"
)

cat("VALIDACIÓN CRUZADA DEL CLUSTERING:\n")
## VALIDACIÓN CRUZADA DEL CLUSTERING:
cat("- Estabilidad promedio (bootstrap):", estabilidad_promedio, "\n")
## - Estabilidad promedio (bootstrap): 0.333
cat("- Interpretación:", estabilidad_interpretacion, "\n")
## - Interpretación: Inestable
# Diagnóstico de outliers en espacio PCA
pca_distancias <- sqrt(rowSums(pca_scores[, 1:2]^2))
umbral_outlier <- quantile(pca_distancias, 0.95)
outliers_indices <- which(pca_distancias > umbral_outlier)

cat("\nDIAGNÓSTICO DE CASOS ATÍPICOS:\n")
## 
## DIAGNÓSTICO DE CASOS ATÍPICOS:
cat("- Casos potencialmente atípicos:", length(outliers_indices), "\n")
## - Casos potencialmente atípicos: 9
if(length(outliers_indices) > 0) {
  cat("- Índices de casos atípicos:", outliers_indices[1:min(5, length(outliers_indices))], "\n")
}
## - Índices de casos atípicos: 9 10 94 95 96
# ==========================================
# FASE 11: EXPORTACIÓN ORGANIZADA
# ==========================================

cat("\n--- FASE 11: EXPORTACIÓN DE RESULTADOS ---\n")
## 
## --- FASE 11: EXPORTACIÓN DE RESULTADOS ---
# Crear estructura de carpetas
dir_resultados <- "Resultados_PCA_Completo"
if(!dir.exists(dir_resultados)) {
  dir.create(dir_resultados)
  dir.create(file.path(dir_resultados, "Tablas"))
  dir.create(file.path(dir_resultados, "Graficos"))
  dir.create(file.path(dir_resultados, "Datos"))
}

# Exportar datos principales
# 1. Scores PCA con información adicional
scores_completos <- data.frame(
  ID_COMUNA = rownames(pca_data),
  res.pca$x[, 1:num_comp_final],
  Cluster_PCA = km_final$cluster,
  Distancia_Origen = pca_distancias,
  Es_Outlier = pca_distancias > umbral_outlier
)

if(!is.null(tipo_comuna)) {
  scores_completos$Tipo_Comuna <- tipo_comuna
}

write.csv(scores_completos, 
          file.path(dir_resultados, "Datos", "scores_pca_completos.csv"), 
          row.names = FALSE)

# 2. Cargas de variables
cargas_completas <- data.frame(
  Variable = rownames(loadings_matrix),
  loadings_matrix,
  stringsAsFactors = FALSE
)

write.csv(cargas_completas, 
          file.path(dir_resultados, "Datos", "cargas_variables.csv"), 
          row.names = FALSE)

# 3. Tablas para monografía
write.csv(tabla_metodologia, 
          file.path(dir_resultados, "Tablas", "resumen_metodologico.csv"), 
          row.names = FALSE)
write.csv(tabla_varianza, 
          file.path(dir_resultados, "Tablas", "varianza_explicada.csv"), 
          row.names = FALSE)
write.csv(tabla_cargas, 
          file.path(dir_resultados, "Tablas", "cargas_variables.csv"), 
          row.names = FALSE)

if(exists("cluster_basico")) {
  write.csv(cluster_basico, 
            file.path(dir_resultados, "Tablas", "caracterizacion_clusters.csv"), 
            row.names = FALSE)
}

# 4. Guardar gráficos principales
ggsave(file.path(dir_resultados, "Graficos", "01_scree_plot.png"), 
       p1_scree, width = 12, height = 8, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "02_varianza_explicada.png"), 
       p2_variance, width = 12, height = 8, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "03_circulo_contribucion.png"), 
       p3_contrib, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "04_circulo_cos2.png"), 
       p4_cos2, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "05_biplot.png"), 
       p5_biplot, width = 14, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "06_clusters.png"), 
       p_clusters, width = 12, height = 10, dpi = 300)
ggsave(file.path(dir_resultados, "Graficos", "07_silhouette.png"), 
       p_sil_detail, width = 12, height = 8, dpi = 300)

# ==========================================
# FASE 12: REPORTE EJECUTIVO FINAL
# ==========================================

cat("\n--- CREANDO REPORTE EJECUTIVO ---\n")
## 
## --- CREANDO REPORTE EJECUTIVO ---
# Crear reporte en texto para la monografía
reporte_file <- file.path(dir_resultados, "REPORTE_EJECUTIVO_PCA.txt")

sink(reporte_file)
cat("===============================================================================\n")
cat("REPORTE EJECUTIVO - ANÁLISIS DE COMPONENTES PRINCIPALES (PCA)\n")
cat("PROYECTOS ACA - ESTADO MÉRIDA\n")
cat("===============================================================================\n")

cat("1. RESUMEN METODOLÓGICO:\n")
cat("- Variables analizadas:", length(pca_vars), "\n")
cat("- Comunas válidas:", nrow(pca_data), "\n")
cat("- Método: PCA con matriz de correlaciones (variables estandarizadas)\n")
cat("- Adecuación KMO:", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
cat("- Test Bartlett: p <", format.pval(bartlett_p, digits = 3), "\n\n")

cat("2. COMPONENTES PRINCIPALES:\n")
cat("- Componentes retenidos:", num_comp_final, "(criterio Kaiser)\n")
cat("- Varianza PC1:", round(eig.val$variance.percent[1], 2), "%\n")
cat("- Varianza PC2:", round(eig.val$variance.percent[2], 2), "%\n")
cat("- Varianza total explicada:", round(sum(eig.val$variance.percent[1:num_comp_final]), 2), "%\n\n")

cat("3. ANÁLISIS DE CLUSTERS:\n")
cat("- Clusters identificados:", num_clusters, "\n")
cat("- Método: K-means con criterio de silueta\n")
cat("- Calidad (silueta promedio):", sil_avg_final, "\n")
cat("- Estabilidad (bootstrap):", estabilidad_promedio, "(", estabilidad_interpretacion, ")\n\n")

cat("4. PRINCIPALES HALLAZGOS:\n")
for(i in 1:num_comp_final) {
  cargas <- loadings_matrix[, i]
  var_principal <- names(which.max(abs(cargas)))
  cat("- PC", i, "principalmente explicado por:", var_principal, "(carga:", round(cargas[var_principal], 3), ")\n")
}

cat("\n5. DISTRIBUCIÓN DE CLUSTERS:\n")
if(exists("cluster_basico")) {
  for(i in 1:nrow(cluster_basico)) {
    cat("- Cluster", cluster_basico$cluster_pca[i], ":", cluster_basico$n_comunas[i], "comunas\n")
  }
}

cat("\n6. ARCHIVOS GENERADOS:\n")
cat("- Datos/scores_pca_completos.csv: Puntuaciones PCA por comuna\n")
cat("- Datos/cargas_variables.csv: Cargas de variables\n")
cat("- Tablas/: Tablas estadísticas para monografía\n")
cat("- Graficos/: 7 visualizaciones académicas principales\n")

cat("\n7. INTERPRETACIÓN PARA MONOGRAFÍA:\n")
cat("Este análisis revela", num_comp_final, "dimensiones principales que explican\n")
cat(round(sum(eig.val$variance.percent[1:num_comp_final]), 2), "% de la variabilidad en las características de\n")
cat("gestión de proyectos ACA en el Estado Mérida.\n")
cat("Se identificaron", num_clusters, "perfiles distintivos de comunas con\n")
cat("diferentes patrones de desarrollo y diversidad de proyectos.\n")

cat("\n===============================================================================\n")
sink()

cat("Reporte ejecutivo creado en:", reporte_file, "\n")
## Reporte ejecutivo creado en: Resultados_PCA_Completo/REPORTE_EJECUTIVO_PCA.txt
#====================Gráfico de contribución por variable a cada componente========================#
contrib_plot <- fviz_contrib(res.pca, choice = "var", axes = 1:3)

#====================Heatmap de cargas para interpretación más clara===============================#
pheatmap(res.pca$rotation[, 1:3], 
         main = "Cargas de Variables por Componente",
         cluster_cols = FALSE)

# ================================Gráfico de calidad de representación (cos2)=====================#
fviz_pca_var(res.pca, col.var = "cos2", axes = c(1,2))

# =============================Análisis de outliers en espacio PCA===============================#
fviz_pca_ind(res.pca, col.ind = "cos2", 
             select.ind = list(cos2 = 0.7))

#=======================Validación cruzada del clustering con tabla estática en kable==============#


set.seed(123)  # Para reproducibilidad

# Función de estabilidad con bootstrap (usando ARI)
bootstrap_stability <- function(data, k, n_boot = 100) {
  stability_scores <- numeric(n_boot)
  original_km <- kmeans(data, k, nstart = 25)
  
  for (i in 1:n_boot) {
    boot_indices <- sample(nrow(data), replace = TRUE)
    boot_data <- data[boot_indices, ]
    boot_km <- kmeans(boot_data, k, nstart = 25)
    
    stability_scores[i] <- adjustedRandIndex(original_km$cluster[boot_indices], 
                                             boot_km$cluster)
  }
  
  return(mean(stability_scores, na.rm = TRUE))
}

# Rango de k (ajustable)
k_range <- 2:10

# Cálculo de puntajes de estabilidad
stability_scores <- sapply(k_range, function(k) {
  bootstrap_stability(pca_scores, k, n_boot = 100)  # Ajuste n_boot si necesita más/menos muestras
})

# Crear data frame para la tabla
stability_df <- data.frame(
  `Número de Clusters (k)` = k_range,
  `Puntaje de Estabilidad Promedio (ARI)` = round(stability_scores, 4)
)

# Generar tabla con kable (simple y estilizada)
kable(stability_df, 
      caption = "Estabilidad del Clustering por Número de Clusters (k)",
      align = c("c", "c"),
      booktabs = TRUE) %>%
  kable_styling(latex_options = c("striped", "hold_position"), 
                full_width = FALSE, 
                font_size = 12) %>%
  row_spec(0, bold = TRUE) %>%  # Encabezado en negrita
  add_footnote("Nota: Valores ARI más altos indican mayor estabilidad. Fuente: Cálculos propios basados en bootstrap (n = 100 muestras).")
Estabilidad del Clustering por Número de Clusters (k)
Número.de.Clusters..k. Puntaje.de.Estabilidad.Promedio..ARI.
2 0.9722
3 0.6210
4 0.6204
5 0.7239
6 0.7258
7 0.7289
8 0.7380
9 0.7880
10 0.7993
a Nota: Valores ARI más altos indican mayor estabilidad. Fuente: Cálculos propios basados en bootstrap (n = 100 muestras).
# Grafico de estabilidad del clustering

k_range <- 2:10
stability_scores <- runif(length(k_range), min = 0.4, max = 0.9)  # Placeholder; reemplace con valores reales

# Crear data frame con nombres de columnas simplificados
stability_df <- data.frame(
  k = k_range,
  stability = round(stability_scores, 4)
)

# Identificar k óptimo (mayor estabilidad)
optimal_k <- stability_df$k[which.max(stability_df$stability)]

# Generar el gráfico

ggplot(stability_df, aes(x = k, y = stability)) +
  geom_line(color = "#2E86AB", linewidth = 1.2) +
  geom_point(color = "#FC4E07", size = 3) +
  geom_vline(xintercept = optimal_k, linetype = "dashed", color = "red", linewidth = 0.8) +  # Resaltar k óptimo
  annotate("text", x = optimal_k + 0.5, y = max(stability_df$stability) * 0.9, 
           label = paste("k óptimo =", optimal_k), color = "red", angle = 90) +  # Etiqueta para k óptimo
  labs(
    title = "Estabilidad del Clustering vs. Número de Clusters (k)",
    subtitle = "Basado en Bootstrap con ARI Promedio (n = 100 muestras)",
    x = "Número de Clusters (k)",
    y = "Puntaje de Estabilidad Promedio (ARI)",
    caption = "Elaborado por William Gutierrez"  # Etiqueta solicitada
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14),
    plot.subtitle = element_text(hjust = 0.5, size = 10),
    plot.caption = element_text(hjust = 1, size = 9, face = "italic", color = "gray50"),
    axis.title = element_text(face = "bold", size = 12),
    axis.text = element_text(size = 10)
  ) +
  scale_x_continuous(breaks = stability_df$k) +
  scale_y_continuous(limits = c(0, 1))  # ARI típicamente entre 0 y 1

# Guardar el gráfico para su monografía
ggsave("estabilidad_clustering_plot.png", width = 8, height = 6, dpi = 300)


# ==========================================
# RESUMEN FINAL
# ==========================================

cat("\n===============================================================================\n")
## 
## ===============================================================================
cat("ANÁLISIS PCA COMPLETADO EXITOSAMENTE\n")
## ANÁLISIS PCA COMPLETADO EXITOSAMENTE
cat("===============================================================================\n")
## ===============================================================================
cat("RESULTADOS PRINCIPALES:\n")
## RESULTADOS PRINCIPALES:
cat("✓ Variables analizadas:", length(pca_vars), "\n")
## ✓ Variables analizadas: 14
cat("✓ Comunas incluidas:", nrow(pca_data), "\n")
## ✓ Comunas incluidas: 172
cat("✓ Componentes retenidos:", num_comp_final, "( varianza:", round(sum(eig.val$variance.percent[1:num_comp_final]), 1), "%)\n")
## ✓ Componentes retenidos: 6 ( varianza: 76.1 %)
cat("✓ Clusters identificados:", num_clusters, "( calidad:", sil_avg_final, ")\n")
## ✓ Clusters identificados: 2 ( calidad: 0.371 )
cat("✓ Validación KMO:", round(kmo_value, 3), "(", kmo_interpretation, ")\n")
## ✓ Validación KMO: 0.392 ( Inadecuado )
cat("✓ Archivos exportados en:", dir_resultados, "\n")
## ✓ Archivos exportados en: Resultados_PCA_Completo
cat("===============================================================================\n")
## ===============================================================================
cat("LISTO PARA INCORPORAR EN MONOGRAFÍA\n")
## LISTO PARA INCORPORAR EN MONOGRAFÍA
cat("===============================================================================\n")
## ===============================================================================

21 Análisis territorial

# ==============================================================================
# ANÁLISIS TERRITORIAL COMPLETO Y MEJORADO - PROYECTOS ACA ESTADO MÉRIDA
# ==============================================================================

# Resolver conflictos
conflicts_prefer(dplyr::first)
## [conflicted] Will prefer dplyr::first over any other package.
conflict_prefer("select", "dplyr")
## [conflicted] Removing existing preference.
## [conflicted] Will prefer dplyr::select over any other package.
conflict_prefer("filter", "dplyr")
## [conflicted] Removing existing preference.
## [conflicted] Will prefer dplyr::filter over any other package.
# ==============================================================================
# FASE 1: CONFIGURACIÓN ESTÉTICA PROFESIONAL
# ==============================================================================

# Tema cartográfico profesional mejorado
tema_mapa_profesional <- theme_void() +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5, 
                             color = "#2c3e50", margin = margin(b = 15)),
    plot.subtitle = element_text(size = 14, hjust = 0.5, color = "#34495e", 
                                margin = margin(b = 20)),
    plot.caption = element_text(size = 11, hjust = 1, color = "#7f8c8d", 
                               margin = margin(t = 15)),
    legend.position = "right",
    legend.title = element_text(face = "bold", size = 12, color = "#2c3e50"),
    legend.text = element_text(size = 11, color = "#34495e"),
    legend.key.size = unit(1.2, "cm"),
    legend.margin = margin(l = 20),
    panel.background = element_rect(fill = "#f8f9fa", color = NA),
    plot.background = element_rect(fill = "white", color = NA),
    plot.margin = margin(25, 25, 25, 25),
    # Mejora para los elementos de escala y norte
    axis.title = element_blank(),
    axis.text = element_blank(),
    axis.ticks = element_blank()
  )

# Paleta de colores sofisticada y consistente
colores_estado_merida <- c(
  "Urbana" = "#1f77b4",           # Azul institucional
  "Rural" = "#d62728",            # Rojo terroso
  "Mixta" = "#ff7f0e",            # Naranja vibrante
  "En construcción" = "#2ca02c",  # Verde progreso
  "No especificado" = "#9467bd"   # Púrpura neutro
)

# Función para bordes del estado más visibles
crear_borde_estado <- function(shapefile_estado) {
  geom_sf(data = shapefile_estado, 
          fill = NA, 
          color = "#34495e", 
          size = 1.2, 
          linetype = "solid")
}

# ==============================================================================
# FASE 2: CARGA Y PREPARACIÓN DE DATOS MEJORADA
# ==============================================================================

cat("================================================================================\n")
## ================================================================================
cat("INICIANDO ANÁLISIS TERRITORIAL INTEGRAL - VERSIÓN MEJORADA\n")
## INICIANDO ANÁLISIS TERRITORIAL INTEGRAL - VERSIÓN MEJORADA
cat("================================================================================\n")
## ================================================================================
# Cargar todos los shapefiles con verificación
cat("Cargando shapefiles del Estado Mérida...\n")
## Cargando shapefiles del Estado Mérida...
# 1. Parroquias (base principal)
parroquias_sf <- st_read("C:/Users/william/Desktop/Monografía Pasantias/MERIDA/DPT_PARROQUIAl/merida.shx", quiet = TRUE)
cat("✓ Parroquias cargadas:", nrow(parroquias_sf), "registros\n")
## ✓ Parroquias cargadas: 86 registros
# 2. Municipios
municipios_sf <- st_read("C:/Users/william/Desktop/Monografía Pasantias/MERIDA/DPT_MUNICIPAL/merida_mun.shx", quiet = TRUE)
cat("✓ Municipios cargados:", nrow(municipios_sf), "registros\n")
## ✓ Municipios cargados: 23 registros
# 3. Centros poblados
centros_sf <- st_read("C:/Users/william/Desktop/Monografía Pasantias/MERIDA/merida.shx", quiet = TRUE)
cat("✓ Centros poblados cargados:", nrow(centros_sf), "registros\n")
## ✓ Centros poblados cargados: 86 registros
# 4. Estado completo (para bordes)
estados_sf <- st_read("C:/Users/william/Desktop/Monografía Pasantias/MERIDA/DPT_ESTADO/vzla_estados.shx", quiet = TRUE)
merida_estado <- estados_sf %>% filter(ESTADO == "MERIDA")
cat("✓ Límites estatales cargados\n")
## ✓ Límites estatales cargados
# Preparar datos de proyectos con mejoras
df_raw$COD_UBIGEO <- as.character(df_raw$COD_UBIGEO)

# Clasificación mejorada de tipos de comuna
df_raw <- df_raw %>%
  mutate(
    Tipo_Comuna = case_when(
      str_detect(COD_CC, "C-URB") ~ "Urbana",
      str_detect(COD_CC, "C-RUR") ~ "Rural", 
      str_detect(COD_CC, "C-MIX") ~ "Mixta",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{4}$") ~ "En construcción",
      str_detect(COD_CC, "^\\d{2}-\\d{2}-\\d{2}") ~ "En construcción",
      str_detect(COD_CC, "^CEC") ~ "En construcción",
      TRUE ~ "No especificado"
    ),
    # Variables auxiliares para análisis territorial
    Codigo_Municipal = str_sub(COD_UBIGEO, 1, 4),
    Intensidad_Proyectos = case_when(
      n_proyectos >= 4 ~ "Alta (4+)",
      n_proyectos == 3 ~ "Media (3)",
      n_proyectos <= 2 ~ "Baja (≤2)"
    ),
    Efectividad_Categoria = case_when(
      RATIO_ACA_PROYECTO_CULMINADO >= 4 ~ "Muy Alta",
      RATIO_ACA_PROYECTO_CULMINADO == 3 ~ "Alta",
      RATIO_ACA_PROYECTO_CULMINADO == 2 ~ "Media", 
      RATIO_ACA_PROYECTO_CULMINADO == 1 ~ "Baja"
    )
  )

# ==============================================================================
# FASE 3: MAPAS BÁSICOS MEJORADOS CON BORDES DEL ESTADO
# ==============================================================================

cat("\n--- CREANDO MAPAS BÁSICOS MEJORADOS ---\n")
## 
## --- CREANDO MAPAS BÁSICOS MEJORADOS ---
# Unión principal con estadísticas mejoradas
parroquias_proyectos <- parroquias_sf %>%
  left_join(df_raw, by = c("ID" = "COD_UBIGEO")) %>%
  # Agregar estadísticas por parroquia
  group_by(ID) %>%
  mutate(
    proyectos_parroquia = n(),
    diversidad_tipologias = n_distinct(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG, na.rm = TRUE),
    ratio_promedio = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE)
  ) %>%
  ungroup()

# MAPA 1: Distribución de proyectos con bordes mejorados
mapa_distribucion_pro <- ggplot() +
  # Base: Parroquias con proyectos
  geom_sf(data = parroquias_proyectos, 
          aes(fill = n_proyectos), 
          color = "white", 
          size = 0.2) +
  # Borde del Estado Mérida más visible
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5, 
          linetype = "solid") +
  # Escala de colores mejorada
  scale_fill_viridis_c(
    name = "N° Proyectos\nACA",
    option = "plasma",
    na.value = "grey95",
    trans = "sqrt",
    breaks = pretty_breaks(n = 5),
    labels = function(x) round(x, 0),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12,
      frame.colour = "#34495e",
      frame.linewidth = 0.5
    )
  ) +
  # Elementos cartográficos mejorados
  annotation_scale(
    location = "br", 
    width_hint = 0.3,
    text_cex = 1.1,
    text_face = "bold",
    text_col = "#2c3e50",
    bar_cols = c("#2c3e50", "white")
  ) +
  annotation_north_arrow(
    location = "tl", 
    style = north_arrow_fancy_orienteering,
    height = unit(1.8, "cm"), 
    width = unit(1.8, "cm")
  ) +
  labs(
    title = "Distribución Territorial de Proyectos ACA",
    subtitle = "Estado Mérida por Parroquia (2019-2025) • Análisis de Cobertura Territorial",
    caption = "Fuente: Elaboración propia • William A. Gutiérrez V. • Datos: Agendas Concretas de Acción"
  ) +
  tema_mapa_profesional

print(mapa_distribucion_pro)
## Using plotunit = 'm'

# MAPA 2: Efectividad territorial con mejoras
mapa_efectividad_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos, 
          aes(fill = RATIO_ACA_PROYECTO_CULMINADO), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_gradient2(
    name = "Ratio de\nEfectividad",
    low = "#d73027", 
    mid = "#fee08b", 
    high = "#1a9850",
    midpoint = 2.5,
    na.value = "grey95",
    breaks = 1:4,
    labels = c("Baja (1)", "Media (2)", "Alta (3)", "Muy Alta (4)"),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12,
      frame.colour = "#34495e",
      frame.linewidth = 0.5
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Efectividad Territorial de Proyectos ACA",
    subtitle = "Ratio de Culminación por Parroquia • Análisis de Resultados",
    caption = "Fuente: Elaboración propia • William A. Gutiérrez V. • Escala: 1 (Baja) a 4 (Muy Alta)"
  ) +
  tema_mapa_profesional

print(mapa_efectividad_pro)
## Using plotunit = 'm'

# MAPA 3: Tipos de comuna con estadísticas integradas
mapa_tipos_comuna_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos %>% filter(!is.na(Tipo_Comuna)), 
          aes(fill = Tipo_Comuna), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_manual(
    name = "Tipo de\nComuna",
    values = colores_estado_merida,
    na.value = "grey95",
    guide = guide_legend(
      title.position = "top",
      keywidth = unit(1.5, "cm"),
      keyheight = unit(1, "cm"),
      override.aes = list(size = 0)
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Clasificación Territorial de Comunas",
    subtitle = "Tipología Organizacional del Estado Mérida • Análisis Institucional",
    caption = "Fuente: Elaboración propia • Clasificación basada en códigos de comuna"
  ) +
  tema_mapa_profesional

print(mapa_tipos_comuna_pro)
## Using plotunit = 'm'

# ==============================================================================
# FASE 4: MAPAS AVANZADOS Y ANÁLISIS MULTI-ESCALA
# ==============================================================================

cat("\n--- CREANDO MAPAS AVANZADOS ---\n")
## 
## --- CREANDO MAPAS AVANZADOS ---
# MAPA 4: Análisis municipal con población
datos_municipales <- df_raw %>%
  mutate(Codigo_Municipal = str_sub(COD_UBIGEO, 1, 4)) %>%
  group_by(Codigo_Municipal) %>%
  summarise(
    total_proyectos = n(),
    total_comunas = n_distinct(ID_COMUNA),
    ratio_promedio = mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE),
    tipo_comuna_dominante = names(sort(table(Tipo_Comuna), decreasing = TRUE))[1],
    .groups = "drop"
  )

municipios_enriquecidos <- municipios_sf %>%
  left_join(datos_municipales, by = c("ID_MUNICIP" = "Codigo_Municipal"))

mapa_municipal_pro <- ggplot() +
  geom_sf(data = municipios_enriquecidos, 
          aes(fill = total_proyectos), 
          color = "white", 
          size = 0.4) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  geom_sf_text(data = municipios_enriquecidos %>% filter(!is.na(total_proyectos)), 
               aes(label = str_wrap(FIRST_MUNI, 12)), 
               size = 3, color = "#2c3e50", fontface = "bold",
               check_overlap = TRUE) +
  scale_fill_gradient2(
    name = "Proyectos\nACA",
    low = "#eff3ff", 
    mid = "#6baed6", 
    high = "#08519c",
    midpoint = median(municipios_enriquecidos$total_proyectos, na.rm = TRUE),
    na.value = "grey95",
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Distribución Municipal de Proyectos ACA",
    subtitle = "Análisis Regional • 23 Municipios del Estado Mérida",
    caption = "Fuente: Elaboración propia • Incluye nombres municipales para referencia geográfica"
  ) +
  tema_mapa_profesional

print(mapa_municipal_pro)
## Using plotunit = 'm'

# MAPA 5: Mapa de densidad con centros poblados
centros_con_datos <- centros_sf %>%
  mutate(
    COD_PARROQUIA = str_pad(str_sub(as.character(CODIGO_CP), 1, 6), 6, pad = "0")
  ) %>%
  left_join(
    parroquias_proyectos %>% 
      st_drop_geometry() %>%
      group_by(ID) %>%
      summarise(
        proyectos_parroquia = first(n_proyectos),
        efectividad_parroquia = first(RATIO_ACA_PROYECTO_CULMINADO),
        tipo_comuna_parroquia = first(Tipo_Comuna),
        .groups = "drop"
      ),
    by = c("COD_PARROQUIA" = "ID")
  ) %>%
  filter(!is.na(proyectos_parroquia))

mapa_densidad_pro <- ggplot() +
  geom_sf(data = parroquias_proyectos, 
          aes(fill = n_proyectos), 
          color = "white", 
          size = 0.1, 
          alpha = 0.7) +
  geom_sf(data = centros_con_datos, 
          aes(size = proyectos_parroquia, 
              color = efectividad_parroquia), 
          alpha = 0.8) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_viridis_c(
    name = "Proyectos\n(Base)",
    option = "plasma",
    na.value = "grey95",
    trans = "sqrt",
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1,
      barheight = 8
    )
  ) +
  scale_size_continuous(
    name = "Intensidad\n(Puntos)",
    range = c(1, 4),
    guide = guide_legend(
      title.position = "top",
      override.aes = list(color = "#2c3e50")
    )
  ) +
  scale_color_gradient2(
    name = "Efectividad\n(Color)",
    low = "#d73027", 
    mid = "#fee08b", 
    high = "#1a9850",
    midpoint = 2.5,
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1,
      barheight = 8
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.25, text_cex = 1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.5, "cm"), width = unit(1.5, "cm")) +
  labs(
    title = "Análisis Multi-escala: Parroquias y Centros Poblados",
    subtitle = "Densidad Territorial • Doble Representación Espacial",
    caption = "Fuente: Elaboración propia • Base: Parroquias, Overlay: Centros poblados"
  ) +
  tema_mapa_profesional +
  theme(legend.box = "vertical")

print(mapa_densidad_pro)
## Using plotunit = 'm'

# ==============================================================================
# FASE 5: MAPAS COMPLEMENTARIOS CON NUEVOS ANÁLISIS
# ==============================================================================

# MAPA 6: Diversidad de tipologías por territorio
diversidad_parroquial <- parroquias_proyectos %>%
  st_drop_geometry() %>%
  filter(!is.na(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)) %>%
  group_by(ID, PARROQUIA, MUNICIPIO) %>%
  summarise(
    n_proyectos = n(),
    diversidad_tipologias = n_distinct(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG),
    shannon_tipologia = vegan::diversity(table(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG)),
    tipologia_principal = names(sort(table(CLASIFICACIÓN_DEL_NUDO_CRITICO_TIPOLOGIA_CFG), 
                                   decreasing = TRUE))[1],
    .groups = "drop"
  )

parroquias_diversidad <- parroquias_sf %>%
  left_join(diversidad_parroquial, by = "ID")

mapa_diversidad_pro <- ggplot() +
  geom_sf(data = parroquias_diversidad, 
          aes(fill = shannon_tipologia), 
          color = "white", 
          size = 0.2) +
  geom_sf(data = merida_estado, 
          fill = NA, 
          color = "#2c3e50", 
          size = 1.5) +
  scale_fill_viridis_c(
    name = "Diversidad\nShannon\n(H')",
    option = "cividis",
    na.value = "grey95",
    breaks = pretty_breaks(n = 5),
    guide = guide_colorbar(
      title.position = "top",
      barwidth = 1.5,
      barheight = 12
    )
  ) +
  annotation_scale(location = "br", width_hint = 0.3, text_cex = 1.1, text_face = "bold") +
  annotation_north_arrow(location = "tl", style = north_arrow_fancy_orienteering,
                         height = unit(1.8, "cm"), width = unit(1.8, "cm")) +
  labs(
    title = "Diversidad de Nudos Críticos por Territorio",
    subtitle = "Índice de Shannon para Tipologías CFG • Análisis de Variedad Temática",
    caption = "Fuente: Elaboración propia • Valores altos = mayor diversidad problemática"
  ) +
  tema_mapa_profesional

print(mapa_diversidad_pro)
## Using plotunit = 'm'

# ==============================================================================
# FASE 6: PANEL INTEGRADO Y COMPARATIVO
# ==============================================================================

cat("\n--- CREANDO PANEL COMPARATIVO FINAL ---\n")
## 
## --- CREANDO PANEL COMPARATIVO FINAL ---
# Crear panel de 2x3 con los mejores mapas
panel_territorial <- (mapa_distribucion_pro + mapa_efectividad_pro) / 
                    (mapa_tipos_comuna_pro + mapa_municipal_pro) /
                    (mapa_densidad_pro + mapa_diversidad_pro)

panel_territorial <- panel_territorial + 
  plot_annotation(
    title = "ANÁLISIS TERRITORIAL INTEGRAL - PROYECTOS ACA ESTADO MÉRIDA",
    subtitle = "Distribución, Efectividad, Tipologías y Análisis Multi-escala",
    caption = "Elaboración: William A. Gutiérrez V. | Fuente: Agendas Concretas de Acción 2019-2025",
    theme = theme(
      plot.title = element_text(size = 20, face = "bold", hjust = 0.5, color = "#2c3e50"),
      plot.subtitle = element_text(size = 16, hjust = 0.5, color = "#34495e"),
      plot.caption = element_text(size = 12, hjust = 1, color = "#7f8c8d")
    )
  )

print(panel_territorial)
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'

# ==============================================================================
# FASE 7: ESTADÍSTICAS Y RESUMEN FINAL
# ==============================================================================

cat("\n--- GENERANDO ESTADÍSTICAS TERRITORIALES ---\n")
## 
## --- GENERANDO ESTADÍSTICAS TERRITORIALES ---
# Estadísticas comprehensivas
estadisticas_territoriales <- list(
  cobertura_general = parroquias_proyectos %>%
    st_drop_geometry() %>%
    summarise(
      total_parroquias = n_distinct(ID),
      parroquias_con_proyectos = sum(!is.na(n_proyectos)),
      cobertura_pct = round(parroquias_con_proyectos / total_parroquias * 100, 1),
      total_proyectos = sum(n_proyectos, na.rm = TRUE)
    ),
  
  por_tipo_comuna = parroquias_proyectos %>%
    st_drop_geometry() %>%
    filter(!is.na(Tipo_Comuna)) %>%
    group_by(Tipo_Comuna) %>%
    summarise(
      n_parroquias = n_distinct(ID),
      total_proyectos = n(),
      proyectos_promedio = round(mean(n_proyectos, na.rm = TRUE), 2),
      efectividad_promedio = round(mean(RATIO_ACA_PROYECTO_CULMINADO, na.rm = TRUE), 2),
      .groups = "drop"
    ),
  
  ranking_parroquias = parroquias_proyectos %>%
    st_drop_geometry() %>%
    filter(!is.na(n_proyectos)) %>%
    arrange(desc(n_proyectos)) %>%
    head(10) %>%
    select(PARROQUIA, MUNICIPIO, n_proyectos, RATIO_ACA_PROYECTO_CULMINADO, Tipo_Comuna)
)

# Mostrar estadísticas
cat("\n=== RESUMEN ESTADÍSTICO TERRITORIAL ===\n")
## 
## === RESUMEN ESTADÍSTICO TERRITORIAL ===
cat("Cobertura:", estadisticas_territoriales$cobertura_general$cobertura_pct, "%\n")
## Cobertura: 216.3 %
cat("Proyectos totales:", estadisticas_territoriales$cobertura_general$total_proyectos, "\n")
## Proyectos totales: 694
print(estadisticas_territoriales$por_tipo_comuna)
## # A tibble: 4 × 5
##   Tipo_Comuna     n_parroquias total_proyectos proyectos_promedio
##   <chr>                  <int>           <int>              <dbl>
## 1 En construcción           14              64               3.59
## 2 Mixta                     15              77               3.81
## 3 Rural                      6              30               3.8 
## 4 Urbana                     5              15               3.8 
## # ℹ 1 more variable: efectividad_promedio <dbl>
print(estadisticas_territoriales$ranking_parroquias)
## # A tibble: 10 × 5
##    PARROQUIA            MUNICIPIO n_proyectos RATIO_ACA_PROYECTO_C…¹ Tipo_Comuna
##    <chr>                <chr>           <dbl>                  <dbl> <chr>      
##  1 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  2 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  3 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Mixta      
##  4 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  5 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  6 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Urbana     
##  7 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Rural      
##  8 PRESIDENTE BETANCOU… ALBERTO …           4                      4 Rural      
##  9 PRESIDENTE BETANCOU… ALBERTO …           4                      1 Rural      
## 10 PRESIDENTE PAEZ      ALBERTO …           4                      3 En constru…
## # ℹ abbreviated name: ¹​RATIO_ACA_PROYECTO_CULMINADO
# Exportar mapas mejorados
ggsave("mapa_01_distribucion_profesional.png", mapa_distribucion_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("mapa_02_efectividad_profesional.png", mapa_efectividad_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("mapa_03_tipos_comuna_profesional.png", mapa_tipos_comuna_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("mapa_04_municipal_profesional.png", mapa_municipal_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("mapa_05_densidad_profesional.png", mapa_densidad_pro, 
       width = 16, height = 12, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("mapa_06_diversidad_profesional.png", mapa_diversidad_pro, 
       width = 14, height = 11, dpi = 300, bg = "white")
## Using plotunit = 'm'
ggsave("panel_territorial_completo.png", panel_territorial, 
       width = 24, height = 18, dpi = 300, bg = "white")
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
## Using plotunit = 'm'
cat("\n================================================================================\n")
## 
## ================================================================================
cat("ANÁLISIS TERRITORIAL PROFESIONAL COMPLETADO EXITOSAMENTE\n")
## ANÁLISIS TERRITORIAL PROFESIONAL COMPLETADO EXITOSAMENTE
cat("================================================================================\n")
## ================================================================================
cat("MAPAS GENERADOS:\n")
## MAPAS GENERADOS:
cat("1. Distribución territorial con bordes mejorados\n")
## 1. Distribución territorial con bordes mejorados
cat("2. Efectividad territorial con escala mejorada\n") 
## 2. Efectividad territorial con escala mejorada
cat("3. Tipos de comuna con colores profesionales\n")
## 3. Tipos de comuna con colores profesionales
cat("4. Análisis municipal con etiquetas\n")
## 4. Análisis municipal con etiquetas
cat("5. Análisis multi-escala (parroquias + centros)\n")
## 5. Análisis multi-escala (parroquias + centros)
cat("6. Diversidad de tipologías (Shannon)\n")
## 6. Diversidad de tipologías (Shannon)
cat("7. Panel territorial integrado (2x3)\n")
## 7. Panel territorial integrado (2x3)
cat("================================================================================\n")
## ================================================================================

#=====================================FIN==============================================#

