datos[datos =="Computers Electronics and Technology > Search Engines"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Email"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Social Media Networks"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Telecommunications"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Programming and Developer Software"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Consumer Electronics"] <-"Computers Electronics and Technology"datos[datos =="Computers Electronics and Technology > Other Computers Electronics and Technology"] <-"Computers Electronics and Technology"datos[datos =="Arts & Entertainment > Streaming & Online TV"] <-"Arts & Entertainment"datos[datos =="Arts & Entertainment > Animation and Comics"] <-"Arts & Entertainment"datos[datos =="Arts & Entertainment > Other Arts and Entertainment"] <-"Arts & Entertainment"datos[datos =="Reference Materials > Dictionaries and Encyclopedias"] <-"Reference Materials"datos[datos =="eCommerce & Shopping > Marketplace"] <-"eCommerce & Shopping"datos[datos =="Science and Education > Weather"] <-"Science and Education"datos[datos =="Games > Video Games Consoles and Accessories"] <-"Games"datos[datos =="Travel and Tourism > Accommodation and Hotels"] <-"Travel and Tourism"datos_2 <- datos %>%mutate(Category = forcats::as_factor(Category)) #- convertimos la v. category a factor con la f. as_factor()datos_2 <- datos_2 %>%mutate(Category = forcats::fct_infreq(Category)) #- fct_infreq() los niveles del factor según su frecuencia de mayor a menorp1 <-ggplot(datos_2, aes(fct_rev(Category))) p1 <- p1 +geom_bar(fill ="DarkCyan") +xlab("Categoría de los sitios Web") +ylab("Cantidad") +coord_flip()plotly::ggplotly(p1)
Las categorías de páginas web más visitadas son “electrónica y tecnología informática”, “editores de noticias y medios de comunicación” y páginas para adultos.
La categoría más grande, “Electrónica y tecnología informática”, incluye las páginas web de telecomunicaciones, redes sociales, motores de búsqueda, software de programación y desarrollo, correo electrónico y electrónica de consumo. Así pues, las más básicas páginas web, las que utilizamos a diario. La mayoría de la páginas están en la subcategoría de redes sociales.
La categoría “Arte y Entretenimiento” incluye la televisión en streaming y en línea y las animaciones y cómics.
datos <- rio::import("./datos/df_1.csv") colnames(datos) <-as.character(datos[1,])datos <- datos[-1,]names(datos)[names(datos) =="NA"] <-"Position"names(datos)[names(datos) =="Principal country/territory"] <-"Country"datos$Position = datos$Position +1datos_3 <- datos %>%select(Country) %>%count(Country)datos_3[datos_3 =="Russia"] <-"Russian Federation"datos_3[datos_3 =="South Korea"] <-"Republic of Korea"dat <- iso3166dat <-rename(dat, "iso-a3"= a3)mapa <-full_join(dat, datos_3, by =c("ISOname"="Country"))mapa[is.na(mapa)] <-0mapa <- mapa[-82,]mapa <- mapa[-48,]hcmap(map ="custom/world-highres3", # high resolution world mapdata = mapa, # name of datasetjoinBy ="iso-a3",value ="n",showInLegend =FALSE, # hide legenddownload_map_data =TRUE) %>%hc_mapNavigation(enabled =FALSE) %>%hc_legend("none") %>%hc_title(text ="Cantidad de páginas web por país de origen") %>%hc_colorAxis(minColor ="#d1ebeb", maxColor ="#008b8b")
Código
datos_3 <- datos %>%select(Country) %>%count(Country)datos_3[datos_3 =="Czech Republic"] <-"Czech Rep."datos_3[datos_3 =="South Korea"] <-"Korea"data(World) world <- World ; rm(World)world <- world %>%filter(continent !="Antarctica") %>%filter(name !="Greenland")aa <-ggplot() +geom_sf(data = world) +theme_void()world <- world %>%select(name, geometry)map2 <-full_join(datos_3, world, by =c("Country"="name"))map3 <- map2 %>% ggplot +geom_sf (data = map2, aes(geometry = geometry , fill = n)) +scale_fill_viridis_c(option ="mako", trans ="sqrt") +labs(title ="Cantidad de páginas web por país de origen", subtitle ="(más claro mayor, más oscuro menor)") map3
Aquí vemos que los mapas están muy vacíos porque la mayoría de los sitios web más visitados del mundo proceden de EE.UU. (30), Rusia (5) y China (4). Podemos concluir que las potencias mundiales poseen casi todas las principales páginas web.