Trabajo elaborado para la asignatura “Programación y manejo de datos en la era del Big Data” de la Universitat de València durante el curso 2020-2021. El repo del trabajo está aquí. La página web de la asignatura y los trabajos de mis compañeros pueden verse aquí.
1. Introducción
Este trabajo se realiza con el fin de analizar las estadisticas de los equipos y jugadores de la primera division de la liga de Inglaterra. Considerada una de las 5 grandes ligas europeas que para muchos, sus 38 jornadas, la convierten en la mas competitiva y relevante del mundo, tambien gracias a su historia y a la participacion de tantos grandes clubes como Manchester United, Chelsea, Liverpool entre otros. Ilutraremos la tabla de clasificacion de cada equipo, el Campeon de la liga, los descensos a la segunda division y los equipos que alcanzaron las maximas competiciones europeas (Champions League y Europa League). Ademas estudiaremos los maximos goleadores de la temporada tanto por equipos como jugadores mediante la utilizacion de graficos ilustrativos. Por ultimo, conoceremos los estadios donde se juegan los partidos de esta maxima competicion, señalando varios aspectos interesantes que nos ayudaran a adentrarnos a un mas en esta grandiosa competicion inglesa.
Datos
Fuente de los Datos
Los datos fueron obtenidos de varias paginas como el diario Marca, Wikipedia y la pagina oficial de la Premier League y luego fueron modificados por mi en un excel incluido en la carpeta datos. La manipulacion de los datos se realizaron gracias a los slides y tutoriales suministrados por el profesor de la materia Pedro Perez.
Codigos
clasif <- read_excel("./datos/premier-league.xlsx", sheet = 1)
max_gol <- read_excel("./datos/premier-league.xlsx", sheet = 2 )
asistencia <- read_excel("./datos/premier-league.xlsx", sheet = 3 )
premio <- read_excel("./datos/premier-league.xlsx", sheet = 4 )
clasif_1 <- clasif %>% filter(!(is.na(Clasif2021))) %>% select(Pos, Equipo, Pts, Clasif2021)
str(clasif_1)
#> tibble [10 x 4] (S3: tbl_df/tbl/data.frame)
#> $ Pos : num [1:10] 1 2 3 4 5 6 8 18 19 20
#> $ Equipo : chr [1:10] "Liverpool (C)" "Manchester City" "Manchester United" "Chelsea" ...
#> $ Pts : num [1:10] 99 81 66 66 62 59 56 34 34 21
#> $ Clasif2021: chr [1:10] "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" ...
clasif_1 <- clasif_1 %>% mutate(Equipo = forcats::as_factor(Equipo))
str(clasif_1)
#> tibble [10 x 4] (S3: tbl_df/tbl/data.frame)
#> $ Pos : num [1:10] 1 2 3 4 5 6 8 18 19 20
#> $ Equipo : Factor w/ 10 levels "Liverpool (C)",..: 1 2 3 4 5 6 7 8 9 10
#> $ Pts : num [1:10] 99 81 66 66 62 59 56 34 34 21
#> $ Clasif2021: chr [1:10] "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" "Fase de grupos de la Liga de Campeones" ...
levels(clasif_1$Equipo)
#> [1] "Liverpool (C)" "Manchester City" "Manchester United"
#> [4] "Chelsea" "Leicester City" "Tottenham Hotspur"
#> [7] "Arsenal" "Bournemouth (R)" "Watford (R)"
#> [10] "Norwich City (R)"
clasif_1 <- clasif_1 %>% mutate(Equipo = forcats::fct_reorder(Equipo, Pts))
levels(clasif_1$Equipo)
#> [1] "Norwich City (R)" "Bournemouth (R)" "Watford (R)"
#> [4] "Arsenal" "Tottenham Hotspur" "Leicester City"
#> [7] "Manchester United" "Chelsea" "Manchester City"
#> [10] "Liverpool (C)"
top_gf <- clasif %>% select(Equipo, GF) %>% slice_max(GF, n = 5)
str(top_gf)
#> tibble [5 x 2] (S3: tbl_df/tbl/data.frame)
#> $ Equipo: chr [1:5] "Manchester City" "Liverpool (C)" "Chelsea" "Leicester City" ...
#> $ GF : num [1:5] 102 85 69 67 66
top_gf <- top_gf %>% mutate(Equipo = forcats::as_factor(Equipo))
str(top_gf)
#> tibble [5 x 2] (S3: tbl_df/tbl/data.frame)
#> $ Equipo: Factor w/ 5 levels "Manchester City",..: 1 2 3 4 5
#> $ GF : num [1:5] 102 85 69 67 66
levels(top_gf$Equipo)
#> [1] "Manchester City" "Liverpool (C)" "Chelsea"
#> [4] "Leicester City" "Manchester United"
top_gf <- top_gf %>% mutate(Equipo = forcats::fct_reorder(Equipo, GF))
levels(top_gf$Equipo)
#> [1] "Manchester United" "Leicester City" "Chelsea"
#> [4] "Liverpool (C)" "Manchester City"
leaflet() %>% addTiles() %>% leafem::addMouseCoordinates()
2. Tabla de la English Premier League Temporada 2019/2020
La temporada 2019/2020 fue un año muy singular y esto debido a la pandemia mundial que todos conocemos como lo fue el coronavirus. Esta situacion pandemica provoco la detencion de los partidos desde la jornada 28 del 1 de Marzo hasta el 17 de junio que se pudo reanudar. Sin embargo y pese a estos 3 meses de la falta de este gran futbol, dejo varios aspectos relevantes: lograr el Liverpool conseguir el titulo de campeon después de 30 años tras su última victoria y primero con la denominacion Premier League. Ademas haberlo conseguido rompiendo varios records como ser el primer equipo de la competición y de Europa que clasificó más anticipadamente a la fase de grupos de la Liga de Campeones de la UEFA (12 fechas de anticipación). Tambien cabe a destacar que introdujo por primera vez la tecnologia VAR (Video Arbitraje).
“Es increíble ser campeón con este equipo. Ha sido muy fácil motivar a los jugadores por la gran historia que tiene el club. Es un logro increíble para mis jugadores, lo es todo lo que han hecho durante los últimos tres años”. Jürgen Klopp
Pos
|
Equipo
|
Pts
|
PJ
|
G
|
E
|
P
|
GF
|
GC
|
Dif
|
Clasif2021
|
1
|
Liverpool (C)
|
99
|
38
|
32
|
3
|
3
|
85
|
33
|
52
|
Fase de grupos de la Liga de Campeones
|
2
|
Manchester City
|
81
|
38
|
26
|
3
|
9
|
102
|
35
|
67
|
Fase de grupos de la Liga de Campeones
|
3
|
Manchester United
|
66
|
38
|
18
|
12
|
8
|
66
|
36
|
30
|
Fase de grupos de la Liga de Campeones
|
4
|
Chelsea
|
66
|
38
|
20
|
6
|
12
|
69
|
54
|
15
|
Fase de grupos de la Liga de Campeones
|
5
|
Leicester City
|
62
|
38
|
18
|
8
|
12
|
67
|
41
|
26
|
Fase de grupos de la Liga Europa
|
6
|
Tottenham Hotspur
|
59
|
38
|
16
|
11
|
11
|
61
|
47
|
14
|
Segunda ronda de la Liga Europa
|
7
|
Wolverhampton Wanderers
|
59
|
38
|
15
|
14
|
9
|
51
|
40
|
11
|
NA
|
8
|
Arsenal
|
56
|
38
|
14
|
14
|
10
|
56
|
48
|
8
|
Fase de grupos de la Liga Europa
|
9
|
Sheffield United
|
54
|
38
|
14
|
12
|
12
|
39
|
39
|
0
|
NA
|
10
|
Burnley
|
54
|
38
|
15
|
9
|
14
|
43
|
50
|
-7
|
NA
|
11
|
Southampton
|
52
|
38
|
15
|
7
|
16
|
51
|
60
|
-9
|
NA
|
12
|
Everton
|
49
|
38
|
13
|
10
|
15
|
44
|
56
|
-12
|
NA
|
13
|
Newcastle United
|
44
|
38
|
11
|
11
|
16
|
38
|
58
|
-20
|
NA
|
14
|
Crystal Palace
|
43
|
38
|
11
|
10
|
17
|
31
|
50
|
-19
|
NA
|
15
|
Brighton & Hove Albion
|
41
|
38
|
9
|
14
|
15
|
39
|
54
|
-15
|
NA
|
16
|
West Ham United
|
39
|
38
|
10
|
9
|
19
|
49
|
62
|
-13
|
NA
|
17
|
Aston Villa
|
35
|
38
|
9
|
8
|
21
|
41
|
67
|
-26
|
NA
|
18
|
Bournemouth (R)
|
34
|
38
|
9
|
7
|
22
|
40
|
65
|
-25
|
Descenso de Categoria
|
19
|
Watford (R)
|
34
|
38
|
8
|
10
|
20
|
36
|
64
|
-28
|
Descenso de Categoria
|
20
|
Norwich City (R)
|
21
|
38
|
5
|
6
|
27
|
26
|
75
|
-49
|
Descenso de Categoria
|
3. Analisis Clasificacion Siguiente Temporada
Competiciones Europeas y Descenso de Categoria
En esta grafica podemos observar la clasificacon a competiciones europeas de los primeros clasificados en la tabla y sus respectivos puntos onseguidos, los primeros 4 puestos clasifican a la Champions League y los 5 y 6 lugar a la Europa Legue. Podemos destacar la actuacion del Arsenal que al haber ganado la FA Cup tuvo como premio formar parte de la Europa League. Por ultimo, observamos los 3 equipos con menos puntos (Watford, Bournemouth y Norwich City) que jugaran la proxima temporada 20/21 en la segunda division de inglaterra (EFL Championship).
Grafico 1
Grafico 2
4. Analisis Goles Anotados
Equipos con mas Goles Anotados
En este grafico 3 estudiamos a los 5 grandes clubes que anotaron mayores goles esta temporada. Destacamos al Manchester City que logro sobrepasar la brecha de los 100 goles anotando 102 goles esta temporada. Tambien podemos concluir que estos equipos son igualmente los 5 primeros en la tabla de clasificacion por lo que mientras mas goles anotados mas posibilidades tienes de sumar mayor cantidad de puntos y colocarse en lo mas alto de la tabla. En el grafico 4 encontramos a todos los equipos de la temporada, con 1034 goles y una media de 51,4 goles por equipo y de 27,21 goles por partido termina la tempoara atipica en Inglaterra.
Grafico 3
Grafico 4
Los Pichichis (Jugadores con mas goles en la temporada)
En esta tabla podemos observar a los maximos anotadores y las estadisticas de cada jugador respecto a los partidos y minutos jugados en todos los partidos de la temporada. En el como maximo goleador aparece el jugador ingles Jamie Vardy (Leicester City) con 23 dianas, seguido de un empate en goles y terminando el podio el jugador gabones Pierre-Emerick Aubameyang (Arsenal) y el jugador ingles Danny Ings (Southampton).
jugador
|
goles
|
partidosjugados
|
Promediogpp
|
minutosjugados
|
minutopgol
|
Club
|
Jamie Vardy
|
23
|
35
|
0.66
|
3034
|
132
|
Leicester City
|
Pierre-Emerick Aubameyang
|
22
|
36
|
0.61
|
3138
|
143
|
Arsenal
|
Danny Ings
|
22
|
38
|
0.58
|
2812
|
128
|
Southampton
|
Raheem Sterling
|
20
|
33
|
0.61
|
2660
|
133
|
Manchester City
|
Mohamed Salah
|
19
|
34
|
0.56
|
2884
|
152
|
Liverpool
|
Harry Kane
|
18
|
29
|
0.62
|
2589
|
144
|
Tottenham
|
Sadio Mané
|
18
|
35
|
0.51
|
2753
|
153
|
Liverpool
|
Marcus Rashford
|
17
|
31
|
0.55
|
2653
|
156
|
Manchester United
|
Anthony Martial
|
17
|
32
|
0.53
|
2638
|
155
|
Manchester United
|
Raúl Jiménez
|
17
|
38
|
0.45
|
3244
|
191
|
Wolverhampton
|
6. Premios en la Temporada
Los mas galardonados de la temporada, ya mencionado anteriormente, sin duda alguna el mas destacado, el futbolista kevin De Bruyne fue el MVP mejor jugador de la temporada y recibio el premio playmaker al mejor armador de juego en la temporada. Tambien podemos destacar el gol de la temporada anotado por el coreano Heugh-Min Son que lo podemos ver luego de la tabla. La bota de Oro para el mayor anotador mencionado antes Jamie Vardy. mejor jugador mas joven o golden boy de la temporada se lo lleva el jugador del Liverpool Alexander-Arnold. Tambien vemos premios como al mejor manager Jurguen Klopp y el guante de oro para el portero del Manchester City Ederson.
7. Estadios de los Equipos de Primera Division Temporada 19/20
Para complementar este analisis conoceremos los estadios de los 20 equipos que se dejaron la piel este año combatiendo partido a partido en estos grandes campos de juego. Nos encontramos con la ubicacion de cada uno de los campos en las distintas ciudades de Inglaterra. Como dato interesante la distancia mas larga recorrida entre dos equipos es de 568 kilometros, que es la distancia que tienen que recorrer los equipos New Castle United y Bournemouth para sus respectivos enfrentamientos. Ademas podemos destacar la ciudad de Liverpool donde los estadios del Liverpool y el Everton los separa una distancia solo de 1,9 kilometros. Por ultimo podemos observar que en la ciudad de Londres se encuentran 5 equipos los cuales son: West Ham United, Chelsea, Tottenham, Arsenal y el Crystal Palace.
8. Conclusión
La atipica temporada 2019-2020 nos ha dejado unos recuerdos inolvidables que son para la historia de este gran campeonato. La pandemia del covid-19 no impidio que el Liverpool levantara su ansiada y esperada Premier League luego de 30 años de sequia domestica. Su futbol arrollador y dominante destaco rompiendo records y consiguiendo una unica derrota en toda la temporada. Ademas, La inclusion del VAR desde mi punto de vista ha sido favorable para esta competicion ya que ha dotado al conjunto arbitral con una ayuda extra en el estudio de jugadas decisivas. Tambien podemos acotar que no hubo una gran competencia o disputa para la consecucion de los puestos para la Champions League ya que tanto el Liverpool (campeon) y el Manchester City presentaban una amplia ventaja en puntos con el resto de sus competidores. Sin embargo, la fuerte pelea por estos ultimos puestos europeos (tercero y cuarto clasificado) fue la frenetica disputa de varios equipos (Leicester, Tottenham, Wolves) que al final terminaron como vencedores el Chelsea y el Manchester United.
Referencias
Para la realización del trabajo he utilizado:
Para acabar este chunk para incluir tu session info
:
sessioninfo::session_info() %>% details::details(summary = 'current session info')
current session info
- Session info ---------------------------------------------------------------
setting value
version R version 4.0.2 (2020-06-22)
os Windows 10 x64
system x86_64, mingw32
ui RTerm
language (EN)
collate Spanish_Spain.1252
ctype Spanish_Spain.1252
tz Europe/Paris
date 2021-01-16
- Packages -------------------------------------------------------------------
package * version date lib source
assertthat 0.2.1 2019-03-21 [1] CRAN (R 4.0.2)
backports 1.1.10 2020-09-15 [1] CRAN (R 4.0.2)
base64enc 0.1-3 2015-07-28 [1] CRAN (R 4.0.0)
blob 1.2.1 2020-01-20 [1] CRAN (R 4.0.2)
broom 0.7.0 2020-07-09 [1] CRAN (R 4.0.2)
cellranger 1.1.0 2016-07-27 [1] CRAN (R 4.0.2)
checkmate 2.0.0 2020-02-06 [1] CRAN (R 4.0.2)
class 7.3-17 2020-04-26 [2] CRAN (R 4.0.2)
classInt 0.4-3 2020-04-07 [1] CRAN (R 4.0.2)
cli 2.0.2 2020-02-28 [1] CRAN (R 4.0.2)
codetools 0.2-16 2018-12-24 [2] CRAN (R 4.0.2)
colorspace 1.4-1 2019-03-18 [1] CRAN (R 4.0.2)
commonmark 1.7 2018-12-01 [1] CRAN (R 4.0.2)
cpp11 0.2.1 2020-08-11 [1] CRAN (R 4.0.2)
crayon 1.3.4 2017-09-16 [1] CRAN (R 4.0.2)
crosstalk 1.1.0.1 2020-03-13 [1] CRAN (R 4.0.2)
curl 4.3 2019-12-02 [1] CRAN (R 4.0.2)
data.table 1.13.0 2020-07-24 [1] CRAN (R 4.0.2)
DBI 1.1.0 2019-12-15 [1] CRAN (R 4.0.2)
dbplyr 1.4.4 2020-05-27 [1] CRAN (R 4.0.2)
digest 0.6.25 2020-02-23 [1] CRAN (R 4.0.2)
dplyr * 1.0.2 2020-08-18 [1] CRAN (R 4.0.2)
e1071 1.7-3 2019-11-26 [1] CRAN (R 4.0.2)
ellipsis 0.3.1 2020-05-15 [1] CRAN (R 4.0.2)
evaluate 0.14 2019-05-28 [1] CRAN (R 4.0.2)
extrafont 0.17 2014-12-08 [1] CRAN (R 4.0.3)
extrafontdb 1.0 2012-06-11 [1] CRAN (R 4.0.3)
fansi 0.4.1 2020-01-08 [1] CRAN (R 4.0.2)
farver 2.0.3 2020-01-16 [1] CRAN (R 4.0.2)
forcats * 0.5.0 2020-03-01 [1] CRAN (R 4.0.2)
fs 1.5.0 2020-07-31 [1] CRAN (R 4.0.2)
gdtools 0.2.2 2020-04-03 [1] CRAN (R 4.0.2)
generics 0.0.2 2018-11-29 [1] CRAN (R 4.0.2)
gganimate * 1.0.6 2020-07-08 [1] CRAN (R 4.0.2)
ggplot2 * 3.3.2 2020-06-19 [1] CRAN (R 4.0.2)
ggrepel 0.8.2 2020-03-08 [1] CRAN (R 4.0.2)
ggthemes * 4.2.0 2019-05-13 [1] CRAN (R 4.0.2)
gifski 0.8.6 2018-09-28 [1] CRAN (R 4.0.2)
glue 1.4.2 2020-08-27 [1] CRAN (R 4.0.2)
gridExtra 2.3 2017-09-09 [1] CRAN (R 4.0.2)
gt * 0.2.2 2020-08-05 [1] CRAN (R 4.0.3)
gtable 0.3.0 2019-03-25 [1] CRAN (R 4.0.2)
haven 2.3.1 2020-06-01 [1] CRAN (R 4.0.2)
here 0.1 2017-05-28 [1] CRAN (R 4.0.2)
highr 0.8 2019-03-20 [1] CRAN (R 4.0.2)
hms 0.5.3 2020-01-08 [1] CRAN (R 4.0.2)
hrbrthemes * 0.8.0 2020-03-06 [1] CRAN (R 4.0.3)
htmltools 0.5.0 2020-06-16 [1] CRAN (R 4.0.2)
htmlwidgets 1.5.1 2019-10-08 [1] CRAN (R 4.0.2)
httr 1.4.2 2020-07-20 [1] CRAN (R 4.0.2)
jsonlite 1.7.1 2020-09-07 [1] CRAN (R 4.0.2)
kableExtra * 1.3.1 2020-10-22 [1] CRAN (R 4.0.3)
KernSmooth 2.23-17 2020-04-26 [2] CRAN (R 4.0.2)
klippy * 0.0.0.9500 2020-11-13 [1] Github (rlesur/klippy@378c247)
knitr * 1.29 2020-06-23 [1] CRAN (R 4.0.2)
labeling 0.3 2014-08-23 [1] CRAN (R 4.0.0)
lattice 0.20-41 2020-04-02 [2] CRAN (R 4.0.2)
lazyeval 0.2.2 2019-03-15 [1] CRAN (R 4.0.2)
leafem 0.1.3 2020-07-26 [1] CRAN (R 4.0.2)
leaflet * 2.0.3 2019-11-16 [1] CRAN (R 4.0.2)
lifecycle 0.2.0 2020-03-06 [1] CRAN (R 4.0.2)
lubridate 1.7.9 2020-06-08 [1] CRAN (R 4.0.2)
magrittr 1.5 2014-11-22 [1] CRAN (R 4.0.2)
modelr 0.1.8 2020-05-19 [1] CRAN (R 4.0.2)
munsell 0.5.0 2018-06-12 [1] CRAN (R 4.0.2)
pillar 1.4.6 2020-07-10 [1] CRAN (R 4.0.2)
pkgconfig 2.0.3 2019-09-22 [1] CRAN (R 4.0.2)
plotly * 4.9.2.1 2020-04-04 [1] CRAN (R 4.0.2)
png 0.1-7 2013-12-03 [1] CRAN (R 4.0.0)
prettyunits 1.1.1 2020-01-24 [1] CRAN (R 4.0.2)
progress 1.2.2 2019-05-16 [1] CRAN (R 4.0.2)
purrr * 0.3.4 2020-04-17 [1] CRAN (R 4.0.2)
R6 2.4.1 2019-11-12 [1] CRAN (R 4.0.2)
raster 3.3-13 2020-07-17 [1] CRAN (R 4.0.2)
Rcpp 1.0.5 2020-07-06 [1] CRAN (R 4.0.2)
reactable * 0.2.3 2020-10-04 [1] CRAN (R 4.0.3)
readr * 1.3.1 2018-12-21 [1] CRAN (R 4.0.2)
readxl * 1.3.1 2019-03-13 [1] CRAN (R 4.0.2)
reprex 0.3.0 2019-05-16 [1] CRAN (R 4.0.2)
rlang 0.4.7 2020-07-09 [1] CRAN (R 4.0.2)
rmarkdown 2.3 2020-06-18 [1] CRAN (R 4.0.2)
rprojroot 1.3-2 2018-01-03 [1] CRAN (R 4.0.2)
rstudioapi 0.11 2020-02-07 [1] CRAN (R 4.0.2)
Rttf2pt1 1.3.8 2020-01-10 [1] CRAN (R 4.0.3)
rvest 0.3.6 2020-07-25 [1] CRAN (R 4.0.2)
sass 0.2.0 2020-03-18 [1] CRAN (R 4.0.3)
scales 1.1.1 2020-05-11 [1] CRAN (R 4.0.2)
sessioninfo 1.1.1 2018-11-05 [1] CRAN (R 4.0.2)
sf 0.9-6 2020-09-13 [1] CRAN (R 4.0.2)
sp 1.4-2 2020-05-20 [1] CRAN (R 4.0.2)
stringi 1.5.3 2020-09-09 [1] CRAN (R 4.0.2)
stringr * 1.4.0 2019-02-10 [1] CRAN (R 4.0.2)
systemfonts 0.3.1 2020-09-08 [1] CRAN (R 4.0.2)
tibble * 3.0.3 2020-07-10 [1] CRAN (R 4.0.2)
tidyr * 1.1.2 2020-08-27 [1] CRAN (R 4.0.2)
tidyselect 1.1.0 2020-05-11 [1] CRAN (R 4.0.2)
tidyverse * 1.3.0 2019-11-21 [1] CRAN (R 4.0.2)
tweenr 1.0.1 2018-12-14 [1] CRAN (R 4.0.2)
units 0.6-7 2020-06-13 [1] CRAN (R 4.0.2)
vctrs 0.3.4 2020-08-29 [1] CRAN (R 4.0.2)
vembedr * 0.1.4 2020-10-10 [1] CRAN (R 4.0.3)
viridis * 0.5.1 2018-03-29 [1] CRAN (R 4.0.2)
viridisLite * 0.3.0 2018-02-01 [1] CRAN (R 4.0.2)
webshot 0.5.2 2019-11-22 [1] CRAN (R 4.0.2)
withr 2.2.0 2020-04-20 [1] CRAN (R 4.0.2)
wordcloud2 * 0.2.1 2018-01-03 [1] CRAN (R 4.0.3)
xfun 0.17 2020-09-09 [1] CRAN (R 4.0.2)
xml2 1.3.2 2020-04-23 [1] CRAN (R 4.0.2)
yaml 2.2.1 2020-02-01 [1] CRAN (R 4.0.2)
[1] C:/Users/Vicente Celis/Documents/R/win-library/4.0
[2] C:/Program Files/R/R-4.0.2/library
