Optimización de la clasificación en el deporte: un estudio de replicación utilizando indicadores de rendimiento físico y técnico-táctico para clasificar los niveles competitivos en partidos de la liga de rugby

by | Nov 15, 2022 | 0 comments

Introducción

El análisis deportivo es un área de rápido crecimiento dentro del alcance más amplio de la ciencia de datos. Esto implica el uso de datos deportivos y la aplicación de diversas técnicas, métodos y algoritmos matemáticos y/o estadísticos (Morgulev et al. 2018). En el campo de las ciencias del deporte, los investigadores y los practicantes se enfrentan a varios problemas analíticos que incluyen la visualización, la regresión y la clasificación. Por ejemplo, los problemas de visualización incluyen mostrar los comportamientos técnicos de los jugadores de la liga de fútbol australiana a lo largo de varias temporadas mediante la aplicación de una técnica de escalado multidimensional no métrica (Woods et al. 2018). Los problemas de regresión incluyen la comprensión de las diferencias en los perfiles de rendimiento técnico y físico entre los equipos profesionales de la liga de rugby exitosos y menos exitosos a través de modelos mixtos lineales (Kempton et al. 2017). Los problemas de clasificación en las ciencias del deporte han incluido el desarrollo de modelos de predicción de lesiones basados ​​en datos de carga de entrenamiento mediante la aplicación de regresión logística (Carey et al. 2018) para clasificar la ocurrencia de lesiones.

Un área relevante para el análisis de clasificación es la clasificación de jugadores en niveles competitivos y la determinación de los indicadores clave de rendimiento físico y técnico-táctico (Burgess y Naughton 2010; Whitehead et al. 2021). Esto es importante ya que se requiere que los jugadores jóvenes progresen a la competencia senior como parte de su desarrollo o compitan a un nivel superior como reemplazo de los jugadores senior lesionados. Mediante el uso de dispositivos de microtecnología (Cummins et al. 2013; Whitehead et al. 2018) y análisis notacional (Woods et al. 2018), las características de los partidos a lo largo de diferentes vías de juego se pueden cuantificar por sus características físicas (p. ej., distancia total, velocidad máxima, velocidad promedio) (Whitehead et al. 2019) e indicadores de desempeño técnico-táctico (p. ej., roturas de línea, errores defensivos, intentos, tacleadas fallidas, jugadas ganadoras) (Kempton et al. 2017; Gabbett y Hulin 2018).

En las ciencias del deporte, es común que los diseños de investigación que apuntan a abordar un problema de clasificación incluyan múltiples variables predictoras. Por lo tanto, se vuelve importante evaluar la validez de constructo y la confiabilidad de cada variable predictora incluida antes del análisis. A menudo, los investigadores y los profesionales todavía se quedan con variables dimensionales y colineales altas después de este proceso. Para superar la multidimensionalidad y la multicolinealidad de las variables predictoras (es decir, identificar las variables predictoras clave), los estudios suelen realizar múltiples análisis univariados investigando cada predictor y los valores de las variables objetivo por separado (Gabbett 2013). Por ejemplo, Gabbet (2013) investigaron la diferencia en las cargas externas entre los jugadores de las ligas de rugby en dos niveles competitivos diferentes (es decir, la Competencia Nacional Juvenil y la Liga Nacional de Rugby) utilizando un análisis de varianza de medidas repetidas en los indicadores de rendimiento físico. Sin embargo, dicho enfoque es limitado ya que no considera la covarianza de los datos y los múltiples modelos producidos podrían aumentar las tasas de error de los modelos de clasificación.

Alternativamente, los métodos de importancia de variables de aprendizaje automático se pueden usar para identificar variables predictoras clave seleccionando solo las variables que son relativamente importantes para los valores de la variable objetivo (Thornton et al. 2017). Este enfoque se ha implementado al establecer los indicadores de carga de entrenamiento importantes para predecir el estado de las lesiones (Thornton et al. 2017) y al establecer la importancia de siete componentes del sueño en la puntuación del Índice de Calidad del Sueño de Pittsburgh (Halson et al. 2021). Sin embargo, se informa que el uso de métodos de importancia de variables de aprendizaje automático no es óptimo para identificar predictores clave para los valores de variables objetivo (Williamson et al. 2021) y afecta la precisión de la clasificación. Por ejemplo, Whitehead et al. (2021) identificaron variables predictoras clave mediante el uso de un modelo de bosque aleatorio único para establecer la importancia variable de los indicadores de rendimiento técnico-táctico y físico para clasificar a los jugadores de la liga de rugby en dos niveles competitivos (es decir, senior y academia) en función de sus posiciones de juego (es decir, backs y backs). adelante) utilizando otro modelo de clasificación Random Forest. Whitehead et al. (2021) informó un 83 % de precisión para los backs y un 68 % para los forwards. Estas precisiones se pueden mejorar utilizando otras técnicas de clasificación.

Un método más confiable y robusto para Whitehead et al. (2021) consiste en agregar resultados aleatorios repetidos de importancia de variables forestales que implican el uso de un número diferente de variables por intento (Calhoun et al. 2021). Sin embargo, este método es computacionalmente costoso y aún puede producir un modelo de clasificación subóptimo. Alternativamente, los indicadores clave de rendimiento físico y técnico-táctico se pueden identificar mediante la aplicación de un método de selección de características que no posee sesgo a un algoritmo de clasificación específico (Mabayoje et al. 2016). Todos los métodos de selección de características existen como clasificación de características de filtro, selección de subconjuntos de características de filtro, métodos integrados y basados ​​en contenedor (Balogun et al. 2020; Chih‐wen et al. 2020).

Los métodos de clasificación de características de filtro generan una puntuación clasificada para cada variable en función de las propiedades estadísticas encontradas en los datos calculados por el método. La selección de subconjuntos de características de filtro implementa métodos heurísticos y de búsqueda para evaluar múltiples subconjuntos de variables para producir el mejor subconjunto de variables predictoras clave en relación con los valores de las variables objetivo (Balogun et al. 2020; Chih‐wen et al. 2020). Es importante destacar que los conjuntos de variables producidos por los métodos de clasificación de características de filtro y selección de subconjuntos de características de filtro no tienen un sesgo hacia ningún método de clasificación. Por otro lado, el método basado en envoltorios se basa en un método de búsqueda voraz computacional del espacio variable para encontrar variables que mejoren el rendimiento predictivo de un algoritmo de clasificación particular. De manera similar, los métodos integrados son intrínsecos a los algoritmos de aprendizaje automático que encuentran las mejores características para decisiones divididas mientras ajustan un modelo predictivo (Balogun et al. 2020; Chih‐wen et al. 2020). Tanto los métodos de selección de características integrados como los basados ​​en envoltorios son para mejorar el rendimiento de un algoritmo de aprendizaje automático específico, como lo implementaron parcialmente Whitehead et al. (2021) para optimizar el modelo Random Forest para la predicción a nivel de jugador. En este estudio, se considera un método de selección de subconjunto de características de filtro porque genera el mejor subconjunto de variables predictoras clave y sin sesgo para ningún algoritmo de clasificación.

También se debe considerar el método dividido de prueba de entrenamiento para desarrollar modelos de clasificación, que se ha utilizado en ciencias del deporte para la predicción de las tablas de clasificación de fútbol y el rendimiento de los jugadores (Pantzalis y Tjortjis 2020). Whitehead et al. (2021) también utilizaron esta técnica, que es limitada ya que realiza el ajuste y la evaluación del modelo solo una vez en los datos proporcionados. A kEl método de validación cruzada -fold es una alternativa que permite realizar entrenamientos y pruebas k-cronometra y genera la puntuación media de cualquier métrica de evaluación seleccionada (p. ej., precisión). Además, existen muchos algoritmos de aprendizaje automático aplicables para resolver problemas de clasificación. Se clasifican ampliamente por sus esquemas de aprendizaje, como probabilidad condicional, funciones, árboles de decisión, redes neuronales y aprendizaje basado en instancias (Witten et al. 2011).

Por lo tanto, este estudio tiene como objetivo introducir métodos de selección de características para optimizar el rendimiento de los modelos de clasificación en el análisis deportivo y demostrarlo mejorando la precisión de la clasificación de los jugadores senior y de la academia de la liga de rugby mediante la aplicación del método de selección de subconjuntos de características de filtro (es decir, característica basada en la correlación). subconjunto utilizando el mejor método de búsqueda primero) en los mismos datos utilizados por Whitehead et al. (2021) y evaluando múltiples algoritmos de clasificación (es decir, regresión logística, perceptrón multicapa, Naïve Bayes, máquina de vectores de soporte, árbol aleatorio y k-vecino más cercano) para encontrar el mejor modelo de clasificación.

Métodos

Diseño

Whitehead et al. (2021) se utilizaron datos en este estudio. Esto incluyó 157 variables físicas y técnico-tácticas y dos valores de variables objetivo (es decir, Academy y Senior). Los indicadores físicos se derivaron de datos de microtecnología (Catapult S5, Catapult Innovations, Melbourne, Australia), mientras que los indicadores técnico-tácticos fueron codificados por expertos a partir de partidos filmados por analistas. Véase Whitehead et al. (2021) para obtener una descripción completa de los nombres de variables, descripciones y métodos de recopilación. Según Whitehead et al. (2021), el conjunto de datos se dividió en dos grupos posicionales (es decir, atrás y adelante) en dos niveles competitivos (es decir, Academy y Senior). El conjunto de datos de backs contenía 453 observaciones de partidos (Academy = 220; Senior = 233). El conjunto de datos de forwards contenía 527 observaciones de partidos (Academy = 251; Senior = 276). Se realizaron dos fases de análisis de datos utilizando los conjuntos de datos. El análisis de la Fase 1 involucró la identificación de variables clave de rendimiento, mientras que la Fase 2 involucró el desarrollo de modelos de clasificación mejorados.

Marco para el análisis de datos

El marco que se muestra en Figura 1 captura las dos fases del análisis de datos. Se aplicó a los grupos de posicionamiento de atrás y adelante respectivamente.

Figura 1. Marco experimental.

En la fase I, se aplicó el método de selección de características del ‘subconjunto de características basado en la correlación’ (Cfs) en los 157 indicadores de rendimiento físicos y técnico-tácticos para identificar los principales.

El subconjunto de características basado en la correlación es un ejemplo de un método de selección de subconjuntos de características de filtro que genera el subconjunto de variables con la puntuación más alta de acuerdo con la función de evaluación heurística (Hall 1999; Alí et al. 2020). La puntuación es…

Traducido automáticamente
Publicación Original

0 Comments

Submit a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

PROXIMAS CAPACITACIONES

Curso

Instructorado de Fútbol Base

Fútbol Formativo presenta una nueva edición de esta capacitación integral dedicada al fútbol infantil que será coordinada académicamente por el Prof. Juan Pablo Pochettino y tiene como objetivo colaborar en la difusión de los lineamientos y contenidos del Programa Grassroots de la FIFA y del Programa Evolución CONMEBOL.Pensar un fútbol en la infancia donde el protagonista del proceso formativo sea el jugador y no el entrenador, es tarea de todos. Para ello es clave entender este nuevo rol del docente-formador que guía al alumno a resolver los problemas que el juego le presenta y genera espacios formativos acordes a sus necesidades. A su vez, dentro del enfoque planteado se aborda la necesidad de repensar la iniciación a través de propuestas de fútbol mixto, que no diferencien a los varones y a las mujeres, y de adaptación del terreno de juego en base al desarrollo evolutivo del futbolista. Para llevar la teoría a la práctica es que se suman contenidos de la gestión deportiva y la evaluación final del Instructorado será mediante la elaboración de un proyecto que integre lo visto en la cursada y que sea útil para llevarlo a la realidad. Para jerarquizar la propuesta académica se suman como docente invitados el Prof. Luis Lescurieux, la Lic. Alejandra Zalazar, el Lic. Javier Mazzone, el Prof. David Jourdan Frohmann, el Prof. Rodrigo Méndez y el entrenador español Juan Antonio Gallardo Bueno, el Prof. Martín Pascual, el Prof. Fernando De Oliveira y el entrenador Dario Curti.
41 Revisiones
4,93
Curso

Curso de Preparación Física en Fútbol Infanto-Juvenil

El profesor Carlos Borzi, reconocido preparador físico argentino de amplia experiencia en el fútbol formativo y profesional de Argentina, México, Colombia y Japón desde 1982, presenta una nueva edición de esta capacitación dedicada a la Preparación Física para el Fútbol Infantil y Juvenil. Borzi trabajó desde 2005 hasta 2015 como Preparador Físico de la Reserva de Boca y Coordinador de los Preparadores Físicos del Fútbol Amateur del Club Atlético Boca Juniors (2004 y 2013-2016), sumado a su experiencia en la formación de Entrenador de Fútbol durante más de 20 años.Es autor de 2 de los libros de entrenamiento más vendidos en América Latina: "Fútbol Infantil. Entrenamiento programado" (Editorial Stadium, 1999) y "7 años de entrenamiento en fútbol juvenil" (Ediciones Continente, 2013)Este Curso reúne lo mejor de la teoría de cientos de libros y la experiencia de 35 años de práctica de una manera intensiva, presentados durante 2 meses en 8 clases en formato video con algunas clases en vivo para poder interactuar con el docente y evacuar dudas.Para jerarquizar la propuesta acompañan a Borzi en este Curso Luis Cairo, histórico preparador físico del Club Atlético All Boys que consiguió el ascenso a la B Nacional (2008) y luego a Primera División (2010) y con paso por Ferrocarril Oeste (2014), Independiente Rivadavia de Mendoza (2017-2018) y J. J. Urquiza (2022)Juan Pablo Pochettino, preparador físico del fútbol infantil de Atlanta (2011-2012) y Chacarita y del fútbol juvenil de Tigre (2015-2017) y San Lorenzo (2022-2023), con experiencia en fútbol profesional en Tigre (2018), Los Andes (2020), J. J. Urquiza (2021-2022) y San Miguel (2022)
12 Revisiones
4,92
Curso

Programa de Especialización en Preparación Física de Fútbol

El profesor Carlos Borzi, reconocido preparador físico argentino de amplia experiencia en el fútbol formativo y profesional de Argentina, México, Colombia y Japón desde 1982, presenta junto a G-SE y Fútbol Formativo una nueva edición de este Programa dedicado a la Preparación Física para el Fútbol Infantil, Juvenil y Profesional. Borzi trabajó, entre tantos clubes, desde 2004 hasta 2016 como Preparador Físico del Club Atlético Boca Juniors. Además se desempeñó como Docente en instituciones de formación de Entrenadores de Fútbol durante más de 20 años y es autor de 2 de los libros más vendidos en América Latina: "Fútbol Infantil. Entrenamiento programado" (Editorial Stadium, 1999) y "7 años de entrenamiento en fútbol juvenil" (Ediciones Continente, 2013). Este Programa de Especialización está conformado por las capacitaciones del Nivel Infanto-Juvenil (6-16 años) con el Nivel Juvenil y Profesional (16-21 años hasta la adultez) y reúne lo mejor de la teoría de cientos de libros y la experiencia de 35 años de práctica de una manera intensiva, presentados durante 5 meses en 18 clases en formato video para ver en el momento que quieras y algunos encuentros en vivo vía Zoom para poder interactuar con el docente y evacuar dudas.Para jerarquizar la propuesta acompañan a Borzi en esta capacitación los preparadores físicos Julio Santella, Ariel González, Luis Cairo y Juan Pablo Pochettino.
Primera Edición