Durante el curso de verano de Speech Technology Center los estudiantes le enseñaban a la máquina a leer los labios



Del 14 al 25 de agosto en la Universidad Nacional de Investigación de Tecnologías Informáticas, Mecánica y Óptica de San Petersburgo (ITMO) Speech Technology Center organizó el curso de verano de aprendizaje automático AlGORythm. Durante 10 días asistiendo a las conferencias y a las clases prácticas los alumnos estudiaban algoritmos de aprendizaje automático.


En el curso se matricularon los estudiantes y graduados de las Universidades técnicas, jóvenes especialistas en tecnologías de información. Para matricularse los aspirantes tenían que superar una prueba. Se les enviaba una tarea sobre el aprendizaje de una red neuronal para un sistema de reconocimiento de patrones. Había que enseñar al sistema a detectar y reconocer señales de tráfico en las fotografías. Conforme a los resultados de la prueba, en el curso se matricularon los estudiantes de San Petersburgo, Moscú, Cherepovéts y Yaroslavl.


"El departamento de tecnologías informáticas de voz creado por Speech Technology Center lleva abierto en la Universidad ITMO ya seis años, pero es la primera vez que hemos escogido tal formato. El curso de verano de aprendizaje automático es una buena oportunidad de atraer atención de más oyentes, no sólo de estudiantes de otras Universidades, sino de graduados y jóvenes especialistas a quienes les interesa este tema", comenta el jefe del departamento de tecnologías informáticas de voz de la Universidad ITMO, Yuriy Matvéev.
Conforme al programa del curso los alumnos estudiaban aprendizaje automático con tareas de reconocimiento del habla. En las clases los profesores de Speech Technology Center, Sberbank Technology, S.A. y de la Universidad de Investigación Científica "Escuela Superior de Económicas" de Nizniy Nóvgorod les explicaban los métodos de aprendizaje automático y durante las prácticas los estudiantes creaban casi desde cero un sistema de reconocimiento del habla por sonido y articulación (movimientos de los labios). Para este fin los expertos de Speech Technology Center les proporcionaron unas bases de grabaciones de audio y de video, ejemplos y plantillas de algoritmos de reconocimiento.


Para resolver el problema final a los estudiantes los separaron en equipos. Tenían que enseñar al sistema a reconocer los dígitos que pronunciaban los locutores. Las grabaciones de audio y video eran de diferente calidad, por ejemplo, algunas contenían muchos ruidos. Cada equipo probaba suerte con diversos algoritmos de reconocimiento, arquitectura de las redes neuronales y métodos de aprendizaje. Los estudiantes le enseñaban al sistema a reconocer los sonidos por separado y teniendo en cuenta el contexto, trabajaban aislada y paralelamente con los audios y videos, hacían experimentos respecto al procesamiento de front-end, etc.


El 25 de agosto los estudiantes presentaron sus logros ante el jurado formado por los directivos y los expertos del departamento de investigación científica de Speech Technology Center, jefe del departamento de tecnologías informáticas de voz de la Universidad ITMO y el organizador del curso de verano de parte de la Universidad. Se calificaba por separado la contribución de cada estudiante en los resultados del equipo. Entre los mejores estaban Vladímir Batáev, Iván Krémnev y Antón Mitrofánov. Según los resultados del curso, les ofrecieron empleo en Speech Technology Center.


"Un curso intensivo de diez días con hincapié en las prácticas permite centrarse en el tema sin dedicarse de manera excesiva a la teoría y trabajar en un proyecto real. Este curso es algo entre un curso universitario y prácticas en una empresa. Los estudiantes trabajan con el prototipo de un motor operativo, tienen que aprender a distribuir las tareas entre los miembros del equipo, hacer lo máximo posible en poco tiempo y disponiendo de recursos limitados. Aquí no sólo se puede revelar las habilidades puramente técnicas, sino la capacidad de una persona de solucionar tareas prácticas", comenta el jefe del departamento de investigación científica de Speech Technology Center, Kirill Levin.


El curso de verano fue gratuito, los organizadores se encargaron de los gastos de transporte y alojamiento de los estudiantes de otras ciudades. Las clases tenían lugar en la Universidad ITMO y en el clúster de ordenadores de Speech Technology Center.