ETSIT  ¦ Escuela  ¦ Comisiones  ¦ Comisión del Plan de Estudios  ¦ REUNIONES CPE  ¦ Borrador final: Descriptores MUIT  ¦  MUIT - Especialidad de Machine Learning and Multimedia Data Science

Borrador final:Descriptores

S10

VEGI - 3SEMI - 2COMM - 5REAC - 5
DIoT - 5OPTE - 5OPTE - 5

S9

GPRO - 5ASIA - 5SEDA - 5EANI - 5SCOM - 5ARCO - 5

 

MUIT - Especialidad Aprendizaje Automático y Big Data

MUIT - Especialidad Electrónica

MUIT - Especialidad Ciberseguridad y Redes Software

MUIT - Especialidad de Señales y Comunicaciones

MUIT - Especialidad de Machine Learning and Multimedia Data Science

MUIT - Especialidad en Ingeniería Fotónica y Fotovoltaica

MUIT - Especialidad en Ingeniería Biomédica

MUIT - Especialidad en Gestión, Innovación y Negocio Digital

OPTATIVAS

 

Laboratorio de comunicaciones (LACOM) 5 ECTS – S10

  1. Evaluación de los efectos de la propagación multitrayecto, efecto Doppler y dispersión del canal radio sobre las señales transmitidas en enlace móvil.
  2. Interfaz radio en redes de comunicaciones móviles. Medida y caracterización de los principales parámetros técnicos de los enlaces descendente y ascendente.
  3. Caracterización experimental de la cobertura y calidad de despliegues de redes inalámbricas con tecnología Wi-Fi.
  4. Caracterización de señales OFDM.
  5. Caracterización de DVB-T.
  6. Estudio de factores técnicos (por ejemplo, latencia motion-to-photon, resolución, etc.) en entornos de comunicación e interacción remota.
  7. Evaluación mediante pruebas subjetivas y métricas objetivas del impacto de dichos factores técnicos en la calidad de experiencia de los usuarios.

 Normas CIN

  • Capacidad para aplicar métodos de la teoría de la información, la modulación adaptativa y codificación de canal, así como técnicas avanzadas de procesado digital de señal a los sistemas de comunicaciones y audiovisuales.
  • Capacidad para desarrollar sistemas de radiocomunicaciones: diseño de antenas, equipos y subsistemas, modelado de canales, cálculo de enlaces y planificación.
  • Capacidad para diseñar y dimensionar redes de transporte, difusión y distribución de señales multimedia.

 

Deep Learning for Acoustic Signal Processing (DLAS) 5 ECTS – S10

  1. Introducing Machine learning and Deep Learning working with acoustic signals and related application fields (speech, music, audio, forensics acoustics, biomedical applications…).
  2. Processing and extracting knowledge from acoustics: reviewing traditional machine learning based approaches.
  3. Deep Learning architectures for modeling acoustic signals as time series (1D CNNs), timefrequency images (2D CNNs, sequence of tokens (LSTM, Transformers, ..)
  4. Building applications combining Signal Processing and Deep Learning in Differentiable Digital Signal Processing: emotion recognition, pathological voices, music timbre transformation, sound sources separation,…
  5. Introducing Generative models and Large Multimodal Models for applications in music, speech, sounds generation from text, images, …

Normas CIN

  • Capacidad para aplicar métodos de la teoría de la información, la modulación adaptativa y codificación de canal, así como técnicas avanzadas de procesado digital de señal a los sistemas de comunicaciones y audiovisuales

 

Vision Analysis and Deep Learning (VADL) 5 ECTS - S11

  1. Introduction to image and video processing: 3D/2D projection, digital image and video, spatiotemporal sampling.
  2. Motion estimation.
  3. Video filtering: Noise reduction; video stabilization.
  4. Image and video segmentation: image segmentation; foreground segmentation; temporal video segmentation.
  5. Deep learning for computer vision: Machine learning fundamentals for computer vision; Deep learning solutions: mage classification, segmentation and detection

 

Artificial Intelligence in Multimedia (AIMU) 5 ECTS - S11

  1. Main principles of Artificial Intelligence for Multimedia.
  2. Classical machine learning algorithms for supervised, semi-supervised and unsupervised learning in multimedia.
  3. Advanced Deep Learning architectures for vision, audio, and multimodal correspondence representations.
  4. Multimedia data augmentation, transfer learning, fine-tuning, representation learning, selfsupervised learning, adversarial learning, contrastive learning, in-context learning, zero and few shot learning, etc.
  5. Generative Multimedia Models: Autoregressive, VAEs, GANs, Normalizing Flows, Diffusion, Consistency Models, …
  6. Guidelines to design, evaluate and develop Multimodal AI applications. Practical case studies: multimedia analysis and information extraction using classification, regression and clustering with machine learning and deep learning models, multimodal generative AI applications using Foundation or Large Multimodal Models,…

 

Multimedia Artificial Intelligence Lab (MAIL) 5 ECTS - S11

  1. Experimental methodology to develop and apply AI (Machine Learning, Deep Learning) to practical multimedia scenarios.
  2. Accurate training and assessment of models, ablation studies, interpretability and explainability.
  3. Hands-on experience in practical tools and environments: libraries such as Scikit-Learn, Librosa, OpenCV, Pytorch, TorchAudio, TorchVision, … AI communities such as Hugging Face, Kaggle, Discord,...
  4. Introduction to Multimodal AI services in cloud platforms: Google Cloud, AWS, Azure, Databricks,..
  5. Principles of MLOps for the lifecycle and deployment of multimedia machine learning models.
  6. Adapting Multimodal Generative AI to specific applications and handling ethical issues: fake contents, hallucinations, toxicity, bias,..