Biblioteca Virtual

Modelos de factorización en matrices no negativas para procesamiento de audio

Mostrar el registro sencillo del ítem

dc.contributor.advisor Di Persia, Leandro Ezequiel
dc.contributor.author Ibarrola, Francisco Javier
dc.contributor.other Aimar, Hugo
dc.contributor.other Flesia, Ana Georgina
dc.contributor.other Schlotthauer, Gastón
dc.date.accessioned 2019-10-08T16:56:01Z
dc.date.available 2019-10-08T16:56:01Z
dc.date.issued 2019-09-06
dc.identifier.uri https://hdl.handle.net/11185/5153
dc.description Fil: Ibarrola, Francisco Javier. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
dc.description.abstract Along the technological advances regarding portable electronic devices, over the last years the need for improving human machine interactions through speech has arise. One of the main challenges within this contexts has to do with the fact that a recording device does not register the target signal directly, but distorted with noise, echoes and other sound sources. In order to model these phenomena in a computationally efficient way and to gain interpretability, we can make use of nonnegative matrix factorization (NMF) techniques, that allow for a piecewise and purely additive representation of the data. Nevertheless, the classical NMF approaches present drawbacks associated to the lack of uniqueness in the representations. Furthermore, the current optimization methods are based on iterative, multiplicative algorithms that are not immediately adaptable to models contemplating certain time or frequency relations between their elements. In this thesis, new NMF methods are developed in order to tackle the problems of dereveberation and speech source separation. Through a Bayesian approach, and the associated penalization functions, certain characteristics are imposed over the elements constituting the model, which allows sorting out some classical difficulties within this context, associated to the lack of uniqueness and correlation in representations. Also, optimization algorithms are developed in order to tackle the minimization problems associated to the built functional, that allow for incorporating certain types of penalizers that due to their characteristics cannot be defined element by element. en_EN
dc.description.abstract A la par de los avances tecnológicos de los aparatos electrónicos portátiles, ha surgido en los últimos años la necesidad de mejorar la interacción entre hombre y máquina a través del habla. Uno de los desafíos en este contexto tiene que ver con que un dispositivo de grabación no registra la señal deseada de manera directa, sino distorsionada mediante ruido, ecos y la presencia de otras fuentes sonoras. Para modelar estos fenómenos de manera computacionalmente eficiente y ganar interpretabilidad, podemos hacer uso de técnicas de factorización en matrices no negativas (NMF), que permiten una representación de los datos por partes y puramente aditiva. No obstante, los enfoques clásicos de NMF presentan dificultades asociadas a falta de unicidad en las representaciones. Por otro lado, los métodos de optimización actuales están basados en algoritmos iterativos y multiplicativos, que no son inmediatamente adaptables a modelos que contemplen ciertas relaciones temporales o frecuenciales entre sus elementos. En esta tesis se desarrollan nuevos métodos de NMF para abordar los problemas de dereveberación y separación de fuentes de habla. A través de un enfoque bayesiano y sus funciones de penalización asociadas se imponen características particulares sobre los elementos del modelo, lo que permite superar algunas dificultades clásicas en este contexto, asociadas a la falta de unicidad y decorrelación en las representaciones. Además, se desarrollan algoritmos de optimización para resolver los problemas de minimización asociados a los funcionales construidos, que permiten incorporar ciertos tipos de penalizantes que por sus características no pueden ser definidos elemento a elemento. es_ES
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas es_ES
dc.format application/pdf
dc.language.iso spa es_ES
dc.rights info:eu-repo/semantics/openAccess
dc.rights Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Dereverberation en_EN
dc.subject Source separation en_EN
dc.subject Machine learning en_EN
dc.subject Signal processing en_EN
dc.subject Dereverberación es_ES
dc.subject Separación de fuentes sonoras es_ES
dc.subject Aprendizaje maquinal es_ES
dc.subject Procesamiento de señales es_ES
dc.title Modelos de factorización en matrices no negativas para procesamiento de audio es_ES
dc.title.alternative Nonnegative matrix factorization models for audio processing en_EN
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:ar-repo/semantics/tesis doctoral
dc.type info:eu-repo/semantics/acceptedVersion
dc.type SNRD es_ES
dc.contributor.coadvisor Spies, Rubén Daniel
unl.degree.type doctorado
unl.degree.name Doctorado en Ingeniería
unl.degree.mention Inteligencia Computacional, Señales y Sistemas
unl.degree.grantor Facultad de Ingeniería y Ciencias Hídricas
unl.formato application/pdf
unl.versionformato 1b
unl.tipoformato PDF/A - 1b


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess

Buscar en la biblioteca