Biblioteca Virtual

Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla

Mostrar el registro sencillo del ítem

dc.contributor.advisor Rufiner, Hugo Leonardo es
dc.contributor.author Vignolo, Leandro Daniel
dc.contributor.other Ponzoni, Ignacio
dc.contributor.other Chiotti, Omar
dc.contributor.other Granitto, Pablo en
dc.date.accessioned 2012-02-28T16:09:16Z
dc.date.available 2012-02-28T16:09:16Z
dc.date.issued 2012-02-28T16:09:16Z
dc.identifier.uri http://hdl.handle.net/11185/307
dc.description Fil: Vignolo, Leandro Daniel. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas; Argentina.
dc.description.abstract The key issue on speech recognition is given by the characteristics of the signals involved, as these are governed by complex probability density functions, are non-stationary and generally contaminated with noise of diverse nature and intensity. This is why the automatic recognition systems need a processing stage in order to bring out the key features of phonemes, allowing to improve their performance. The goal of this thesis is the development of a methodology for the optimization of the signal processing stage, in order to improve the results of an automatic speech recognition system. This methodology consists in the use of evolutionary algorithms for the optimization of the feature vector used for speech signal representation. The hypothesis is that the better the analysis or process applied to the patterns that are to be classified, the more separated would the classes result in the features space and, therefore, the classification task would be simpler. In this thesis, the first proposal is to continue the search for an optimal representation based on cepstral coefficients, by the optimization of the filterbank involved in this feature extraction procedure. On the other hand, wavelets have characteristics that are useful for the analysis of non-stationary signals. These features present discriminative information, however, the large number of coefficients makes the task of the classifier more difficult. Because of this, the use of an evolutionary algorithm is proposed to search for a subset of coefficients which maximizes the discrimination capability. en
dc.description.abstract La dificultad para resolver los problemas asociados al reconocimiento del habla está dada por las características de las señales implicadas, ya que las mismas presentan complejas funciones de densidad de probabilidad, son no estacionarias y generalmente se encuentran contaminadas con ruidos de naturaleza e intensidad muy diversa. Es por ésto que los sistemas de reconocimiento automático requieren de una etapa de procesamiento que ponga en evidencia las características distintivas de cada fonema, permitiendo mejorar los resultados. El objetivo de esta tesis es el desarrollo de un método para optimizar la etapa de procesamiento de la señal de voz, de manera que permita mejorar los resultados de un sistema de reconocimiento automático del habla. Dicha metodología consiste en la aplicación de algoritmos evolutivos para optimizar el vector de características utilizado para representar las señales de voz. Se parte de la hipótesis de que cuanto mejor sea el análisis o proceso utilizado para generar los patrones a identificar, más separadas quedarán las clases en el espacio de características y la tarea de clasificación resultará más sencilla. Más precisamente, en esta tesis se proponen dos alternativas evolutivas para la búsqueda de un conjunto robusto de características. En la primera propuesta se aborda la optimización de una representación basada en coeficientes cepstrales. La segunda propuesta consiste en la optimización de una descomposición no convencional para el reconocimiento del habla, denominada paquetes de onditas, que provee características interesantes para el análisis de este tipo de señales. es
dc.description.sponsorship Universidad Nacional del Litoral es
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas es
dc.format application/pdf
dc.format.mimetype application/pdf
dc.language spa
dc.language.iso spa es
dc.rights info:eu-repo/semantics/openAccess
dc.rights Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Algoritmos evolutivos es
dc.subject Cuantización vectorial es
dc.subject Modelos ocultos de Markov es
dc.subject Paquete de onditas es
dc.subject Coeficientes cepstrales es
dc.subject Reconocimiento robusto del habla es
dc.title Optimización mediante algoritmos evolutivos de la representación de señales para el reconocimiento automático del habla es
dc.title.alternative Evolutionary optimization of signal representations for automatic speech recognition es
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:ar-repo/semantics/tesis doctoral
dc.type info:eu-repo/semantics/acceptedVersion
dc.type SNRD
dc.type Thesis es
dc.contributor.coadvisor Milone, Diego Humberto en
unl.formato application/pdf
unl.versionformato 1a
unl.tipoformato PDF/A-1a


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess

Buscar en la biblioteca