Biblioteca Virtual

Dimensión efectiva en escenarios de alta dimensionalidad

Mostrar el registro sencillo del ítem

dc.contributor.advisor Forzani, Liliana
dc.contributor.author Gieco, María Antonella
dc.contributor.other Adrover, Jorge Gabriel
dc.contributor.other Bianco, Ana María
dc.contributor.other Sued, Mariela Raquel
dc.date.accessioned 2018-12-27
dc.date.available info:eu-repo/date/embargoEnd/2019-12-21
dc.date.issued 2018-12-17
dc.identifier.uri http://hdl.handle.net/11185/1158
dc.description Fil: Gieco, María Antonella. Universidad Nacional del Litoral. Facultad de Ingeniería Química; Argentina
dc.description.abstract In applications involving high-dimensional data, frequently a few variables contain most of the relevant information. Identifying how many dimensions should be kept in the analysis is of paramount importance in representing and modeling data efficiently. In order to understand this type of situation, Johnstone (2001) introduced spiked covariance models. In this model, all the population eigenvalues ​​are equal, except for a few fixed, larger of them, that carry the relevant information. The problem of estimating how many components should be considered has been studied and solved in the traditional case of p (dimension of the data) fixed and n (size of the sample) growing to infinity. In high-dimensional scenarios, however, the usual statistics can no longer be applied and traditional statistical theory is neither adequate nor easy to adapt. One of the contributions of this thesis is to study the asymptotic distribution of the logarithm of the likelihood ratio statistic under the null hypothesis, for the case of p and n growing to infinity, such that the ratio p/n converges to a fixed and positive quantity y. Using such distribution, secuancial tests are obtained to determine the dimension of the spiked subspace. From the study of the power of the proposed tests, a penalty is introduced to the considered statistic that allows to estimate the dimension of the spiked subspace even for values ​​of p/n close to 1, situation in which other approaches are deficient. en_EN
dc.description.abstract En aplicaciones que involucran datos en alta dimensión, frecuentemente unas pocas variables contienen la mayor parte de la información relevante. Resulta así de gran importancia identificar cuál es la dimensión adecuada para considerar en el análisis. Con el objetivo de comprender este tipo de situaciones, Johnstone (2001) introdujo los modelos de covarianza spiked, en el cual todos sus autovalores son iguales, excepto por una cantidad finita y relativamente chica de ellos, digamos d, que son más grandes. El problema de estimar cuántas componentes deben ser consideradas ha sido estudiado y resuelto en el caso tradicional de p (dimensión de los datos) fijo y n (tamaño de la muestra) creciendo a infinito. En escenarios de alta dimensión, sin embargo, los estadísticos usuales ya no pueden aplicarse y la teoría estadística tradicional no resulta adecuada ni tampoco fácil de adaptar. Una de las contribuciones de esta tesis es estudiar la distribución asintótica del logaritmo del cociente de verosimilitudes bajo la hipótesis nula, para el caso de p y n tendiendo a infinito de modo que la relación p/n converge a una cantidad fija y positiva. A partir de tal distribución, se obtienen tests secuenciales para determinar la dimensión del subespacio spiked. A partir del estudio de la potencia de los tests propuestos se introduce una penalización al estadístico considerado que permite determinar la dimensión del subespacio spiked incluso para valores de p/n cercanos a 1, situación en la que otros enfoques resultan deficientes. es_ES
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas es_ES
dc.format application/pdf
dc.language spa
dc.language.iso spa es_ES
dc.rights info:eu-repo/semantics/embargoedAccess
dc.rights Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Spiked population models en_EN
dc.subject High-dimensional statistics en_EN
dc.subject Effective dimension en_EN
dc.subject Likelihood ratio test en_EN
dc.subject Modelos de covarianza spiked es_ES
dc.subject Dimensión efectiva es_ES
dc.subject Cociente de verosimilitudes es_ES
dc.subject Alta dimensión es_ES
dc.title Dimensión efectiva en escenarios de alta dimensionalidad es_ES
dc.title.alternative Effective dimension in high-dimensinal settings en_EN
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:ar-repo/semantics/tesis doctoral
dc.type info:eu-repo/semantics/acceptedVersion
dc.type SNRD es_ES
dc.contributor.coadvisor Tolmasky, Carlos
unl.degree.type doctorado
unl.degree.name Doctorado en Matemática
unl.degree.grantor Facultad de Ingeniería Química
unl.formato application/pdf
unl.versionformato 1a
unl.tipoformato PDF/A - 1a
dc.date.embargo 21/12/2019


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/embargoedAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/embargoedAccess

Buscar en la biblioteca