Dimensión efectiva en escenarios de alta dimensionalidad

Gieco, María Antonella

Dimensión efectiva en escenarios de alta dimensionalidad

dc.contributor.advisor	Forzani, Liliana
dc.contributor.author	Gieco, María Antonella
dc.contributor.other	Adrover, Jorge Gabriel
dc.contributor.other	Bianco, Ana María
dc.contributor.other	Sued, Mariela Raquel
dc.date.accessioned	2018-12-27
dc.date.available	info:eu-repo/date/embargoEnd/2019-12-21
dc.date.issued	2018-12-17
dc.identifier.uri	http://hdl.handle.net/11185/1158
dc.description	Fil: Gieco, María Antonella. Universidad Nacional del Litoral. Facultad de Ingeniería Química; Argentina
dc.description.abstract	In applications involving high-dimensional data, frequently a few variables contain most of the relevant information. Identifying how many dimensions should be kept in the analysis is of paramount importance in representing and modeling data efficiently. In order to understand this type of situation, Johnstone (2001) introduced spiked covariance models. In this model, all the population eigenvalues are equal, except for a few fixed, larger of them, that carry the relevant information. The problem of estimating how many components should be considered has been studied and solved in the traditional case of p (dimension of the data) fixed and n (size of the sample) growing to infinity. In high-dimensional scenarios, however, the usual statistics can no longer be applied and traditional statistical theory is neither adequate nor easy to adapt. One of the contributions of this thesis is to study the asymptotic distribution of the logarithm of the likelihood ratio statistic under the null hypothesis, for the case of p and n growing to infinity, such that the ratio p/n converges to a fixed and positive quantity y. Using such distribution, secuancial tests are obtained to determine the dimension of the spiked subspace. From the study of the power of the proposed tests, a penalty is introduced to the considered statistic that allows to estimate the dimension of the spiked subspace even for values of p/n close to 1, situation in which other approaches are deficient.	en_EN
dc.description.abstract	En aplicaciones que involucran datos en alta dimensión, frecuentemente unas pocas variables contienen la mayor parte de la información relevante. Resulta así de gran importancia identificar cuál es la dimensión adecuada para considerar en el análisis. Con el objetivo de comprender este tipo de situaciones, Johnstone (2001) introdujo los modelos de covarianza spiked, en el cual todos sus autovalores son iguales, excepto por una cantidad finita y relativamente chica de ellos, digamos d, que son más grandes. El problema de estimar cuántas componentes deben ser consideradas ha sido estudiado y resuelto en el caso tradicional de p (dimensión de los datos) fijo y n (tamaño de la muestra) creciendo a infinito. En escenarios de alta dimensión, sin embargo, los estadísticos usuales ya no pueden aplicarse y la teoría estadística tradicional no resulta adecuada ni tampoco fácil de adaptar. Una de las contribuciones de esta tesis es estudiar la distribución asintótica del logaritmo del cociente de verosimilitudes bajo la hipótesis nula, para el caso de p y n tendiendo a infinito de modo que la relación p/n converge a una cantidad fija y positiva. A partir de tal distribución, se obtienen tests secuenciales para determinar la dimensión del subespacio spiked. A partir del estudio de la potencia de los tests propuestos se introduce una penalización al estadístico considerado que permite determinar la dimensión del subespacio spiked incluso para valores de p/n cercanos a 1, situación en la que otros enfoques resultan deficientes.	es_ES
dc.description.sponsorship	Consejo Nacional de Investigaciones Científicas y Técnicas	es_ES
dc.format	application/pdf
dc.language	spa
dc.language.iso	spa	es_ES
dc.rights	info:eu-repo/semantics/embargoedAccess
dc.rights	Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject	Spiked population models	en_EN
dc.subject	High-dimensional statistics	en_EN
dc.subject	Effective dimension	en_EN
dc.subject	Likelihood ratio test	en_EN
dc.subject	Modelos de covarianza spiked	es_ES
dc.subject	Dimensión efectiva	es_ES
dc.subject	Cociente de verosimilitudes	es_ES
dc.subject	Alta dimensión	es_ES
dc.title	Dimensión efectiva en escenarios de alta dimensionalidad	es_ES
dc.title.alternative	Effective dimension in high-dimensinal settings	en_EN
dc.type	info:eu-repo/semantics/doctoralThesis
dc.type	info:ar-repo/semantics/tesis doctoral
dc.type	info:eu-repo/semantics/acceptedVersion
dc.type	SNRD	es_ES
dc.contributor.coadvisor	Tolmasky, Carlos
unl.degree.type	doctorado
unl.degree.name	Doctorado en Matemática
unl.degree.grantor	Facultad de Ingeniería Química
unl.formato	application/pdf
unl.versionformato	1a
unl.tipoformato	PDF/A - 1a
dc.date.embargo	21/12/2019