Biblioteca Virtual

Big Data para Quimiometría: Distribución asintótica del estimador PLS en alta dimensión

Mostrar el registro sencillo del ítem

dc.contributor.advisor Marcos, Miguel Andrés
dc.contributor.author Basa, Jerónimo
dc.contributor.other Sued, Raquel Mariela
dc.contributor.other Bianco, Ana María
dc.contributor.other Rodríguez, Daniela Andrea
dc.date.accessioned 2022-04-06T15:12:25Z
dc.date.available 2022-04-06T15:12:25Z
dc.date.issued 2022-03-17
dc.identifier.uri https://hdl.handle.net/11185/6389
dc.description Fil: Basa, Jerónimo. Universidad Nacional del Litoral. Facultad de Ingeniería Química; Argentina. es_ES
dc.description.abstract Muchos de los problemas en estadística se basan en estudiar el comportamiento de una o más variables llamadas respuesta a partir de un conjunto de variables llamadas predictoras. Para ello se toman mediciones u observaciones, se hace un análisis exploratorio de estos datos y se propone un modelo matemático que explique su relación. Uno de los modelos más usados y estudiados es la regresión lineal. Cuando el número de predictores p es grande comparado con el tamaño de observaciones n, muchos de los métodos tradicionales en estadística comienzan a dar estimaciones que pueden ser muy pobres. En particular, en el contexto de regresión lineal se vuelve un problema estimar el vector de parámetros con el método de mínimos cuadrados, usado tradicionalmente en el caso n > p. El objetivo de esta tesis es extender los resultados de Cook y Forzani de 2018 para hallar la distribución (n,p) asintótica de la predicción PLS. En un contexto general, encontramos la presencia de un sesgo no aleatorio en esta convergencia y damos condiciones para que sea despreciable. Proponemos estimadores para la varianza asintótica y para el sesgo, mostrando su consistencia. Utilizando éstos deducimos a su vez intervalos de confianza y predicción para el parámetro dado por el modelo. Finalmente, mostramos ejemplos y simulaciones para ilustrar los resultados expuestos. es_ES
dc.description.abstract Many of the problems in statistics are based on studying the behavior of one or more variables called response from a set of variables called predictors. For this, measurements or observations are taken, an exploratory analysis of these data is made and a mathematical model is proposed to explain their relationship. One of the most used and studied models is linear regression. When the number of predictors p is large compared to the size of observations n, many of the traditional methods in statistics begin to give estimates that can be very poor. In particular, in the context of linear regression it becomes a problem to estimate the vector of parameters with the method of least squares, traditionally used in the case n > p. The objective of this thesis is to extend the results of Cook and Forzani from 2018 to find the asymptotic (n,p) distribution of the PLS prediction. In a general context, we find the presence of a non-random bias in this convergence and give conditions for it to be negligible. We propose estimators for the asymptotic variance and for the bias, showing their consistency. Using these we in turn deduce confidence and prediction intervals for the parameter given by the model. Finally, we show examples and simulations to illustrate the exposed results. en_EN
dc.description.sponsorship Consejo Nacional de Investigaciones Científicas y Técnicas es_ES
dc.format application/pdf
dc.language.iso spa es_ES
dc.rights info:eu-repo/semantics/openAccess
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject PLS es_ES
dc.subject Regresión es_ES
dc.subject Alta dimensión es_ES
dc.subject Distribución es_ES
dc.subject Asintótica es_ES
dc.subject Quimiometría es_ES
dc.subject PLS en_EN
dc.subject Regression en_EN
dc.subject Chemometric en_EN
dc.subject Distribution en_EN
dc.subject Asymptotic en_EN
dc.subject High dimension en_EN
dc.title Big Data para Quimiometría: Distribución asintótica del estimador PLS en alta dimensión es_ES
dc.title.alternative Big Data for Chemometric: Asymptotic distribution of PLS regression estimators in high dimension en_EN
dc.type SNRD es_ES
dc.type info:eu-repo/semantics/masterThesis
dc.type info:ar-repo/semantics/tesis de maestría
dc.type info:eu-repo/semantics/acceptedVersion
dc.contributor.coadvisor Forzani, Liliana
unl.degree.type maestría
unl.degree.name Maestría en Matemática
unl.degree.grantor Facultad de Ingeniería Química
unl.formato application/pdf


Ficheros en el ítem

Este ítem aparece en

Mostrar el registro sencillo del ítem

info:eu-repo/semantics/openAccess Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess

Buscar en la biblioteca