Introducción a los modelos de clasificación - Modelos Estadísticos lineales - Libros y Revistas - VLEX 742107133

Introducción a los modelos de clasificación

AutorCristian Fernando Téllez Piñerez/Mario Alfonso Morales Rivera
Páginas92-113
Cap´
ıtulo 3
Introducci´on a los modelos de
clasificaci´on
En este cap´ıtulo se estudian modelos donde la variable respuesta es de natu-
raleza num´erica continua pero la (o las) variable(s) explicativas son categ´orica
(factores), veremos que en esta situaci´on el modelo lineal resultante es el mismo
que estudiamos en el cap´ıtulo 1, sin embargo, la matriz de variables regresoras
cambia sustancialmente. El objetivo del cap´ıtulo es aprender a construir la
matriz Xdependiendo de los factores que explican la respuesta y sus niveles
y estudiar la forma como se solucionan las ecuaciones normales y la utilidad,
desde el punto de vista estad´ıstico, de dichas soluciones.
3.1 Regresi´on en variables Dummy
Un investigador en agroqu´ımica desarrolla tres nuevos fertilizantes, para in-
crementar la producci´on de cierto cultivo. El desea probar si en promedio la
producci´on es la misma para los tres fertilizantes o si por el contrario uno de
ellos conduce a una producci´on significativamente mayor que los otros dos.
Para formular un modelo que nos permita responder la inquietud del investi-
gador partimos del hecho que el cultivo, sin la aplicaci´on de fertilizante, tendr´a
una producci´on µkilogramos por hect´area (Kg/ha). Si se aplica el fertilizante
1, se espera un incremento α1Kg/ha, mientras que si se aplica el fertilizante
2 el incremento ser´ıa α2Kg/ha, de manera similar para el fertilizante 3, se
espera un incremento en la producci´on igual a α3Kg/ha. E l modelo podr´ıa
plantearse como
y1=µ+α1+ǫ1, y2=µ+α2+ǫ2, y3=µ+α3+ǫ3
donde y1es la producci´on de un cultivo tratado con el fertilizante 1 y ǫ1
es un t´ermino de error aleatorio, similarmente se define y2,ǫ2,y3yǫ3. El
92
93 Modelos lineales
investigador desear´ıa estimar los par´ametros µ,α1,α2,α3y probar hip´otesis
tal como H0:α1=α2, frente a la alternativa H1:α1> α2, es decir que el
incremento de la producci´on del cultivo es el mismo frente a la alternativa que
el fertilizante 1 produce un incremento significativamente mayor que el 2.
Para hacer buenas estimaciones el investigador necesita observar la producci´on
de m´as de un cultivo con cada fertilizante, supongamos que hace un experi-
mento en el cual toma siete parcelas similares en cuanto a condiciones del suelo
y siembre el cultivo, aleatoriamente fertiliza tres con el fertilizante 1, dos con
el fertilizante 2 y las dos restantes con el fertilizante 3, y registra la producci´on
de cada parcela, los datos se registran en la tabla 3.1. Podemos escribir el
Fertilizante
123
y11 y21 y31
y12 y22 y32
y13 y23 y33
Tablas 3.1: Datos de producci´on
modelo para la producci´on de cada parcela de la siguiente forma
y11 =µ+α1+ǫ11 y21 =µ+α2+ǫ21 y31 =µ+α3+ǫ31
y12 =µ+α1+ǫ12 y22 =µ+α2+ǫ21 y32 =µ+α3+ǫ33 (3.1)
y13 =µ+α1+ǫ13 y23 =µ+α2+ǫ21 y33 =µ+α3+ǫ33
usando el ´ındice ipara fertilizante y jpara la r´eplica p odemos escribir el
modelo en forma general as´ı
yij =µ+αi+ǫij para i= 1,2,3j= 1,2,3 (3.2)
yij representa la producci´on observada en la jesima parcela, tratada con el
fertilizante iyǫij es el t´ermino de error asociado.
En este cap´ıtulo usaremos el t´ermino factor para denotar lo que hasta ahora
hemos llamado una variable; as´ı, fertilizante es un factor, otros ejemplos la
variedad, y en el caso de seres humanos la educaci´on, el sexo, el estrato socioe-
con´omico. Cada una de las categor´ıas en que se divide un factor se conocen
como niveles del factor. Por ejemplo, 1, 2 y 3 son los niveles del factor fertil-
izante; primaria, secundaria y universitaria podr´ıan ser niveles del factor edu-
caci´on; empleado independiente es un nivel del factor ocupaci´on. En nuestro
ejemplo queremos investigar el efecto de cada uno de los tres niveles del factor
fertilizante sobre la producci´on. Otra forma de obtener las ecuaciones dadas
en (3.2) es mediante una regresi´on en tres variables independientes x1,x2yx3
yij =µ+α1xi1+α2xi2+α3xi3+ǫij (3.3)
M.A. Morales C.F. Tellez

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR