Introducción a los modelos de clasificación
Autor | Cristian Fernando Téllez Piñerez/Mario Alfonso Morales Rivera |
Páginas | 92-113 |
Cap´
ıtulo 3
Introducci´on a los modelos de
clasificaci´on
En este cap´ıtulo se estudian modelos donde la variable respuesta es de natu-
raleza num´erica continua pero la (o las) variable(s) explicativas son categ´orica
(factores), veremos que en esta situaci´on el modelo lineal resultante es el mismo
que estudiamos en el cap´ıtulo 1, sin embargo, la matriz de variables regresoras
cambia sustancialmente. El objetivo del cap´ıtulo es aprender a construir la
matriz Xdependiendo de los factores que explican la respuesta y sus niveles
y estudiar la forma como se solucionan las ecuaciones normales y la utilidad,
desde el punto de vista estad´ıstico, de dichas soluciones.
3.1 Regresi´on en variables Dummy
Un investigador en agroqu´ımica desarrolla tres nuevos fertilizantes, para in-
crementar la producci´on de cierto cultivo. El desea probar si en promedio la
producci´on es la misma para los tres fertilizantes o si por el contrario uno de
ellos conduce a una producci´on significativamente mayor que los otros dos.
Para formular un modelo que nos permita responder la inquietud del investi-
gador partimos del hecho que el cultivo, sin la aplicaci´on de fertilizante, tendr´a
una producci´on µkilogramos por hect´area (Kg/ha). Si se aplica el fertilizante
1, se espera un incremento α1Kg/ha, mientras que si se aplica el fertilizante
2 el incremento ser´ıa α2Kg/ha, de manera similar para el fertilizante 3, se
espera un incremento en la producci´on igual a α3Kg/ha. E l modelo podr´ıa
plantearse como
y1=µ+α1+ǫ1, y2=µ+α2+ǫ2, y3=µ+α3+ǫ3
donde y1es la producci´on de un cultivo tratado con el fertilizante 1 y ǫ1
es un t´ermino de error aleatorio, similarmente se define y2,ǫ2,y3yǫ3. El
92
93 Modelos lineales
investigador desear´ıa estimar los par´ametros µ,α1,α2,α3y probar hip´otesis
tal como H0:α1=α2, frente a la alternativa H1:α1> α2, es decir que el
incremento de la producci´on del cultivo es el mismo frente a la alternativa que
el fertilizante 1 produce un incremento significativamente mayor que el 2.
Para hacer buenas estimaciones el investigador necesita observar la producci´on
de m´as de un cultivo con cada fertilizante, supongamos que hace un experi-
mento en el cual toma siete parcelas similares en cuanto a condiciones del suelo
y siembre el cultivo, aleatoriamente fertiliza tres con el fertilizante 1, dos con
el fertilizante 2 y las dos restantes con el fertilizante 3, y registra la producci´on
de cada parcela, los datos se registran en la tabla 3.1. Podemos escribir el
Fertilizante
123
y11 y21 y31
y12 y22 y32
y13 y23 y33
Tablas 3.1: Datos de producci´on
modelo para la producci´on de cada parcela de la siguiente forma
y11 =µ+α1+ǫ11 y21 =µ+α2+ǫ21 y31 =µ+α3+ǫ31
y12 =µ+α1+ǫ12 y22 =µ+α2+ǫ21 y32 =µ+α3+ǫ33 (3.1)
y13 =µ+α1+ǫ13 y23 =µ+α2+ǫ21 y33 =µ+α3+ǫ33
usando el ´ındice ipara fertilizante y jpara la r´eplica p odemos escribir el
modelo en forma general as´ı
yij =µ+αi+ǫij para i= 1,2,3j= 1,2,3 (3.2)
yij representa la producci´on observada en la j-´esima parcela, tratada con el
fertilizante iyǫij es el t´ermino de error asociado.
En este cap´ıtulo usaremos el t´ermino factor para denotar lo que hasta ahora
hemos llamado una variable; as´ı, fertilizante es un factor, otros ejemplos la
variedad, y en el caso de seres humanos la educaci´on, el sexo, el estrato socioe-
con´omico. Cada una de las categor´ıas en que se divide un factor se conocen
como niveles del factor. Por ejemplo, 1, 2 y 3 son los niveles del factor fertil-
izante; primaria, secundaria y universitaria podr´ıan ser niveles del factor edu-
caci´on; empleado independiente es un nivel del factor ocupaci´on. En nuestro
ejemplo queremos investigar el efecto de cada uno de los tres niveles del factor
fertilizante sobre la producci´on. Otra forma de obtener las ecuaciones dadas
en (3.2) es mediante una regresi´on en tres variables independientes x1,x2yx3
yij =µ+α1xi1+α2xi2+α3xi3+ǫij (3.3)
M.A. Morales C.F. Tellez
Para continuar leyendo
Solicita tu prueba