APLICACIÓN DE LA TOPOLOGÍA MOLECULAR …
519
subgrupos formarán el grupo de entrenamiento y el quinto el grupo test. El
proceso se repite cinco veces cambiando los subgrupos de entrenamiento y test. La
división de los subgrupos fue llevada a cabo aleatoriamente.
El objetivo de este test de validación cruzada es determinar la robustez del
modelo, garantizando que el porcentaje de acierto del modelo no depende
exclusivamente de unos pocos compuestos empleados para su elaboración, sino
que los compuestos que conforman la data tienen similar peso a la hora de
elaborar el modelo.
3. RESULTADOS Y DISCUSIÓN
El análisis de discriminación lineal se realizó con los 49 compuestos que
formaban la data y los 62 descriptores topológicos que describen los aspectos
topológicos y estructurales de cada molécula.
Tabla 2.-‐
Matriz de clasificación obtenida con la función discriminante seleccionada y el test de
validación cruzada.
Grupo de
entrenamiento
Grupo test
FD
λ
%
Activos
%
Inactivos
%
Activos
%
Inactivos
(lambda de
Wilks)
Modelo
seleccionado
0.349
100
86
-
-
CV1
0.292
100
88
100
60
CV2
0.309
100
81
83
80
CV3
0.376
95
88
100
80
CV4
0.368
100
81
100
80
CV5
0.330
100
88
100
60
Media CV
0.335
99
85
97
72
La separación del grupo activo y del inactivo, se hizo en base al valor de
CI
50
=5
µ
M. La función discriminante seleccionada está formada por los descriptores
4
χ
pc
, G
2 v
y J
5
(evaluando el primero el grado de ramificación de cada compuesto y
los dos restantes la distribución de carga intramolecular).
FD = 21,54 + 9,26
4
χ
pc
-‐ 2,55 G
2 V
– 430,62 J
5
Ecuación 1
N=49; F=28,007;
λ
(Wilks’ lambda)=0,349
En base a esta función, un compuesto será clasificado como activo “A” si
presenta un valor de FD>0, en caso contrario, será catalogado como inactivo “I”
(ver Tabla 1).