YANETSY MACHADO TUGORES & col
470
núcleos bases nuevos, pero sí garantiza que aquellos que pasen estos filtros
estarán en el dominio de aplicabilidad de los modelos utilizados para la predicción.
Figura 2
.-‐ Resultados de la VC del modelo 37 dejando el 15% fuera de la SE.
Existen modelos publicados por nuestro grupo para la selección de
antimaláricos, pero estos carecen de un adecuado dominio de aplicación (10) y no
han sido obtenidos con la mezcla de todos los índices (lineales, bilineales y
cuadráticos). Nosotros, incluimos en la SE sólo moléculas con IC
50
<20 µM como
activas, permitiendo con este punto de corte, identificar sustancias con una
potencia adecuada. Por primera vez, se fusionaron los modelos individuales
mejorando los parámetros estadísticos de los mismos.
En el problema de la modelación molecular, es típico que exista gran
cantidad de casos parecidos con clases diferentes, que hace difícil encontrar los
patrones que caracterizan cada una de las clases del problema.
Por esto, surge la idea de usar un sistema que combine varios modelos de
clasificadores en un SMC (44). _ENREF_248. Una de las condiciones para obtener
buenos clasificadores de base es lograr la diversidad de los mismos (35), por ello
se realizó un estudio de diversidad con los 37 modelos obtenidos que nos permitió
obtener un menor número de clasificadores a combinar, no tomando en
consideración aquellos que coincidieran en la información brindada. En este
análisis de diversidad se seleccionaron los 12 modelos que maximizaron el valor
promedio del D y minimizaron el valor promedio del DF como medidas de
diversidad. Una vez que se seleccionaron los modelos con mayor diversidad se realizó
el análisis del voto no ponderado. Los 12 modelos más diversos se combinaron
70,00
75,00
80,00
85,00
90,00
95,00
100,00
1
2
3
4
5
6
7
Grupos
Q
SE SP (15%)