Perspectiva general sobre el proceso de desarrollo de fármacos…
545
cognitivo acerca de cuales de ellos son mejores, no importa cuales dos objetos uno
compare, todo resultará igualmente similar (disimilar) (80). En este sentido,
algunos investigadores de la química medicinal han planteado que no tiene sentido
hablar de diversidad sin un sistema de referencia, que está dado en este caso por el
ensayo biológico (81). Una estrategia para solucionar esta dificultad es seleccionar
un conjunto de descriptores en particular para los cuales se demostró que
funcionan bien en un cierto problema. Otra estrategia es calcular primero un gran
número de descriptores y luego eliminar aquellos descriptores del conjunto que
muestran un coeficiente de correlación por encima de cierto valor. Un enfoque
diferente es dejar que la computadora escoja la combinación óptima de
descriptores para el problema en cuestión (82).
Numerosos métodos automáticos han sido propuestos en
quimioinformática para la selección de rasgos, por ejemplo, la técnica paso a paso
de los procesos de integración hacia adelante o eliminación hacia atrás y el análisis
de componentes principales (83); también ha sido propuesto el uso de los
k
-‐
vecinos más cercanos (84). Otros métodos de selección más usados en la
modelación REA se encuentran la selección secuencial hacia delante (Sequential
Feature Forward Selection), la eliminación secuencial hacia atrás (Sequential
Feature Backward Elimination), el recocido simulado (Simulated Annaeling) y la
selección basada en algoritmos genéticos, siendo esta última una de las más
eficientes en el campo de modelación REA (85).
En el pasado, algunos enfoques estaban directamente relacionados con las
Redes Neuronales Artificiales, como son: división de los pesos (86), correlación en
cascada (87), mapas de Kohonen (88), determinación de la relevancia automática
(89), etc. También han sido presentados en la literatura especializada los Sistemas
Artificiales de Colonias de Hormigas y Enjambres (90). También ha sido evaluada
la eficiencia de algunos algoritmos de poda (91).
En resumen, existe una amplia variedad de descriptores moleculares y
métricas usadas en los métodos de similitud molecular; parece ser, sin embargo,
que el mejor rendimiento se logra adaptando dicha combinación al problema
estudiado (92).
Una fuente excelente que aborda el tema de la selección de rasgos en el
contexto del Aprendizaje Automático lo constituye la revisión de Guyon y Elisseeff
(93). Un buen número de estas técnicas aparecen implementadas en el software de
aprendizaje automático y minería de datos Weka (94), que también puede usarse
para la modelización QSAR. Este producto es uno de los más populares en el área
del Aprendizaje Automático, es de código abierto y se encuentra disponible
gratuitamente (95).