Óscar Miguel Rivera Borroto & col.
538
aleatoria, además que evitan el malgasto de recursos computacionales y de tiempo
(28).
Un enfoque más exacto de los métodos de cribado virtual consiste en la
construcción de un modelo que correlacione la estructura de las moléculas con sus
respectivas actividades biológicas a partir de un grupo de moléculas previamente
evaluadas. Este problema se conoce como la modelización de la relación
estructura-‐actividad (REA) más comúnmente conocido por sus siglas en inglés
QSAR, acrónimo de Quantitative Structure-‐Activity Relationship, e involucra
métodos de los campos de la Estadística y el Aprendizaje Automático (29, 30). La
utilidad práctica de este enfoque se ha constatado, por ejemplo, en estudios de
identificación de nuevas entidades anti protozoarias (
Trichomona vaginalis
)
mediante la técnica estadística Análisis Discriminante Lineal usando descriptores
moleculares definidos por el Prof. Dr. Yovani Marrero Ponce (31-‐33). Este enfoque
también se ha aplicado en el descubrimiento de fármacos frente a la
enfermedad de
Chagas
(34). Algunos de los algoritmos más populares en el área de la minería de
datos pueden estudiarse en (35).
3. GENERALIDADES DE LA SIMILITUD MOLECULAR
El concepto de similitud ha ganado un espacio cada vez más importante en
la quimioinformática debido fundamentalmente al
principio de similitud
, el cual
plantea que
moléculas con estructuras similares tienden a exhibir propiedades
similares
(36). Este principio parece ser una adaptación de un proceso que, según
algunos autores, es el reflejo directo del núcleo del sistema cognitivo humano, el
razonamiento por analogía
(37), y ha sido apoyado por un buen número de
resultados experimentales [ver por ejemplo referencia (38)]. Sin embargo, otros
hallazgos han sugerido que
eventualmente
moléculas estructuralmente similares
exhiben comportamientos disimilares, así como moléculas estructuralmente
disimilares exhiben comportamientos similares (39). Para sistematizar este cuerpo
de evidencias algunos autores han propuesto, en el contexto del diseño de
fármacos, un cuadro (
matriz de confusión
) de cuatro
hipótesis bayesianas
, i.e., i-‐)
moléculas estructuralmente similares es muy plausible que tengan actividades
similares
, ii-‐)
moléculas estructuralmente similares es plausible que tengan
actividades disimilares
, iii-‐)
moléculas estructuralmente disimilares es plausible que
tengan actividades similares
, iv-‐)
moléculas estructuralmente disimilares es muy
plausible que tengan actividades disimilares
(40). Las hipótesis i-‐) y iv-‐) conforman
la lógica de base para técnicas como la búsqueda de similitud y los algoritmos de
agrupamiento para la selección de compuestos intra clúster (41, 42). La hipótesis
ii-‐) conforma la lógica de base de un grupo de técnicas novedosas para el análisis y
visualización de los
acantilados de actividad
y una de sus aplicaciones potenciales
es la identificación de pequeños cambios moleculares responsables de un cambio