Óscar Miguel Rivera Borroto & col.
546
3.2.4. Medidas de similitud
El concepto de similitud es fundamental para varios aspectos del
razonamiento y análisis químicos, de hecho, es tal vez la premisa fundamental de la
química médica, y cae bajo la rúbrica general de análisis de similitud molecular. La
determinación de la similitud de un "objeto molecular" con otro es básicamente un
ejercicio de comparación de patrones químicos.
El resultado de este ejercicio es un valor,
la medida de similitud
, que
caracteriza el grado de concordancia, de asociación, proximidad, semejanza,
alineamiento, porcentaje de identidad o similitud entre pares de moléculas
manifestada por sus “patrones moleculares”, que se componen de conjuntos de
rasgos. La terminología de “proximidad” a veces se utiliza en un sentido más
general para referirse a la similitud, disimilitud, o la distancia entre los pares de
moléculas. Las medidas de similitud son funciones que hacen corresponder pares
de representaciones moleculares de la misma forma matemática con números
reales que usualmente, pero no siempre, yacen en el intervalo unitario [0,1] (61).
La similitud es generalmente considerada como una propiedad simétrica, es decir,
“A” es tan similar a “B” como “B” a “A”, y la mayoría de los estudios se basan en esta
propiedad. Tversky (96), sin embargo, ha argumentado persuasivamente que
ciertas similitudes son inherentemente asimétricas.
Aunque su trabajo se orientó hacia la psicología, este tiene aplicabilidad
además en los estudios de similitud molecular (97). Por otra parte, cuando se
aplican los conceptos de similitud y diversidad en química, es necesario definir
similitudes globales y locales; las similitudes locales se centran en parte en un
objeto (átomo, grupo funcional, las cadenas de proteínas, cadena de ADN, etc.),
mientras que las similitudes globales la semejanza se mide entre dos objetos
enteros (moléculas, proteínas, etc.) (98).
Consideremos dos objetos químicos arbitrarios A y B descritos mediante
vectores
X
e
Y
, respectivamente, de
n
atributos, de modo que
=
(
!
,
!
,
!
, … ,
!
)
.e
= (
!
,
!
,
!
, … ,
!
)
. En la Tabla 2 se muestra un grupo de
medidas de (di)similitud de amplio uso en quimioinformática extraídas de la
revisión de Ellis et al (99). Otro trabajo de revisión excelente sobre medidas de
similitud puede encontrarse en (100).