Perspectiva general sobre el proceso de desarrollo de fármacos…
547
Tabla 2.-‐
Algunas de las medidas de proximidad más usadas en la búsqueda de similitud
Medida
Fór ula
a
Tipo
b
Manhattan Media
!"
=
!
−
!
!!!!
D
Euclidiana Media
!"
=
!
−
! !
!!!!
D
Bray/Curtis
!"
=
!
−
!
!!!! !
+
!
!!!!
D
Tan
!"
=
! !
!!!!
! !
!!!!
+
! !
!!!!
−
! !
!!!!
A
Dice
!"
= 2
! !
!!!! ! !
!!!!
+
! !
!!!!
A
Sokal/Sneath(1)
1
!"
=
! !
!!!!
2
! !
!!!!
+ 2
! !
!!!!
− 3
! !
!!!!
A
Cosine/Ochiai
!"
=
! !
!!!!
! !
!!!!
! !
!!!!
A
Pearson
!"
=
!
−
!
−
!!!!
!
−
!
!!!!
!
−
!
!!!!
C
a
xj
(
y
j
) representa el valor del descriptor del vector
X
(A) e
Y
(B) en el atributo
j
;
b
Clasificación de las
medidas de proximidad acorde a su naturaleza de definición. D, coeficientes de distancia: están
basados en la suma de diferencias, sus valores varían en proporción inversa con el grado de
similitud; A, coeficientes de asociación: se basan en el producto interno, y sus valores varían en
proporción directa con el grado de similitud, por lo que una mayor similitud se indica por el
aumento de los valores; C, coeficientes de correlación: Los coeficientes de correlación se basan en
una tercera función más compleja: la suma de los productos de la diferencias entre cada valor-‐
atributo y la media de todos los valores de los atributos de cada uno de los dos vectores. Los valores
de estos por lo general varían de 1 (lo que indica que cualquier cambio en los atributos de un objeto
sería acompañado por un cambio idéntico en los atributos del otro) a -‐1 (que indica que un cambio
en uno y sería acompañado por un cambio igual y opuesto en el otro).