유사도(similarity) : 두 벡터가 존재할 때, 두 벡터의 사잇각을 ‘유사도’라고 한다.
$$ \text{similarity}=cos\theta= \frac{\bold{x}\cdot\bold{y}}{||\bold{x}||~||\bold{y}||} $$
함수
import numpy as np
def cos_similarity(v1,v2):
dop_product = np.dot(v1,v2)
l2_norm = (np.sqrt(sum(np.square(v1))) * (np.sqrt(sum(np.square(v2)))
similarity = dot_product / l2_norm
return similarity
scikit-learn