久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

Python怎么計算字符串相似度

148次閱讀
沒有評論

共計 894 個字符,預計需要花費 3 分鐘才能閱讀完成。

計算字符串相似度可以使用一些算法,常用的算法包括編輯距離算法(Levenshtein Distance)、Jaccard 相似度等。

以下是使用編輯距離算法計算字符串相似度的示例代碼:

def levenshtein_distance(s1, s2):
    if len(s1) < len(s2):
        return levenshtein_distance(s2, s1)

    if len(s2) == 0:
        return len(s1)

    previous_row = range(len(s2) + 1)
    for i, c1 in enumerate(s1):
        current_row = [i + 1]
        for j, c2 in enumerate(s2):
            insertions = previous_row[j + 1] + 1
            deletions = current_row[j] + 1
            substitutions = previous_row[j] + (c1 != c2)
            current_row.append(min(insertions, deletions, substitutions))
        previous_row = current_row

    return previous_row[-1]

def similarity(s1, s2):
    max_length = max(len(s1), len(s2))
    distance = levenshtein_distance(s1, s2)
    similarity = 1 - distance / max_length
    return similarity

s1 = "hello"
s2 = "hallo"
similarity_score = similarity(s1, s2)
print(f"The similarity score between '{s1}' and '{s2}' is {similarity_score}")

這段代碼會計算字符串“hello”和“hallo”之間的相似度,輸出結果為:

The similarity score between 'hello' and 'hallo' is 0.8

你可以根據需要修改代碼來計算其他字符串的相似度。

丸趣 TV 網 – 提供最優質的資源集合!

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2024-04-16發表,共計894字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 剑河县| 长白| 五大连池市| 简阳市| 无为县| 荔浦县| 昌平区| 洪湖市| 温宿县| 荔波县| 佳木斯市| 博兴县| 沾化县| 同仁县| 搜索| 宜都市| 巴马| 乳山市| 东乌| 丹东市| 通道| 闸北区| 富源县| 延吉市| 和政县| 琼结县| 金湖县| 阿拉善右旗| 黄平县| 百色市| 彩票| 平山县| 依兰县| 城市| 庆城县| 武宣县| 河南省| 阿合奇县| 济阳县| 广平县| 谢通门县|