共計 959 個字符,預計需要花費 3 分鐘才能閱讀完成。
丸趣 TV 小編給大家分享一下如何利用 HanLP 計算中文詞語語義相似度,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
在 java 項目中配置 HanLP 推薦使用 Maven 方法
在 poem.xml 中加入以下代碼
dependency
groupId com.hankcs /groupId
artifactId hanlp /artifactId
version portable-1.3.3 /version /dependency
但是在 AndroidStudio 中,沒有 Maven,所以在 build.gradle 的 dependencies 中加入如下代碼
compile com.hankcs:hanlp:portable-1.3.3
還可以下載 jar 包和 data 包,使用 hanlp.properties 進行手動配置
在 IntelliJ IDEA 中進入 file – project structure,在 Libraries 中添加 jar 包
更改 hanlp.properties 中的首行,指向 data 包所在的位置
將 hanlp.properties 放在 out – production – name 目錄下
調用 HanLP
import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;
只需要以上語句便可以使用 HanLP
// 使用 hanlp 計算語義距離 double[] numarray = new double[title_list.size()]; for (int i = 0; i results.size(); i++) { for (int j = 0; j title_list.size(); j++) { numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());
}
}
以上是“如何利用 HanLP 計算中文詞語語義相似度”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注丸趣 TV 行業資訊頻道!
正文完