共計 524 個字符,預計需要花費 2 分鐘才能閱讀完成。
Python 有許多庫可以用來進行自然語言處理,其中最流行的包括 NLTK(Natural Language Toolkit)、spaCy、TextBlob 等。以下是一個簡單的示例,演示如何使用 NLTK 庫進行自然語言處理:
- 安裝 NLTK 庫
pip install nltk
- 導入 NLTK 庫并下載必要的數據
import nltk
nltk.download('punkt')
nltk.download('averaged_perceptron_tagger')
- 分詞
from nltk.tokenize import word_tokenize
text = "This is a sample text for tokenization."
tokens = word_tokenize(text)
print(tokens)
- 詞性標注
from nltk import pos_tag
tagged_tokens = pos_tag(tokens)
print(tagged_tokens)
通過以上步驟,您可以使用 NLTK 庫進行分詞、詞性標注等自然語言處理任務。您還可以使用其他庫如 spaCy、TextBlob 等來完成更多復雜的自然語言處理任務。
丸趣 TV 網 – 提供最優質的資源集合!
正文完