共計 814 個字符,預計需要花費 3 分鐘才能閱讀完成。
在 Python 中,我們可以使用 BeautifulSoup 庫來解析 HTML 文檔并獲取標簽的屬性值。
首先,我們需要安裝 BeautifulSoup 庫。可以使用以下命令在終端中安裝 BeautifulSoup 庫:
pip install beautifulsoup4
然后,我們可以使用以下代碼來獲取標簽的屬性值:
from bs4 import BeautifulSoup
# 創建 BeautifulSoup 對象
html = """
<html>
<head>
<title> 標題 </title>
</head>
<body>
<a href="https://www.example.com"> 鏈接 </a>
<img src="image.jpg" alt=" 圖片 ">
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
# 獲取 a 標簽的 href 屬性值
a_tag = soup.find('a')
href = a_tag.get('href')
print(href)
# 獲取 img 標簽的 src 和 alt 屬性值
img_tag = soup.find('img')
src = img_tag.get('src')
alt = img_tag.get('alt')
print(src, alt)
運行以上代碼會輸出以下結果:
https://www.example.com
image.jpg 圖片
可以看到,我們首先創建了一個 BeautifulSoup 對象來解析 HTML 文檔。然后,使用 find 方法找到對應的標簽。最后,使用 get 方法獲取標簽的屬性值。
注意:如果標簽不存在該屬性,get 方法會返回 None。如果想要獲取不存在屬性時的默認值,可以使用 get 方法的第二個參數,例如:get('alt', '默認值')
。
丸趣 TV 網 – 提供最優質的資源集合!
正文完