锟斤拷锟斤拷位锟矫ｏ拷锟斤拷页 > 锟斤拷锟斤拷锟教筹拷 > 锟教筹拷 > Xpath锟斤拷锟斤拷锟斤拷锟斤拷锟斤法

Xpath锟斤拷锟斤拷锟斤拷锟斤拷锟斤法

锟斤拷源锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷|锟斤拷时锟戒：2024-12-04 10:15:46 |锟斤拷锟侥讹拷锟斤拷185锟斤拷|锟斤拷锟斤拷签锟斤拷 a T XP 锟斤拷 |锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷

锟斤拷锟斤拷锟斤拷戏

XPath锟斤拷锟斤拷 XPath(XML Path Language)锟斤拷一锟斤拷锟斤拷锟斤拷锟斤拷XML锟斤拷HTML锟侥碉拷锟叫诧拷锟斤拷锟斤拷息锟斤拷锟斤拷锟斤拷,锟斤拷通锟斤拷路锟斤拷锟斤拷锟斤拷式锟斤拷锟斤拷位锟节碉拷,锟斤拷锟皆猴拷锟侥憋拷锟斤拷锟斤拷,锟斤拷支锟街革拷锟接诧拷询锟斤拷锟斤拷,XPath 锟斤拷锟斤拷锟斤拷 Web 抓取锟斤拷锟斤拷锟斤拷 Scrapy,Selenium 锟饺的猴拷锟侥硷拷锟斤拷之一 XPath 锟斤拷锟斤拷锟侥伙拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷

XPath锟斤拷锟斤拷

XPath(XML Path Language)锟斤拷一锟斤拷锟斤拷锟斤拷锟斤拷XML锟斤拷HTML锟侥碉拷锟叫诧拷锟斤拷锟斤拷息锟斤拷锟斤拷锟斤拷,锟斤拷通锟斤拷路锟斤拷锟斤拷锟斤拷式锟斤拷锟斤拷位锟节碉拷,锟斤拷锟皆猴拷锟侥憋拷锟斤拷锟斤拷,锟斤拷支锟街革拷锟接诧拷询锟斤拷锟斤拷,XPath 锟斤拷锟斤拷锟斤拷 Web 抓取锟斤拷锟斤拷锟斤拷 Scrapy,Selenium 锟饺的猴拷锟侥硷拷锟斤拷之一

XPath 锟斤拷锟斤拷锟侥伙拷锟斤拷锟斤拷锟斤拷

锟斤拷锟斤拷lxml.etree
```
from lxml import etree
```
使锟斤拷etree.parse(filename, parser=None)锟斤拷锟斤拷锟斤拷锟斤拷一锟斤拷锟斤拷锟轿结构
- etree.parse() 锟斤拷锟节斤拷锟斤拷锟斤拷锟斤拷XML锟斤拷HTML锟侥硷拷,锟斤拷锟斤拷锟斤拷转锟斤拷为一锟斤拷锟斤拷锟轿结构锟斤拷 ElementTree 锟斤拷锟斤拷,锟斤拷锟斤拷通锟斤拷锟矫讹拷锟斤拷锟斤拷锟斤拷牡锟斤拷母锟斤拷锟斤拷诘锟�
- filename :要锟斤拷锟斤拷锟斤拷锟侥硷拷路锟斤拷
- parser (锟斤拷选):默锟斤拷锟斤拷锟斤拷锟�,parser()锟斤拷锟斤拷锟斤拷募锟斤拷锟秸癸拷锟斤拷远锟窖★拷锟斤拷锟绞的斤拷锟斤拷锟斤拷,锟斤拷 .xml 锟侥硷拷使锟斤拷XML锟斤拷锟斤拷锟斤拷,.html使锟斤拷HTML锟斤拷锟斤拷锟斤拷
使锟斤拷etree.HTML(html_string, parser=None)锟斤拷锟斤拷锟斤拷锟斤拷html锟街凤拷锟斤拷
- html_string :要锟斤拷锟斤拷锟斤拷HTML锟街凤拷锟斤拷
- parser :(锟斤拷选):默锟斤拷锟斤拷锟斤拷锟� etree.HTML() 使锟斤拷 etree.HTMLparser() 锟斤拷锟叫斤拷锟斤拷
- 锟斤拷锟斤拷值 :etree.HTML()锟斤拷锟斤拷一锟斤拷 ELement 锟斤拷锟斤拷,锟斤拷示HTML锟侥碉拷锟斤拷 锟斤拷元锟斤拷 ,锟斤拷锟斤拷通锟斤拷锟矫讹拷锟斤拷锟斤拷锟斤拷牡锟斤拷锟斤拷锟斤拷诘锟�
使锟斤拷.xpath(xpath_expression)锟斤拷锟窖撅拷锟斤拷锟斤拷锟矫碉拷HTML锟侥碉拷锟斤拷执锟斤拷XPath锟斤拷询
```
result = html_tree.xpath(xpath_expression)
```
- xpath_expression :XPath锟斤拷锟斤拷式,锟斤拷锟斤拷锟斤拷锟侥碉拷锟叫诧拷锟揭节碉拷,XPath锟斤拷锟斤拷式锟斤拷锟斤拷锟角撅拷锟斤拷路锟斤拷锟斤拷锟斤拷锟铰凤拷锟�,也锟斤拷锟皆帮拷锟斤拷谓锟斤拷,锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟�,锟斤拷要锟斤拷XPath锟斤法锟斤拷锟斤拷锟秸癸拷锟斤拷锟斤拷锟�
- html_tree :锟斤拷锟斤拷锟斤拷 ElementTree 锟斤拷锟斤拷(锟斤拷 etree.parse() 锟斤拷锟斤拷)锟斤拷 Element 锟斤拷锟斤拷(锟斤拷 etree.HTML() 锟斤拷锟斤拷)

from lxml import etree

# 使锟斤拷etree.parser()锟斤拷锟斤拷锟侥硷拷路锟斤拷
parser = etree.HTMLParser(encoding='utf-8')  # 锟斤拷utf8锟斤拷锟叫憋拷锟斤拷
tree = etree.parse('../Learning02/锟斤拷锟斤拷锟斤拷锟斤拷.html', parser=parser)
print(tree)
#output-> 

# 使锟斤拷etree.HTML()锟斤拷锟斤拷锟斤拷锟斤拷锟侥硷拷锟斤拷锟斤拷锟界动态HTML
# 锟斤拷取锟侥硷拷 锟斤拷锟斤拷为锟街凤拷锟斤拷
file = open('../Learning02/锟斤拷锟斤拷锟斤拷锟斤拷.html', 'r', encoding='utf-8')
data = file.read()
root = etree.HTML(data)
print(root)

#锟斤拷锟斤拷
root = etree.HTML(open('../Learning02/锟斤拷锟斤拷锟斤拷锟斤拷.html', 'r', encoding='utf-8').read())
print(root)
#output->

XPath锟斤法

XPath 锟斤法锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷XML锟斤拷HTML锟侥碉拷锟叫诧拷锟斤拷锟斤拷息锟斤拷锟斤拷锟斤拷

路锟斤拷锟斤拷锟斤拷式

XPath使锟斤拷路锟斤拷锟斤拷锟斤拷式锟斤拷锟斤拷位锟侥碉拷锟叫的节碉拷,路锟斤拷也锟斤拷锟皆凤拷为锟斤拷锟斤拷路锟斤拷锟斤拷锟斤拷锟铰凤拷锟�

锟斤拷锟斤拷路锟斤拷

/ :锟斤拷示锟接革拷锟节点开始选锟斤拷,锟斤拷锟斤拷锟节讹拷锟斤拷一锟斤拷锟斤拷锟斤拷路锟斤拷

锟接革拷锟节碉拷html锟斤拷始锟斤拷锟揭碉拷head,锟劫达拷head锟斤拷锟揭筹拷title锟斤拷签

root = etree.HTML(open('../Learning02/锟斤拷锟斤拷锟斤拷锟斤拷.html', 'r', encoding='utf-8').read())
all_titles = root.xpath('/html/head/title')
for title in all_titles:
    print(etree.tostring(title, encoding='utf-8').decode('utf-8'))
#output-> 锟斤拷锟斤拷锟斤拷锟斤拷锟藉》全锟斤拷锟斤拷锟斤拷锟侥讹拷_史锟斤拷浼甠诗锟斤拷锟斤拷锟斤拷锟斤拷

锟斤拷锟铰凤拷锟�

锟斤拷锟斤拷锟斤拷锟斤拷路锟斤拷,锟斤拷锟铰凤拷锟绞癸拷锟斤拷矢锟斤拷锟�,锟斤拷锟斤拷锟斤拷

// :锟斤拷示锟斤拷 锟斤拷前锟节点开始, 选锟斤拷锟侥碉拷锟斤拷 锟斤拷锟叫凤拷锟斤拷锟斤拷锟斤拷锟侥节碉拷, 锟斤拷锟揭诧拷锟斤拷锟斤拷锟斤拷锟角碉拷位锟斤拷

root = etree.HTML(open('../Learning02/锟斤拷锟斤拷锟斤拷锟斤拷.html', 'r', encoding='utf-8').read())
all_a = root.xpath('//a')
for a in all_a:
    print(a.text)
#None
#锟斤拷页
#锟斤拷锟斤拷
#锟斤拷锟斤拷
#...

锟斤拷前锟节碉拷

./ :锟斤拷示锟斤拷前锟节碉拷,通锟斤拷锟斤拷锟斤拷指锟斤拷锟斤拷前锟节点本锟斤拷,锟斤拷锟斤拷锟斤拷锟�

all_a = root.xpath('//a')
print(all_a[1].xpath('./text()')) #./锟斤拷示锟斤拷前锟斤拷a锟斤拷签
#output-> ['锟斤拷页']

选锟斤拷锟斤拷锟斤拷

@ :锟斤拷锟斤拷选锟斤拷元锟截碉拷锟斤拷锟斤拷,锟斤拷锟斤拷锟斤拷元锟截憋拷锟斤拷

# 使锟斤拷 @ 选锟斤拷  锟斤拷签锟斤拷 href 锟斤拷锟斤拷
all_hrefs = root.xpath('//a[@href]')
for hrefs in all_hrefs:
    print(etree.tostring(hrefs, encoding='unicode'))

XPath谓锟斤拷

谓锟斤拷锟斤拷 xpath 锟斤拷锟斤拷锟节斤拷一锟斤拷筛选锟节碉拷谋锟斤拷锟绞�,通锟斤拷锟斤拷锟节凤拷锟斤拷锟斤拷 [] 锟斤拷,锟斤拷锟斤拷曰锟斤拷诮诘锟斤拷位锟斤拷,锟斤拷锟斤拷值,锟侥憋拷锟斤拷锟捷伙拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷 选锟斤拷锟截讹拷锟侥节碉拷,谓锟斤拷锟斤拷锟角讹拷锟绞癸拷锟�,也锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷谓锟斤拷锟斤拷锟绞癸拷锟�

锟斤拷锟斤拷锟斤法
```
//element[condition]
```
- element :要选锟斤拷锟皆拷锟�
- condition :谓锟斤拷锟叫碉拷锟斤拷锟斤拷,锟斤拷锟节斤拷一锟斤拷筛选锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷元锟斤拷

位锟斤拷谓锟斤拷

位锟斤拷谓锟斤拷锟斤拷锟节革拷锟捷节碉拷锟斤拷锟街弟节碉拷锟叫碉拷位锟矫斤拷锟斤拷选锟斤拷,锟斤拷锟斤拷使锟斤拷 position() 锟斤拷直锟斤拷指锟斤拷位锟矫憋拷锟�

锟斤拷取锟斤拷一锟斤拷 ul 锟斤拷签锟叫的碉拷一锟斤拷 li 锟斤拷签

#//ul锟斤拷取锟斤拷锟斤拷锟斤拷锟斤拷ul,[0]选锟斤拷锟揭伙拷锟� lis = root.xpath('//ul')[0].xpath('./li[1]') for li in lis: print(etree.tostring(li, encoding='unicode')) #output->锟斤拷页

使锟斤拷 last() 锟斤拷取锟斤拷锟斤拷一锟斤拷锟节碉拷,锟酵碉拷锟斤拷锟节讹拷锟斤拷锟节碉拷

# 锟斤拷一锟斤拷
last_li = root.xpath('//ul')[0].xpath('./li[last()]')
print(etree.tostring(last_li[0], encoding='unicode'))
# 锟斤拷锟斤拷锟斤拷
last_second_li = root.xpath('//ul')[0].xpath('./li[last()-1]')
print(etree.tostring(last_second_li[0], encoding='unicode'))
#output-> 锟斤拷卓锟斤拷锟斤拷
#锟脚硷拷

使锟斤拷 position() 锟斤拷取位锟矫斤拷锟斤拷筛选

# 锟斤拷取前锟斤拷锟斤拷li锟斤拷签
last_li = root.xpath('//ul')[0].xpath('./li[position()<3]')
for li in last_li:
    print(etree.tostring(li, encoding='unicode'))
# 锟斤拷取偶锟斤拷位锟斤拷签
lis = root.xpath('//ul')[0].xpath('./li[position() mod 2=0]')
for li in lis:
    print(etree.tostring(li, encoding='unicode'))

锟斤拷锟斤拷谓锟斤拷

锟斤拷锟斤拷谓锟斤拷锟斤拷锟斤拷 选锟斤拷锟斤拷锟斤拷囟锟斤拷锟斤拷缘慕诘锟�
- 使锟斤拷 @attribute 锟斤拷锟斤拷取锟斤拷锟斤拷锟斤拷锟斤拷,锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟缴秆�
```
# 选取锟斤拷锟叫撅拷锟斤拷 href 锟斤拷锟皆碉拷 a 元锟斤拷
hrefs = root.xpath("//a[@href]")
for href in hrefs:
    print(etree.tostring(href, encoding='unicode'))
```
- 锟斤拷锟斤拷 class 锟斤拷锟斤拷值
```
all_class = root.xpath('//@class')
print(all_class)
```

锟斤拷锟轿斤拷锟�

锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷一锟斤拷,使锟斤拷锟竭硷拷锟斤拷锟斤拷锟� and,or 锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟接碉拷谓锟斤拷

#选取href锟斤拷锟斤拷值为https://example.com锟斤拷class锟斤拷锟斤拷值为link锟斤拷a元锟斤拷
//a[@href='https://example.com' and @class='link']

#选取href锟斤拷锟斤拷值为https://example.com锟斤拷https://another.com锟斤拷a 元锟斤拷
//a[@href='https://example.com' or @href='https://another.com']

锟斤拷锟斤拷谓锟斤拷

Xpath锟结供锟斤拷锟斤拷锟斤拷锟斤拷锟矫猴拷锟斤拷,锟斤拷应锟皆革拷锟斤拷锟接碉拷筛选锟斤拷锟斤拷
- contains((string1, string2) 锟斤拷锟斤拷:
  - string1 :要锟斤拷锟斤拷锟斤拷锟街凤拷锟斤拷
  - string2 :要锟斤拷锟揭碉拷锟街凤拷锟斤拷
```
# 选取class锟斤拷锟斤拷"book"锟斤拷img锟斤拷签
images = root.xpath('//img[contains(@src,"book")]')
for image in images:
    print(etree.tostring(image, encoding='unicode'))
```
- starts-with(string1, string2) 锟斤拷锟斤拷:
  
  锟斤拷锟揭伙拷锟斤拷址锟斤拷锟斤拷欠锟斤拷锟街革拷锟斤拷址锟斤拷锟角白猴拷锟绞�,锟角凤拷锟斤拷 true ,锟今返伙拷 false
  - string1: 要锟斤拷锟斤拷锟街凤拷锟斤拷
  - string2: 锟斤拷为前缀锟斤拷锟街凤拷锟斤拷
```
# 选取锟斤拷锟斤拷href锟斤拷https://锟斤拷头锟斤拷a锟斤拷签
all_a = root.xpath('//a[starts-with(@href,"https:")]')
for a in all_a:
    print(etree.tostring(a, encoding='unicode'))
```
锟侥憋拷锟斤拷锟斤拷谓锟斤拷

锟斤拷锟斤拷选锟斤拷锟斤拷锟斤拷囟锟斤拷谋锟斤拷锟斤拷莸慕诘锟�,锟斤拷锟斤拷使锟斤拷 text() 锟斤拷锟斤拷锟斤拷锟斤拷取锟节碉拷锟斤拷谋锟斤拷锟斤拷锟�
```
# 选锟斤拷使锟矫帮拷锟斤拷"锟斤拷锟斤拷"锟侥憋拷锟斤拷p锟斤拷签
paragraphs = root.xpath('//p[contains(text(),"锟斤拷锟斤拷")]')
for p in paragraphs:
    print(etree.tostring(p, encoding='unicode'))
```

通锟斤拷锟�

xpath锟结供锟剿讹拷锟斤拷通锟斤拷锟�,锟斤拷锟斤拷锟斤拷路锟斤拷锟斤拷锟斤拷式锟斤拷匹锟斤拷未知锟斤拷元锟斤拷,锟斤拷锟斤拷,锟斤拷锟轿何节碉拷.锟斤拷些通锟斤拷锟斤拷浅锟斤拷锟斤拷锟�,锟斤拷锟斤拷锟角碉拷锟斤拷确锟斤拷锟斤拷锟斤拷诘锟斤拷锟斤拷坪徒峁癸拷锟斤拷锟斤拷锟斤拷

通锟斤拷锟�	锟斤拷锟斤拷
*	匹锟斤拷锟轿猴拷元锟截节点。一锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟絚opy xpath锟斤拷锟斤拷锟�
@*	匹锟斤拷锟轿猴拷锟斤拷锟皆节点。
node()	匹锟斤拷锟轿猴拷锟斤拷锟酵的节点。

使锟斤拷 `*` 匹锟斤拷锟轿猴拷元锟截节碉拷

* 锟斤拷锟筋常锟矫碉拷通锟斤拷锟街�,锟斤拷锟斤拷锟狡ワ拷锟斤拷魏锟皆拷锟�,锟斤拷锟斤拷锟斤拷要锟斤拷锟斤拷锟角╋拷锟�.锟斤拷锟节诧拷确锟斤拷元锟斤拷锟斤拷锟狡伙拷希锟斤拷选锟斤拷锟斤拷锟斤拷锟斤拷锟酵碉拷元锟斤拷时锟角筹拷锟斤拷锟斤拷

# 选锟斤拷锟斤拷锟斤拷 div 锟铰碉拷锟斤拷锟斤拷锟斤拷元锟斤拷
divs = root.xpath("//div/*")
for div in divs:
    print(etree.tostring(div, encoding='unicode'))

使锟斤拷 `@*` 匹锟斤拷锟轿猴拷锟斤拷锟皆节碉拷

@* 锟斤拷锟斤拷匹锟斤拷锟轿猴拷锟斤拷锟皆节碉拷,锟斤拷锟斤拷锟斤拷指锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷,锟斤拷锟姐不确锟斤拷锟斤拷锟斤拷锟斤拷锟狡伙拷希锟斤拷选锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷时锟角筹拷锟斤拷锟斤拷

# 选锟斤拷锟斤拷锟斤拷 a 元锟截碉拷锟斤拷锟斤拷锟斤拷锟斤拷
all_a = root.xpath('//a/@*')
for a in all_a:
    print(a)

使锟斤拷 `node()` 匹锟斤拷锟轿猴拷锟斤拷锟酵的节碉拷

node() 锟斤拷一锟斤拷锟斤拷通锟矫碉拷通锟斤拷锟�,锟斤拷锟斤拷匹锟斤拷锟轿猴拷锟斤拷锟酵节碉拷,锟斤拷锟斤拷元锟截节碉拷,锟侥憋拷锟节碉拷,锟斤拷锟皆节碉拷,注锟酵节碉拷鹊锟�,锟斤拷锟斤拷锟斤拷要选锟今不斤拷锟斤拷锟斤拷元锟截节碉拷锟斤拷十锟斤拷锟斤拷锟斤拷

# 选锟斤拷锟斤拷锟斤拷 ul 锟铰碉拷锟斤拷锟斤拷锟接节碉拷(锟斤拷锟斤拷锟侥憋拷锟节碉拷)
nodes = root.xpath('//ul/node()')
print(nodes)
#output-> ['\n ', , '\n,...]

XPath,re锟斤拷锟斤拷,BeautifulSoup锟皆憋拷

锟斤拷之前锟斤拷学习锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷学习锟斤拷re锟斤拷锟斤拷锟斤拷锟绞�,锟斤拷锟窖帮拷烁锟斤拷颖锟捷碉拷bs4,锟斤拷为锟轿伙拷要学习XPath锟斤拷锟斤拷锟斤拷,锟斤拷锟斤拷锟斤拷锟斤拷锟角斤拷锟斤拷锟角碉拷锟脚碉拷锟斤拷锟斤拷贸锟斤拷锟斤拷锟斤拷卸员锟窖�

锟斤拷锟斤拷	锟脚碉拷	缺锟斤拷	锟斤拷锟矫筹拷锟斤拷
`XPath`	强锟斤拷锟铰凤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟街э拷植慵讹拷峁癸拷锟斤拷锟斤拷锟斤拷锟窖�	学习锟斤拷锟竭较讹拷锟斤拷锟皆诧拷锟芥范 HTML 锟捷达拷锟皆较诧拷	锟结构锟斤拷锟斤拷锟矫碉拷 XML/HTML锟斤拷锟斤拷锟接诧拷询
`re`	锟斤拷锟斤拷愿撸锟斤拷屎洗锟斤拷锟斤拷锟斤拷谋锟斤拷械锟侥Ｊ狡ワ拷锟�	锟斤拷锟绞合斤拷锟斤拷 HTML/XML锟斤拷锟缴讹拷锟皆诧拷	锟接达拷锟侥憋拷锟斤拷锟斤拷取锟截讹拷模式锟斤拷锟斤拷锟斤拷
`BeautifulSoup`	锟斤拷锟斤拷使锟矫ｏ拷锟捷达拷锟斤拷强锟斤拷锟绞合筹拷学锟斤拷	锟斤拷锟斤拷锟皆低ｏ拷锟斤拷锟斤拷锟斤拷锟斤拷	锟斤拷锟芥范锟斤拷 HTML锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷取锟斤拷锟斤拷页抓取

锟杰斤拷
- 锟斤拷锟斤拷要锟斤拷锟斤拷锟结构锟斤拷锟矫碉拷XML锟斤拷HTML锟侥碉拷,锟斤拷锟斤拷要锟斤拷锟叫革拷锟接诧拷询 ,锟斤拷么XPath锟斤拷锟斤拷锟斤拷锟斤拷锟窖★拷锟�
- 锟斤拷锟斤拷要锟接达拷锟侥憋拷锟斤拷锟斤拷取锟截讹拷模式锟斤拷锟斤拷锟斤拷时 ,锟斤拷锟斤拷锟街撅拷锟斤拷锟饺★拷锟斤拷锟�,IP锟斤拷址锟斤拷,re锟斤拷锟斤拷锟斤拷锟绞斤拷锟斤拷锟斤拷选锟斤拷
- 锟斤拷要锟斤拷锟斤拷锟斤拷锟芥范锟斤拷 HTML 锟斤拷锟斤拷只锟斤拷要锟斤拷锟叫简单碉拷锟斤拷锟斤拷锟斤拷取, BeautifulSoup 锟斤拷锟斤拷锟窖好碉拷选锟斤拷

小锟斤拷锟狡硷拷锟侥讹拷

锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟侥斤拷为锟斤拷锟斤拷锟斤拷息锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷同锟斤拷锟睫观碉拷锟街な碉拷锟斤拷锟斤拷锟斤拷锟�

a 1.0: 锟斤拷锟酵ｏ拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷营状态锟斤拷锟斤拷式锟斤拷营锟斤拷锟斤拷锟斤拷锟皆ｏ拷锟斤拷锟斤拷锟斤拷锟斤拷; 锟斤拷戏锟斤拷锟斤拷

锟斤拷戏锟斤拷锟�

锟斤拷戏锟斤拷频

锟斤拷戏锟斤拷锟斤拷

锟斤拷戏锟筋动; 锟斤拷alittletotheleft锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷一锟筋备锟杰伙拷迎锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷戏锟斤拷锟斤拷业锟斤拷锟斤拷锟斤拷嵌锟斤拷粘锟斤拷锟斤拷锟斤拷械母锟斤拷锟斤拷锟斤拷锟斤拷锟�

锟斤拷页

锟斤拷锟斤拷戏

锟斤拷戏锟斤拷

锟斤拷锟斤拷锟�

锟斤拷锟斤拷锟�

锟斤拷锟斤拷锟斤拷

锟斤拷锟斤拷锟斤拷锟叫帮拷

锟斤拷锟斤拷锟斤拷锟斤拷

锟斤拷戏锟斤拷锟斤拷

锟斤拷锟斤拷专锟斤拷

锟斤拷锟斤拷频锟斤拷

小锟斤拷锟狡硷拷

锟斤拷色锟斤拷目

锟斤拷锟斤拷锟斤拷锟斤拷

一锟斤拷999

锟斤拷锟截吃硷拷

沙锟斤拷锟斤拷戏

BT锟斤拷锟斤拷

锟斤拷锟斤拷只锟�

锟斤拷锟剿伙拷锟斤拷

Xpath锟斤拷锟斤拷锟斤拷锟斤拷锟斤法

锟斤拷锟斤拷锟斤拷戏

XPath锟斤拷锟斤拷

XPath 锟斤拷锟斤拷锟侥伙拷锟斤拷锟斤拷锟斤拷

XPath锟斤法

路锟斤拷锟斤拷锟斤拷式

锟斤拷锟斤拷路锟斤拷

锟斤拷锟铰凤拷锟�

锟斤拷前锟节碉拷

选锟斤拷锟斤拷锟斤拷

XPath谓锟斤拷

位锟斤拷谓锟斤拷

通锟斤拷锟�

使锟斤拷 * 匹锟斤拷锟轿猴拷元锟截节碉拷

使锟斤拷 @* 匹锟斤拷锟轿猴拷锟斤拷锟皆节碉拷

使锟斤拷 node() 匹锟斤拷锟轿猴拷锟斤拷锟酵的节碉拷

XPath,re锟斤拷锟斤拷,BeautifulSoup锟皆憋拷

锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟侥斤拷为锟斤拷锟斤拷锟斤拷息锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷同锟斤拷锟睫观碉拷锟街な碉拷锟斤拷锟斤拷锟斤拷锟�

锟斤拷戏锟斤拷锟斤拷

锟斤拷戏锟斤拷锟�

锟斤拷戏锟斤拷频

锟斤拷戏锟斤拷锟斤拷

锟斤拷戏锟筋动

锟斤拷锟斤拷锟斤拷锟斤拷

锟斤拷锟斤拷锟狡碉拷锟斤拷锟�

锟斤拷锟斤拷

同锟斤拷锟斤拷锟斤拷

锟斤拷锟斤拷

锟斤拷锟斤拷锟斤拷讯

锟斤拷锟斤拷

锟斤拷锟斤拷

锟斤拷锟斤拷

使锟斤拷 `*` 匹锟斤拷锟轿猴拷元锟截节碉拷

使锟斤拷 `@*` 匹锟斤拷锟轿猴拷锟斤拷锟皆节碉拷

使锟斤拷 `node()` 匹锟斤拷锟轿猴拷锟斤拷锟酵的节碉拷