Hank to hanker - Learning Note: [Python] 用BeautifulSoup解析HTML範例

2011年1月15日星期六

[Last Updated: 2013-03-11]

BeautifulSoup用來解析HTML真的很好用, 直接透過pip安裝
$ pip install BeautifulSoup

以下的小範例, 示範如何把財政部稅務入口網-統一發票中獎號碼-101年11、12月上的統一發票號碼截取出來

觀察網頁的HTML

會發現在每個號碼都有個class t18red標籤

<span class="t18red"> 55138690</font>

搜尋後剛好是7個 (1個特別奬, 1個特獎, 3個頭獎, 2個增開獎), 所以我們就可以針對這個HTML標籤去做解析

程式碼
See Also
財政部稅務入口網 - 統一發票中獎號碼單

網頁