2011年1月15日 星期六

[Python] 用BeautifulSoup解析HTML範例 - 取出統一發票號碼

[Last Updated: 2013-03-11]

BeautifulSoup用來解析HTML真的很好用, 直接透過pip安裝
$ pip install BeautifulSoup

以下的小範例, 示範如何把 財政部稅務入口網-統一發票中獎號碼-101年11、12月 上的統一發票號碼截取出來



觀察網頁的HTML

會發現在每個號碼都有個class t18red標籤


<span class="t18red"> 55138690</font>

搜尋後剛好是7個 (1個特別奬, 1個特獎, 3個頭獎, 2個增開獎), 所以我們就可以針對這個HTML標籤去做解析

程式碼
See Also
財政部稅務入口網 - 統一發票中獎號碼單
Related Posts Plugin for WordPress, Blogger...