Golang 文章正文抽取(readability)

2017-11-18 09:38:40来源:作者:人点击

分享

readability for golang


Golang版本是根据readabiliity for node.js以及readability for python所改写,并加入了些自己的,比如支持gzip等。


引用的第三方包

github.com/PuerkitoBio/goquery

github.com/axgle/mahonia



使用方法
package main
import (
"fmt"
"github.com/ying32/readability"
)
func main() {
test, err := readability.NewReadability("/2014th7cj/d/file/p/20171118/news_detail.php err != nil {
fmt.Println("failed.", err)
return
}
test.Parse()
fmt.Println(test.Title)
fmt.Println(test.Content)
}
源代码

github.com/ying32/readability



微信扫一扫

第七城市微信公众平台