@xingmu
X.M 暂无简介
Crux 是一个 HTML 正文内容提取库,它通过分析 Web 页面,以确定一篇文章的关键内容
A java crawler for infomation collection.
该项目用来从一个 HTML 中提取文章信息,包括标题、正文、作者、发布日期等等