使用 Python 实现的新闻网页正文通用抽取器 Alpha 版.

使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率。

相关的项目 - 更多比较

Popular
3.1k 56.3k 16.7k

所有算法在Python中实现(用于教育)
 
9.0 10.0
  前天

S 使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率。
 
4.0 3.7
  9天前