自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
259 5.9k 948

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
10.0 2.3000000000000003
86 816 177

F 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典
 
3.7 1.7999999999999998
  1月前
51 974 171

L langid.py:独立的语言识别系统
 
3.0 0.0
  7月前
84 782 211

MatchZoo是一个文本匹配的工具包
 
2.7 1.7999999999999998
  7天前
52 799 64

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.6 0.8
  18天前
24 769 37

B Bounter:Python高性能大规模数据集(词频)计数
 
2.6 0.2
64 704 172

S synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
 
2.6 3.5
71 758 343

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
2.4 0.0
  1年前
62 572 150

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
2.0 10.0
  前天
44 522 172

T TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba
 
1.6 0.0
173 1.7k 276

Z 自然语言处理(NLP)任务与参考资源精选
 
1.3 0.2
  1月前
20 423 213

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
1.3 0.0
  3年前
20 365 39

M Makes famous people speak whatever you wish by linking their words
 
1.2 0.0
  1年前
56 251 76

中文文本标注工具
 
1.1 2.0
  12天前
38 304 120

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
1.0 1.7000000000000002
27 290 62

R rake-nltk:Python实现使用NLTK的快速自动关键字提取算法
 
1.0 0.2
  1月前
45 254 62

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
1.0 10.0
15 279 44

W WikiData上的一个自然语言查询引擎
 
0.8999999999999999 0.0
  1年前