自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序

N 它能够处理序列标记任务,例如词性(POS)标记,分块,命名实体识别(NER),标点恢复,句子边界检测,口语理解等等。
 
0.5 0.0
  10月前

G 基于京东网站的1300种商品上下级概念,约10万商品品牌,约65万品牌销售关系,商品描述维度等知识库,基于该知识库可以支持商品属性库构建,商品销售问答,品牌物品生产等知识查询服务,也可用于情感分析等下游应用.
 
0.5 0.0
  6月前

C 主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.把玩和PK使用
 
0.5 0.0
  10月前

Z 中文ULMFiT 情感分析 文本分类
 
0.5 0.0
  9月前
13 155 46

G gAnswer能够将自然语言问题转化成包含语义信息的查询图,然后,将查询图转化成标准的SPARQL查询,并将这些查询在图数据库中执行,最终得到用户的答案。
 
0.5 0.0
10 154 61

T text-similarity:用TF特征向量和simhash指纹计算中文文本的相似度
 
0.5 0.0
  3年前

S 速度更快、效果更好的中文新词发现
 
0.5 6.8
  7天前
10 152 44

S 该程序将文本文件作为输入,并通过分析每个句子来生成问题
 
0.5 0.0
  3月前

2 2019年百度的三元组抽取比赛,一个baseline
 
0.5 0.0
  4月前
12 148 32

D DaCiDian是一个开源的中文普通话词汇,用于自动语音识别(ASR)
 
0.4 0.0
  11月前
14 144 27

M Unsupervised Statistical Machine Translation
 
0.4 0.0
  11月前
18 142 11

T Textpipe:文本清洗与元数据提取
 
0.4 0.0
  2月前

Y 这是使用BERT进行序列注释和文本分类的模板代码,方便大家将BERT用于更多任务。欢迎使用这个BERT模板解决更多NLP任务,然后在这里分享你的结果和代码。
 
0.4 0.0
  4月前
16 140 21

M MONPA 罔拍是一個提供正體中文分詞及 POS, NE 標註的模型
 
0.4 0.8
  1月前
15 138 44

S 用基于bert的微调和特征提取方法来进行知识图谱百度百科人物词条属性抽取。
 
0.4 0.0
  6月前