fastNLP/legacy/api
2019-07-09 02:18:11 +08:00
..
__init__.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
api.py fix bug in load dataset test code 2019-07-09 02:18:11 +08:00
converter.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
examples.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
pipeline.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
processor.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
README.md Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00
utils.py Dev0.4.0 (#149) 2019-05-22 18:43:56 +08:00

fastNLP 高级接口

环境与配置

  1. 系统环境linux/ubuntu(推荐)
  2. 编程语言Python>=3.6
  3. Python包依赖
  • torch==1.0
  • numpy>=1.14.2

中文分词

text = ['编者按7月12日英国航空航天系统公司公布了该公司研制的第一款高科技隐形无人机雷电之神。',
        '这款飞行从外型上来看酷似电影中的太空飞行器,据英国方面介绍,可以实现洲际远程打击。',
        '那么这款无人机到底有多厉害?']
from fastNLP.api import CWS
cws = CWS(device='cpu')
print(cws.predict(text))
# ['编者 按 : 7月 12日 , 英国 航空 航天 系统 公司 公布 了 该 公司 研制 的 第一 款 高 科技 隐形 无人 机雷电 之 神 。', '这 款 飞行 从 外型 上 来 看 酷似 电影 中 的 太空 飞行器 , 据 英国 方面 介绍 , 可以 实现 洲际 远程 打击 。', '那么 这 款 无人 机 到底 有 多 厉害 ?']

词性标注

# 输入已分词序列
text = [['编者', '按:', '7月', '12日', '', '英国', '航空', '航天', '系统', '公司', '公布', '了', '该', '公司',
         '研制', '的', '第一款', '高科技', '隐形', '无人机', '雷电之神', '。'],
        ['那么', '这', '款', '无人机', '到底', '有', '多', '厉害', '']]
from fastNLP.api import POS
pos = POS(device='cpu')
print(pos.predict(text))
# [['编者/NN', '按:/NN', '7月/NT', '12日/NT', '/PU', '英国/NR', '航空/NN', '航天/NN', '系统/NN', '公司/NN', '公布/VV', '了/AS', '该/DT', '公司/NN', '研制/VV', '的/DEC', '第一款/NN', '高科技/NN', '隐形/AD', '无人机/VV', '雷电之神/NN', '。/PU'], ['那么/AD', '这/DT', '款/NN', '无人机/VV', '到底/AD', '有/VE', '多/AD', '厉害/VA', '/PU']]

句法分析

text = [['编者', '按:', '7月', '12日', '', '英国', '航空', '航天', '系统', '公司', '公布', '了', '该', '公司',
        '研制', '的', '第一款', '高科技', '隐形', '无人机', '雷电之神', '。'],
        ['那么', '这', '款', '无人机', '到底', '有', '多', '厉害', '']]
from fastNLP.api import Parser
parser = Parser(device='cpu')
print(parser.predict(text))
# [['2/nn', '4/nn', '4/nn', '20/tmod', '11/punct', '10/nn', '10/nn', '10/nn', '10/nn', '11/nsubj', '20/dep', '11/asp', '14/det', '15/nsubj', '18/rcmod', '15/cpm', '18/nn', '11/dobj', '20/advmod', '0/root', '20/dobj', '20/punct'], ['4/advmod', '3/det', '8/xsubj', '8/dep', '8/advmod', '8/dep', '8/advmod', '0/root', '8/punct']]

完整样例见examples.py