Commit Graph

165 Commits

Author SHA1 Message Date
陈怡然
8c6552aa27 Merge branch 'dev0.5.0' of https://github.com/fastnlp/fastNLP into dev0.5.0 2019-08-16 17:35:15 +08:00
zide05
cd395a7cdf
Update tutorial_5_datasetiter.rst 2019-08-16 13:18:35 +08:00
zide05
620ad161e0
Update tutorial_4_loss_optimizer.rst 2019-08-16 13:16:45 +08:00
ChenXin
cdf8406ec1 updated docs 2019-08-14 20:29:14 +08:00
ChenXin
b6bad76415 update the Makefile to make api-extractor work better 2019-08-14 20:28:49 +08:00
xuyige
ec824376c6 fix embedding tutorials 2019-07-12 14:51:11 +08:00
ChenXin
1fed3650d5 check了 embeddings 的文档 2019-07-12 14:18:04 +08:00
ChenXin
90c6454aed 修改了文档首页 2019-07-12 13:13:54 +08:00
yunfan
9f681dcd55 fix tutorial typo 2019-07-12 12:42:31 +08:00
ChenXin
fc0f86aa9e io、data_loader的文档结构和别名 2019-07-12 12:05:04 +08:00
ChenXin
ce72936c0f :maxdepth: 1 2019-07-12 11:38:51 +08:00
ChenXin
dcc6d5d15d models的文档结构和别名 2019-07-12 11:27:35 +08:00
ChenXin
391793a961 最新的docs结构 2019-07-12 10:36:46 +08:00
xuyige
273657048f 更改文档内容 2019-07-12 01:47:51 +08:00
xuyige
579bdb1356 更新DataSetLoader的文档以及对应教程 2019-07-12 00:15:15 +08:00
xuyige
2e523c6096 更新fastNLP框架图及流程图 2019-07-12 00:14:11 +08:00
ChenXin
6c7009dded tutorials 标题 2019-07-11 15:12:31 +08:00
ChenXin
be7ffcf747 确定版本号为0.4.5 2019-07-11 12:47:25 +08:00
ChenXin
ee1e470e71 大幅更新文档:
1. 删除了aggregator相关的文档
2. 将 fitlog 教程移到详细教程的子目录
2019-07-11 10:51:42 +08:00
ChenXin
16e2474337 列举了目前暴露的 modules 和 models,需要后续增加更多。 2019-07-11 10:20:33 +08:00
ChenXin
6b6a47cfbc dataset tutorials 2019-07-11 09:35:56 +08:00
xuyige
dc8ae5646c add embedding tutorial 2019-07-10 23:05:18 +08:00
yunfan
aec0414a07 finish callback tutorial 2019-07-10 17:31:34 +08:00
yunfan
68f719ef99 [add] callback tutorial 2019-07-10 16:53:12 +08:00
zide05
834443e240
Merge branch 'tutorials' into tutorials 2019-07-09 14:13:42 +08:00
陈怡然
da88a0dc4f batch分离出来-修改 2019-07-09 11:12:20 +08:00
陈怡然
9e863bb1a2 batch分离出来 2019-07-09 10:56:29 +08:00
ChenXin
3cba5a36bb fix a bug 2019-07-08 20:31:06 +08:00
ChenXin
8f6de5b3af 建立tutorials的目录 2019-07-08 17:19:01 +08:00
ChenXin
f861dcc63c
Merge pull request #180 from zide05/tutorials
改成使用SST数据集的batch,loss,optimizer教程
2019-07-08 16:43:54 +08:00
陈怡然
b3d6acf819 改成使用SST数据集的batch,loss,optimizer教程 2019-07-08 16:39:52 +08:00
xuyige
5dc43c6e5a create load dataset tutorial 2019-07-07 22:42:56 +08:00
Yige XU
3e37356f2a
Merge pull request #173 from zide05/tutorials
修改docs/source/user/tutorials.rst和docs/source/tutorials/tutorial_1_bat…
2019-07-05 21:38:00 +08:00
陈怡然
1fef29e372 修改docs/source/user/tutorials.rst和docs/source/tutorials/tutorial_1_batcher_loss_optimizer.rst 2019-07-05 20:11:24 +08:00
ChenXin
63e00bd84d add more detail in README.md 2019-07-05 14:29:25 +08:00
ChenXin
6e6a31183f make tutorials folder 2019-07-04 11:49:50 +08:00
ChenXin
1ccc730c42 basic framework of docs folder 2019-07-04 11:33:33 +08:00
ChenXin
aa5f67ef55 first commit on tutorials branch 2019-07-04 10:05:22 +08:00
yhcc
4124b385d7
Update quickstart.rst 2019-06-13 11:17:02 +08:00
ChenXin
9bfedbdfe9 修复了 metrics 文档中的公式 2019-06-05 19:36:40 +08:00
ChenXin
b0abbb12e4 注释样例 2019-06-04 21:38:41 +08:00
ChenXin
8dec821fad 修改了最新的文档 2019-05-24 01:58:04 +08:00
ChenXin
881ce01762
Dev0.4.0 (#149)
* 1. CRF增加支持bmeso类型的tag 2. vocabulary中增加注释

* BucketSampler增加一条错误检测

* 1.修改ClipGradientCallback的bug;删除LRSchedulerCallback中的print,之后应该传入pbar进行打印;2.增加MLP注释

* update MLP module

* 增加metric注释;修改trainer save过程中的bug

* Update README.md

fix tutorial link

* Add ENAS (Efficient Neural Architecture Search)

* add ignore_type in DataSet.add_field

* * AutoPadder will not pad when dtype is None
* add ignore_type in DataSet.apply

* 修复fieldarray中padder潜在bug

* 修复crf中typo; 以及可能导致数值不稳定的地方

* 修复CRF中可能存在的bug

* change two default init arguments of Trainer into None

* Changes to Callbacks:
* 给callback添加给定几个只读属性
* 通过manager设置这些属性
* 代码优化,减轻@transfer的负担

* * 将enas相关代码放到automl目录下
* 修复fast_param_mapping的一个bug
* Trainer添加自动创建save目录
* Vocabulary的打印,显示内容

* * 给vocabulary添加遍历方法

* 修复CRF为负数的bug

* add SQuAD metric

* add sigmoid activate function in MLP

* - add star transformer model
- add ConllLoader, for all kinds of conll-format files
- add JsonLoader, for json-format files
- add SSTLoader, for SST-2 & SST-5
- change Callback interface
- fix batch multi-process when killed
- add README to list models and their performance

* - fix test

* - fix callback & tests

* - update README

* 修改部分bug;调整callback

* 准备发布0.4.0版本“

* update readme

* support parallel loss

* 防止多卡的情况导致无法正确计算loss“

* update advance_tutorial jupyter notebook

* 1. 在embedding_loader中增加新的读取函数load_with_vocab(), load_without_vocab, 比之前的函数改变主要在(1)不再需要传入embed_dim(2)自动判断当前是word2vec还是glove.
2. vocabulary增加from_dataset(), index_dataset()函数。避免需要多行写index dataset的问题。
3. 在utils中新增一个cache_result()修饰器,用于cache函数的返回值。
4. callback中新增update_every属性

* 1.DataSet.apply()报错时提供错误的index
2.Vocabulary.from_dataset(), index_dataset()提供报错时的vocab顺序
3.embedloader在embed读取时遇到不规则的数据跳过这一行.

* update attention

* doc tools

* fix some doc errors

* 修改为中文注释,增加viterbi解码方法

* 样例版本

* - add pad sequence for lstm
- add csv, conll, json filereader
- update dataloader
- remove useless dataloader
- fix trainer loss print
- fix tests

* - fix test_tutorial

* 注释增加

* 测试文档

* 本地暂存

* 本地暂存

* 修改文档的顺序

* - add document

* 本地暂存

* update pooling

* update bert

* update documents in MLP

* update documents in snli

* combine self attention module to attention.py

* update documents on losses.py

* 对DataSet的文档进行更新

* update documents on metrics

* 1. 删除了LSTM中print的内容; 2. 将Trainer和Tester的use_cuda修改为了device; 3.补充Trainer的文档

* 增加对Trainer的注释

* 完善了trainer,callback等的文档; 修改了部分代码的命名以使得代码从文档中隐藏

* update char level encoder

* update documents on embedding.py

* - update doc

* 补充注释,并修改部分代码

* - update doc
- add get_embeddings

* 修改了文档配置项

* 修改embedding为init_embed初始化

* 1.增加对Trainer和Tester的多卡支持;

* - add test
- fix jsonloader

* 删除了注释教程

* 给 dataset 增加了get_field_names

* 修复bug

* - add Const
- fix bugs

* 修改部分注释

* - add model runner for easier test models
- add model tests

* 修改了 docs 的配置和架构

* 修改了核心部分的一大部分文档,TODO:
1. 完善 trainer 和 tester 部分的文档
2. 研究注释样例与测试

* core部分的注释基本检查完成

* 修改了 io 部分的注释

* 全部改为相对路径引用

* 全部改为相对路径引用

* small change

* 1. 从安装文件中删除api/automl的安装
2. metric中存在seq_len的bug
3. sampler中存在命名错误,已修改

* 修复 bug :兼容 cpu 版本的 PyTorch
TODO:其它地方可能也存在类似的 bug

* 修改文档中的引用部分

* 把 tqdm.autonotebook 换成tqdm.auto

* - fix batch & vocab

* 上传了文档文件 *.rst

* 上传了文档文件和若干 TODO

* 讨论并整合了若干模块

* core部分的测试和一些小修改

* 删除了一些冗余文档

* update init files

* update const files

* update const files

* 增加cnn的测试

* fix a little bug

* - update attention
- fix tests

* 完善测试

* 完成快速入门教程

* 修改了sequence_modeling 命名为 sequence_labeling 的文档

* 重新 apidoc 解决改名的遗留问题

* 修改文档格式

* 统一不同位置的seq_len_to_mask, 现统一到core.utils.seq_len_to_mask

* 增加了一行提示

* 在文档中展示 dataset_loader

* 提示 Dataset.read_csv 会被 CSVLoader 替换

* 完成 Callback 和 Trainer 之间的文档

* index更新了部分

* 删除冗余的print

* 删除用于分词的metric,因为有可能引起错误

* 修改文档中的中文名称

* 完成了详细介绍文档

* tutorial 的 ipynb 文件

* 修改了一些介绍文档

* 修改了 models 和 modules 的主页介绍

* 加上了 titlesonly 这个设置

* 修改了模块文档展示的标题

* 修改了 core 和 io 的开篇介绍

* 修改了 modules 和 models 开篇介绍

* 使用 .. todo:: 隐藏了可能被抽到文档中的 TODO 注释

* 修改了一些注释

* delete an old metric in test

* 修改 tutorials 的测试文件

* 把暂不发布的功能移到 legacy 文件夹

* 删除了不能运行的测试

* 修改 callback 的测试文件

* 删除了过时的教程和测试文件

* cache_results 参数的修改

* 修改 io 的测试文件; 删除了一些过时的测试

* 修复bug

* 修复无法通过test_utils.py的测试

* 修复与pytorch1.1中的padsequence的兼容问题; 修改Trainer的pbar

* 1. 修复metric中的bug; 2.增加metric测试

* add model summary

* 增加别名

* 删除encoder中的嵌套层

* 修改了 core 部分 import 的顺序,__all__ 暴露的内容

* 修改了 models 部分 import 的顺序,__all__ 暴露的内容

* 修改了文件名

* 修改了 modules 模块的__all__ 和 import

* fix var runn

* 增加vocab的clear方法

* 一些符合 PEP8 的微调

* 更新了cache_results的例子

* 1. 对callback中indices潜在None作出提示;2.DataSet支持通过List进行index

* 修改了一个typo

* 修改了 README.md

* update documents on bert

* update documents on encoder/bert

* 增加一个fitlog callback,实现与fitlog实验记录

* typo

* - update dataset_loader

* 增加了到 fitlog 文档的链接。

* 增加了 DataSet Loader 的文档

* - add star-transformer reproduction
2019-05-22 18:43:56 +08:00
FengZiYjun
0c5630bd16 Ready for V0.3.1
* 升级parser API和模型
* update docs: add new pages for tutorials
* upgrade CWS api download source
* add a new method for dataset field access
* add introduction for bert
* add more unit tests for api/processor
* remove unused test data. Add new test data.
2019-02-04 09:44:54 +08:00
FengZiYjun
07c2b87caf fix version number 2019-01-03 19:52:14 +08:00
FengZiYjun
5d8f6960a7 * fix README figure
* refine code style
2019-01-03 19:25:22 +08:00
FengZiYjun
d43d738536 merge dev branch with master 2019-01-03 19:05:23 +08:00
FengZiYjun
bc7fc71faa * update version number in doc
* update fastNLP.core.rst
* refine all docstrings in core/
2019-01-03 18:59:52 +08:00
lyhuang
d91a7c7c48 update docs 2018-12-13 01:52:52 +08:00
FengZiYjun
117b12a698 * update README.md
* remove torchvision in requirements.txt
2018-11-29 23:27:15 +08:00
lyhuang
36a7a980ca update docs 2018-10-05 05:34:26 +08:00
FengZiYjun
0b86d7cf2b Merge Preprocessor and DataSet 2018-09-28 21:35:17 +08:00
Yunfan Shao
4d66bd6b9f
Merge pull request #81 from choosewhatulike/fixMLP
update MLP
2018-09-19 14:40:10 +08:00
yunfan
8f60a4fa01 update MLP 2018-09-18 15:57:44 +08:00
lyhuang
9fb6711bc4 add new modules for core/ 2018-09-18 13:44:19 +08:00
lyhuang
a521fdffd1 add mathjax and update pictures 2018-09-12 16:57:55 +08:00
lyhuang
a7fa63a0db add tensorboardX 2018-09-09 14:11:47 +08:00
lyhuang
6a77731d86 add tensorboardX 2018-09-09 14:08:05 +08:00
lyhuang
34c78cb9de update docs
move example to docs
2018-09-02 20:08:17 +08:00
lyhuang
3fde835638 docs/requirements.txt 2018-08-29 00:18:15 +08:00
lyhuang
96cf033689 docs/ 2018-08-29 00:11:33 +08:00
lyhuang
41c7524d4f docs/requirements.txt 2018-08-28 21:23:28 +08:00
lyhuang
6fe431833a docs/requirements 2018-08-20 17:46:14 +08:00
lyhuang
f2676d8927 docs更新
设置了模板,对fastNLP文件夹下的内容生成了文档
2018-08-20 17:22:26 +08:00
FengZiYjun
fdd26b8e58 add LICENSE, setup.py & requirements.txt 2018-05-25 18:32:02 +08:00