SpanBERT:使用和评估SpanBERT的代码

Python

斯潘伯特该存储库包含该论文的代码和模型：。要求顶尖请使用较早的Apex提交预训练模型我们发布这两个基地和SpanBERT大套管模型。基本模型和大型模型具有与相同的模型配置，但是在掩蔽方案和训练目标上都有所不同（有关更多详细信息，请参见我们的论文）。：12层，隐藏头，110M参数：24层，隐藏1024、16头，340M参数这些模型与模型具有相同的格式，因此您可以轻松地用我们的SpanBET模型替换它们。如果您想使用我们，则模型路径已经在代码中进行了硬编码：） SQuAD 1.1 SQuAD 2.0 酷睿 Tyk F1 F1 平均F1 F1 BERT（基地） 88.5 * 76.5 * 73.1 67.7 SpanBERT（基础） 92.4 * 83.6 * 77.4 68.2 BERT（大） 91.3 83.3 77.1

文件下载

资源详情

[{"title":"（ 92 个子文件 387KB ） SpanBERT:使用和评估SpanBERT的代码","children":[{"title":"SpanBERT-master","children":[{"title":"pretraining","children":[{"title":"fairseq","children":[{"title":"models","children":[{"title":"fairseq_model.py 7.04KB ","children":null,"spread":false},{"title":"hf_bert.py 38.71KB ","children":null,"spread":false},{"title":"fairseq_encoder.py 1.45KB ","children":null,"spread":false},{"title":"fairseq_incremental_decoder.py 3.18KB ","children":null,"spread":false},{"title":"__init__.py 4.20KB ","children":null,"spread":false},{"title":"distributed_fairseq_model.py 2.91KB ","children":null,"spread":false},{"title":"fairseq_decoder.py 2.01KB ","children":null,"spread":false},{"title":"pair_bert.py 42.04KB ","children":null,"spread":false}],"spread":true},{"title":"options.py 18.57KB ","children":null,"spread":false},{"title":"optim","children":[{"title":"nag.py 2.52KB ","children":null,"spread":false},{"title":"fairseq_optimizer.py 3.16KB ","children":null,"spread":false},{"title":"adam.py 5.49KB ","children":null,"spread":false},{"title":"bert_adam.py 7.94KB ","children":null,"spread":false},{"title":"__init__.py 1.70KB ","children":null,"spread":false},{"title":"sgd.py 1.03KB ","children":null,"spread":false},{"title":"fp16_optimizer.py 6.39KB ","children":null,"spread":false},{"title":"adagrad.py 1.12KB ","children":null,"spread":false},{"title":"lr_scheduler","children":[{"title":"cosine_lr_scheduler.py 4.37KB ","children":null,"spread":false},{"title":"polynomial_decay_schedule.py 2.76KB ","children":null,"spread":false},{"title":"reduce_lr_on_plateau.py 1.71KB ","children":null,"spread":false},{"title":"__init__.py 1.30KB ","children":null,"spread":false},{"title":"fairseq_lr_scheduler.py 1.40KB ","children":null,"spread":false},{"title":"fixed_schedule.py 2.35KB ","children":null,"spread":false},{"title":"inverse_square_root_schedule.py 2.92KB ","children":null,"spread":false},{"title":"triangular_lr_scheduler.py 2.57KB ","children":null,"spread":false}],"spread":false}],"spread":true},{"title":"meters.py 3.73KB ","children":null,"spread":false},{"title":"tokenizer.py 4.41KB ","children":null,"spread":false},{"title":"utils.py 15.94KB ","children":null,"spread":false},{"title":"tasks","children":[{"title":"fairseq_task.py 5.94KB ","children":null,"spread":false},{"title":"span_bert.py 7.63KB ","children":null,"spread":false},{"title":"__init__.py 2.32KB ","children":null,"spread":false}],"spread":true},{"title":"data","children":[{"title":"dictionary.py 7.28KB ","children":null,"spread":false},{"title":"iterators.py 8.09KB ","children":null,"spread":false},{"title":"fairseq_dataset.py 1.70KB ","children":null,"spread":false},{"title":"masking.py 12.40KB ","children":null,"spread":false},{"title":"__init__.py 874B ","children":null,"spread":false},{"title":"span_bert_dataset.py 19.21KB ","children":null,"spread":false},{"title":"indexed_dataset.py 8.63KB ","children":null,"spread":false},{"title":"data_utils.py 6.08KB ","children":null,"spread":false},{"title":"no_nsp_span_bert_dataset.py 9.81KB ","children":null,"spread":false}],"spread":true},{"title":"multiprocessing_pdb.py 1.01KB ","children":null,"spread":false},{"title":"distributed_utils.py 4.57KB ","children":null,"spread":false},{"title":"criterions","children":[{"title":"fairseq_criterion.py 1.68KB ","children":null,"spread":false},{"title":"cross_entropy.py 2.43KB ","children":null,"spread":false},{"title":"label_smoothed_cross_entropy.py 3.12KB ","children":null,"spread":false},{"title":"mlm_loss.py 2.67KB ","children":null,"spread":false},{"title":"__init__.py 1.61KB ","children":null,"spread":false},{"title":"bert_loss.py 3.39KB ","children":null,"spread":false},{"title":"spanbert_loss.py 3.91KB ","children":null,"spread":false},{"title":"composite_loss.py 2.89KB ","children":null,"spread":false},{"title":"mlm_nsp_sbo_loss.py 4.57KB ","children":null,"spread":false}],"spread":true},{"title":"__init__.py 512B ","children":null,"spread":false},{"title":"trainer.py 14.85KB ","children":null,"spread":false},{"title":"legacy_distributed_data_parallel.py 4.76KB ","children":null,"spread":false},{"title":"progress_bar.py 6.91KB ","children":null,"spread":false},{"title":"modules","children":[{"title":"grad_multiply.py 550B ","children":null,"spread":false},{"title":"bidirectional_multihead_attention.py 5.97KB ","children":null,"spread":false},{"title":"learned_positional_embedding.py 1.39KB ","children":null,"spread":false},{"title":"sinusoidal_positional_embedding.py 3.71KB ","children":null,"spread":false},{"title":"downsampled_multihead_attention.py 9.69KB ","children":null,"spread":false},{"title":"beamable_mm.py 1.84KB ","children":null,"spread":false},{"title":"multihead_attention.py 14.08KB ","children":null,"spread":false},{"title":"__init__.py 1.23KB ","children":null,"spread":false},{"title":"adaptive_softmax.py 7.41KB ","children":null,"spread":false},{"title":"highway.py 1.82KB ","children":null,"spread":false},{"title":"scalar_bias.py 996B ","children":null,"spread":false},{"title":"adaptive_input.py 2.39KB ","children":null,"spread":false},{"title":"adaptive_inputs.py 2.39KB ","children":null,"spread":false}],"spread":false}],"spread":false},{"title":"train.py 14.19KB ","children":null,"spread":false},{"title":"distributed_train.py 1.85KB ","children":null,"spread":false},{"title":"multiprocessing_train.py 2.93KB ","children":null,"spread":false},{"title":"dict.txt 374.44KB ","children":null,"spread":false},{"title":"preprocess.py 11.07KB ","children":null,"spread":false},{"title":".gitignore 1.21KB ","children":null,"spread":false},{"title":"README.md 2.12KB ","children":null,"spread":false},{"title":"bpe_tokenize.py 2.08KB ","children":null,"spread":false}],"spread":true},{"title":"LICENSE 18.88KB ","children":null,"spread":false},{"title":"CONTRIBUTING.md 1.22KB ","children":null,"spread":false},{"title":"code","children":[{"title":"run_glue.py 39.67KB ","children":null,"spread":false},{"title":"pytorch_pretrained_bert","children":[{"title":"tokenization.py 16.60KB ","children":null,"spread":false},{"title":"__init__.py 646B ","children":null,"spread":false},{"title":"optimization.py 7.84KB ","children":null,"spread":false},{"title":"file_utils.py 8.98KB ","children":null,"spread":false},{"title":"modeling.py 58.67KB ","children":null,"spread":false}],"spread":true},{"title":"run_tacred.py 26.49KB ","children":null,"spread":false},{"title":"download_finetuned.sh 264B ","children":null,"spread":false},{"title":"run_mrqa.py 41.85KB ","children":null,"spread":false},{"title":"mrqa_official_eval.py 4.87KB ","children":null,"spread":false},{"title":"run_squad.py 49.73KB ","children":null,"spread":false}],"spread":true},{"title":"requirements.txt 581B ","children":null,"spread":false},{"title":"CODE_OF_CONDUCT.md 243B ","children":null,"spread":false},{"title":"README.md 5.96KB ","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

SpanBERT:使用和评估SpanBERT的代码

文件下载

资源详情

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载