基于pytorch+bilstm_crf的中文命名实体识别
文件说明
--checkpoints:模型保存的位置
--data:数据位置
--|--cnews:数据集名称
--|--|--raw_data:原始数据存储位置
--|--|--final_data:存储标签、词汇表等
--logs:日志存储位置
--utils:辅助函数存储位置,包含了解码、评价指标、设置随机种子、设置日志等
--config.py:配置文件
--dataset.py:数据转换为pytorch的DataSet
--main.py:主运行程序
--main.sh:运行命令
--models.py:模型
--process.py:预处理,主要是处理数据然后转换成DataSet
运行命令
python main.py --data_dir="../data/cnews/final_data/" --log_dir="./logs/" --output_dir="./checkpoints/" --num_tags=33 --seed=123 --gpu_ids="0" --max_seq_len=128 --
1