长短期记忆网络(Long Short-Term Memory, LSTM)是一种递归神经网络(Recurrent Neural Network, RNN)的变体,专门用于处理和预测序列数据。它通过引入门控机制和记忆细胞,能够更好地捕捉序列中的长期依赖关系,并解决传统RNN中的梯度消失或爆炸问题。
2024-04-09 16:35:28 2KB pytorch pytorch lstm NLP
1
百川大模型微调,lora模型,训练模型,大语言模型,Baichuan-7B模型微调,百川大模型量化 int量化 INT4量化微调模型,Baichuan-7B模型量化 百川模型量化 Baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。在标准的中文和英文 benchmark(C-Eval/MMLU)上均取得同尺寸最好的效果。
2024-01-20 20:11:26 63.48MB 语言模型
1
ER-NeRF是基于NeRF用于生成数字人的方法,可以达到实时生成的效果。具体来说,为了提高动态头部重建的准确性,ER-NeRF引入了一种 紧凑且表达丰富的基于NeRF的三平面哈希表示法,通过三个平面哈希编码器剪枝空的空间区域。对于语音音频,ER-NeRF提出了一个区域关 注模块,通过注意机制生成区域感知的条件特征。与现有方法不同,它们使用基于MLP的编码器隐式学习跨模态关系不同,注意机制建立了音 频特征和空间区域之间的明确连接,以捕获本地动作的先验知识。此外,ER-NeRF引入了一种直接且快速的自适应姿势编码,通过将头部姿势 的复杂变换映射到空间坐标,来优化头部和躯干的分离问题。大量实验证明,与先前方法相比,ER-NeRF的方法可以呈现更高保真度和音频嘴 唇同步的数字人,细节更加逼真。
2023-11-29 15:00:47 3.19MB
1
模型训练避坑指南.pdf
2023-09-27 12:11:45 1.08MB chatgpt chatgpt报告 人工智能 智能AI
1
高光谱图像分类2D_CNN网络代码 基于pytorch框架制作 全套项目,包含网络模型,训练代码,预测代码,直接下载数据集就能跑,拿上就能用,简单又省事儿 内附indian pines数据集,采用20%数据作为训练集,并附上迭代10次的模型结果,准确率99左右。
2023-09-05 16:16:48 330KB pytorch pytorch 网络 网络
1
自然语言处理作业:基于CNN的文本分类模型训练 数据划分 分成训练集、验证集、测试集 加载预训练词向量模型 基于CNN的文本分类 数据划分 分成训练集、验证集、测试集加载预训练词向量模型 ../资料/实验/第四章/sgns.sogou.word.bz2 使用Keras对语料进行处理 提取文本中的词并向量化处理,也可以使用其他工具,或自己编写 定义词嵌入矩阵生成Embedding Layer构建模型、训练、评估 输出模型的准确率(以图的形式)
2023-06-08 20:56:11 338.98MB 自然语言处理 cnn
1
图像识别,模型训练
2023-05-16 10:45:05 361.52MB 图像识别 检测
1
自然语言处理+2020年初微博数据(疫情相关)+适用于nlp、数据挖掘模型训练
2023-03-06 00:53:02 2.37MB 数据挖掘 NLP
1
tflite_avto_num_recognation 车牌识别。 模型训练并转换为tflite sтотпроектдемонстрируеткакиспользоватьTensorFlow2иKerasдляобучениянейроннойсетираспониюавто。 Крометого,онсодержитещеодинпример的Python,которыйиспользуетTensorFlow精简版длявыполнениялогическоговыводанаобученноймодели,чтобыраспознатьномернакаком-нибудьконтроллере,телефонеилиустройстве。 Основнойкодвзятотсюдаhttps //github.com/DeepSystems/supervisely-tut
2023-02-23 19:09:26 30.39MB
1
训练模型主要分为五个模块:启动器、自定义数据加载器、网络模型、学习率/损失率调整以及训练可视化。
2023-02-10 11:14:52 21KB 深度学习 pytorch 车型识别 毕业设计
1