针对传统数据驱动的故障诊断方法难以从QAR数据中提取有效特征的问题,提出一种融合卷积神经网络(convolutional neural network,CNN)与长短时记忆网络(long short-term memory,LSTM)的双通道融合模型CNN-LSTM。CNN与LSTM分别作为两个通道,通过注意力机制(attention)融合,从而使模型能同时表达数据在空间维度和时间维度上的特征,并以时间序列预测的方式验证融合模型特征提取的有效性。实验结果表明,双通道融合模型与单一的CNN、LSTM相比,能够更有效地提取数据特征,模型单步预测与多步预测误差平均降低35.3%,为基于QAR数据的故障诊断提供一种新的研究思路。
1
在金融二级市场上对数据的分析方法主要是基于统计学和人工建模的方法,本文的提出了使用神经网络的方法分析二级市场金融数据。本文首先提出了在金融二级市场上使用神经网络方法的思路,其次证明了在二级市场使用神经网络进行数据分析的可行性,并且根据金融数据的特点设计出一种适合于处理金融数据的CNN-LSTM网络来处理数据。该网络对比传统的简单的统计方法和一些神经网络方法比如逻辑回归,卷积神经网络(CNN),长短期记忆网络(LSTM)等方法,在对市场价格变化在较短时间内的预测和在较长时间内的预测都有显著的提高,比简单的统计方法提高10%,比其他神经网络提高5%。提出了一种能够较为有效分析金融二级市场数据的方法。
1
超短期负荷预测为实时电力市场运行提供重要依据, 预测准确度的提升对于揭示负荷变化的不确定性以及日前 预测偏差具有重要意义。基于电力系统中含有的丰富大数据 资源,提出了一种针对区域级负荷的深度长短时记忆网络超 短期预测方法,该方法包括输入数据的预处理、深度长短时 记忆(long short-term memory,LSTM)网络的构建以及模型 的训练和超参数的寻找等步骤。其中采用随机搜索的方法寻 找最优超参数,并在该超参数下选择泛化能力最优的模型,与前沿机器学习预测算法进行对比。实验结果证实,深度 LSTM 网络可以取得更好的预测效果,适合于离线训练实时 预测。此外,通过对隐藏层激活向量的可视化
1
传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在地认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(word sense disambiguation convolutional neural network)。使用双向长短时记忆网络(BLSTM)建模上下文,得到词义消歧后的文档特征图;利用卷积神经网络(CNN)进一步提取对文本分类最重要的特征。在四个数据集上进行对比实验,结果表明,所提出方法在两个数据集,特别是文档级数据集上优于先前最好的方法,在另外两个数据集上得到与此前最好方法相当的结果。
1
基于深度学习的方面情感分析是自然语言处理的热点之一。针对方面情感,提出基于方面情感分析的深度分层注意力网络模型。该模型通过区域卷积神经网络保留文本局部特征和不同句子时序关系,利用改进的分层长短期记忆网络(LSTM)获取句子内部和句子间的情感特征。其中,针对LSTM添加了特定方面信息,并设计了一个动态控制链,改进了传统的LSTM。在SemEval 2014的两个数据集和Twitter数据集上进行对比实验得出,相比传统模型,提出的模型的情感分类准确率提高了3%左右。
1
命名实体识别是自然语言处理的一项关键技术. 基于深度学习的方法已被广泛应用到中文实体识别研究中. 大多数深度学习模型的预处理主要注重词和字符的特征抽取, 却忽略词上下文的语义信息, 使其无法表征一词多义, 因而实体识别性能有待进一步提高. 为解决该问题, 本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法. 首先通过BERT模型预处理生成基于上下文信息的词向量, 其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理. 实验结果表明, 该模型在MSRA语料和人民日报语料库上都达到相当不错的结果, F1值分别为94.65%和95.67%.
1
在Anaconda Jupyter Noteboo下实现的基于长短期记忆网络(LSTM)的手写体数字识别(ipynb文件格式)
2021-10-14 16:17:03 14KB python lstm 深度学习
1
LSTM(Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。 LSTM 已经在科技领域有了多种应用。基于 LSTM 的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务。本文档是基于LSTM原理的简单实现,有助于理解其原理。
2021-10-06 16:27:31 2KB Deep Learnin LSTM
1
基于python3、tensorflow库的bilstm程序。双向长短时记忆网络。python文件。
1
新闻报道中观点能够影响读者的感受,针对目前新闻报道中观点提取缺失的现状。本文提出一种条件随机场(CRF)和深度学习相结合的模型,通过集成深度学习的BiLSTM方法和改进型CRF方法,实现对新闻文章的观点持有者、评价对象和观点极性3种实体信息的提取。试验表明:相较于CRF算法,准确率、召回率和F1值平均提高12.29%、10.00%和11.07%。
1