视觉问答中所有语言先验,偏见的论文,代码,ppt
2021-04-05 17:10:46 131.9MB 视觉问答
1
很棒的VQA 阅读有关视觉问题解答的论文清单。 目录 图像质量检查论文 数据集 DAQUAR [2014] [NIPS]一种基于不确定输入的多场景现实场景问题解答方法。[ ] [ ] [] DAQUAR共识[2015年] [ICCV]问你-基于神经神经元的方法来回答问题的有关图片。[ ] [ ] [] 视觉Madlibs [2015年] [ICCV]在空白说明生成和答疑视觉Madlibs填充。[ ] [] [] VQA V1.0 [2015年] [ICCV] VQA,视觉答疑。[ ] [] [] FM-IQA [2015年] [NIPS]你说一台机器数据集和方法多语言映像答疑。[] [] [] SHAPES [2016] [CVPR]神经模块网络。[ ] [] [] Visual7W [2016年] [CVPR] Visual7W:接地问答系统中的图像[ ] [] []
2021-03-17 16:21:39 474KB
1
VQA 视觉问答 运行代码 该模型基于在运行代码之前,请从下载相关的训练,验证和测试数据。下面的部分根据需要Resnet-18或CNN的结果告诉您要运行哪些脚本 有线电视新闻网 我们按照以下顺序运行脚本以获得最佳结果 image_preprocessing_CNN.py 这将从图像中提取特征 preprocess-QA.py 这从提出的问题中提取特征 train_models_cnn.py 这使用L2正则化训练了50个时期的模型0.0005 view-logs.py logs/ 打印出结果 ResNet-18 我们按照以下顺序运行脚本以获得最佳结果 image_preprocessing_resnet18.py 这将从图像中提取特征 preprocess-QA.py 这从提出的问题中提取特征 train_models.py 这使用L2正则化0.001训练了50个时
2021-03-10 15:46:37 1.78MB Python
1
视觉问答权威综述,最后讨论了有前景的未来研究方向特别是与结构化知识库的联系以及使用自然语言处理模型。
2019-12-21 18:58:49 6.7MB 视觉问答 机器学习 人工智能
1