微信扫一扫，关注公众号

科技行者
算力行者

见证连接与计算的「力量」

首页

让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

阿里人工智能阿里NASA

让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

作者：CNET科技资讯网

2017-07-28 15:04

分享至：

今天，阿里巴巴的“NASA大脑”iDST（Institute of Data Science Technology）表示，《Hierarchical Multimodal LSTM for Dense Visual-Semantic Embedding》入选2017年国际计算机视觉大会ICCV，即计算机视觉领域的顶级会议之一。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2017-07-28 15:04 • CNET科技资讯网

CNET科技资讯网 7月28日北京消息：今天，阿里巴巴的“NASA大脑”iDST（Institute of Data Science Technology）表示，《Hierarchical Multimodal LSTM for Dense Visual-Semantic Embedding》入选2017年国际计算机视觉大会ICCV，即计算机视觉领域的顶级会议之一。

这也是阿里巴巴本月内第三次公布论文入选国际顶级学术会议的好消息。

据了解，这篇论文涉及的是计算机视觉（Vision）和自然语言处理（Language）两个独立领域结合的学术研究，提出了对图像（或图像显著区域）更为细致精确的描述，显示出阿里巴巴在Vision&Language研究方向的持续挖掘。

该论文通过创新的多模态、层次化的递归神经网络（Hierarchical Multimodal LSTM）方法，可以将整个句子、句子中的短语、整幅图像及图像中的显著区域同时嵌入语义空间，并且自动学习出“句子-图像”及“短语-图像区域”间的对应关系，生成包含更多形容词的稠密语义空间，对图像或图像区域进行更详细和生动的描述。