1. 北京工业大学计算机学院,北京,100124
2. 北京邮电大学网络与交换国家重点实验室信息安全中心,北京,100876
3. 中国电子 技术标准化研究所,北京,100007
4. 天津大学电子信息工程学院,天津,300072
5. 北京邮电大学信息与通信工程学院,北京,100876
6. 北京工业大学计算机学院北京,100124
7. 北京邮电大学网络与交换国家重点实验室信息安全中心北京,100876
8. 中国电子 技术标准化研究所北京,100007
9. 天津大学电子信息工程学院天津,300072
10. 北京邮电大学信息与通信工程学院北京,100876
纸质出版:2009
移动端阅览
杨 震, 范科峰, 雷建军, 等. 基于语义的文本流形研究[J]. 电子学报, 2009,37(3):557-561.
YANG Zhen, FAN Ke-feng, LEI Jian-jun, et al. Text Manifold Based on Semantic Analysis[J]. Acta Electronica Sinica, 2009, 37(3): 557-561.
本文通过引入包括Isomap流形降维、查询语义词典(WordNet)等高度非线性的方法
期望将文本信息处理领域长期专注于"语法"层次的研究
演进到"语义"的层次.利用流形学习工具研究了中文词汇在语义空间(分类空间)的分布聚集情况
通过利用WordNet词典进行了短信聚类的研究.实验结果表明
本文的方法能够更好地反映文本之间的内在联系.
By using the non-linear operators (such as Isomap
WordNet etc.)
how to promote the traditional text information processing techniques to "understanding" level was discussed.Based on manifold analysis
the distribution of Chinese words in a continuous semantic space was primarily studied.Short messages clustering based on WordNet was investigated.Experimental results prove that these methods can reflect the internal relation of texts.
0
浏览量
1566
下载量
8
CSCD
关联资源
相关文章
相关作者
相关机构
京公网安备11010802024621