在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合 (Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合特征与当前特征组合的错分差异度和正分差异度,以及待组合特征本身的重要度,从候选特征集中动态获取优化的特征组合.在哈工大中文问句集上对词袋绑定特征进行组合的实验结果表明,与其他特征组合方法相比,DIFC方法灵活高效,准确率更高.
现有机会路由选择未考虑数据流的分布,可能使候选节点空闲或过载,导致网络吞吐量提升有限.本文将多并发流的机会路由描述成一个凸优化问题,基于对偶和子梯度方法,提出分布式联合候选节点选择和速率分配的多流机会路由算法(Opportunistic Routing for Multi-Flow,ORMF).该算法迭代进行流速率分配,并在速率分配过程中完成候选节点选择.实验结果表明,与基于期望传输次数和期望任意传输次数指标的机会路由相比,ORMF平均可提高33.4%和27.9%的汇聚吞吐量.