三层Dirichlet 过程文本建模(非参贝叶斯模型)

举报
HFUT_qianyang 发表于 2019/01/23 15:56:19 2019/01/23
【摘要】 文章来源Nguyen V A, Boyd-Graber J, Resnik P, et al. Modeling topic control to detect influence in conversations using nonparametric topic models[J]. Machine Learning, 2014, 95(3): 381-421.来自于机器学习顶级期刊《M...

文章来源

Nguyen V A, Boyd-Graber J, Resnik P, et al. Modeling topic control to detect influence in conversations using nonparametric topic models[J]. Machine Learning, 2014, 95(3): 381-421.

来自于机器学习顶级期刊《Machine Learning》上。这篇文章首先发表在12的Machine Learning会议上,后改投至其对应的期刊。


文章简介

首先,这篇文章是三层的DP模型,即非参层次贝叶斯模型,所要解决的问题是:(1)发掘一系列对话中的主题;(2)这些主题在各对话中是怎么共享的;(3)在对话的什么阶段,讨论的主题会发生改变(这里使用的二元变量控制);(4)话题的控制。作者评估的数据集包括会议记录,在线讨论以及政治辩论数据集。

在多方对话行为中,人与人是相互影响的,那么现有的研究就包括如何学习和识别多方对话中的具有影响力的人。在早期的研究中,主要采访的方法是结构模式学习(structural patterns),例如基于说话的时间以及参与的积极性来判断参与者是否有影响力。如果参与者谈论的很多,那么该参与者则更具影响力,更具领导能力们更加具有控制性(这里作者列举了一些列研究)。现有的研究中,主要使用的是计算学方法,也是确定结构性特征来划分该参与者是否有影响力。

但是呢,话题的参与者说话声音大、时间长却并不一定能表示他更具影响力。在结构模式学习中,语言的特征在建立影响力以及控制话题方面也扮演者重要的角色。例如,有学者研究表明,语言表达的多样性、词汇的丰富性与在线社区中的领导者有强相关关系。

在这篇文章中,作者提出了一种新的计算模型来获取参与者对对话的影响。模型名称为Speaker Identity for Topic Segmentation 即SITS。

 模型介绍

image.png

image.png

image.png

image.png

使用最小路径假设的模型推断

image.png

image.png

image.png

image.png

image.png

普通Gibbs抽样

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png


本博客CSDN的地址为:https://blog.csdn.net/qy20115549/article/details/79970298







【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。