Explicit Factor Models for Explainable Recommendation based on Phrase-level Sentiment Analysis总结
推荐系统
可解释推荐
情感分析
原文网盘分享:链接:https://pan.baidu.com/s/14LOyEbP3OC1rbz0Vo1s6BA
提取码:0cuc
ABSTRACT
- 现有的潜因子模型(LFM)在预测准确性表现良好,但是难以向用户解释推荐结果。
- 随着在线用户评论的不断增长,我们考虑通过提取评论中的信息用于推荐。根据评论可以了解到用户对物品的各个方面的关系程度。
- 为了能够解释推荐,同时保持较高的准确度,我们提出了显因子模型(EFM)。
INTRODUCTION
可解释推荐的作用
- 在过去几年中,研究人员发现或认为推荐系统中的解释可能非常有益。
- 通过解释系统如何工作和/或推荐产品的原因,系统变得更加透明,
- 并且有可能让用户知道系统何时出错(可审查),
- 增加用户对系统的信心或信任,
- 帮助用户做出更好(有效)和更快(效率)的决定,
- 说服用户尝试或购买(说服力),
- 或增加用户享受的轻松(满意度)。
- 已经提出了各种技术来生成解释,主要用于基于内容的推荐算法,基于邻居的算法或基于简单统计分析的算法。
- 同时,诸如矩阵分解(MF)技术的潜因子模型(LFM)由于其在一些基准数据集上的良好预测精度而受到研究界和工业界的广泛关注。
然而,基于这些算法的推荐系统在实际应用中遇到一些重要问题。
- 首先,很难知道用户如何将对项目的各种属性的判断构成单个评级,这使得难以根据用户的特定需求进行推荐。
- 其次,通常很难对项目推荐的原因给出直观的解释,甚至更难以解释为什么不推荐使用其他替代项目的项目。
- 推荐缺乏可解释性削弱了说服用户并帮助用户在实际系统中做出更好决策的能力。
- 潜因子模型,尽管预测精度很好,但是通常很难对项目推荐的原因给出直观的解释,导致缺乏解释性削弱了推荐系统说服用户和帮助用户的能力。
因此面临的选择是:
- 是选择牺牲准确性而去选择可解释的简单算法
- 还是牺牲可解释性而去选择准确的潜因子分解建模算法。
- 所以一个主要研究问题是:
- 我们能否拥有高度准确且易于解释的解决方案。
- 本文的解决思路:
- 由于越来越多的用户对产品进行评论,所以我们使用用户评论进行偏好分析。
- 我们发现不同用户倾向于评论物品的不同功能。
- 例如,一个人主要关心手机的屏幕尺寸,而另一个人可能会关注其电池寿命,尽管他们甚至可能对产品的星级评分相同。
- 从评论中提取明确的产品特征和相应的用户意见不仅有助于理解用户的不同偏好并提出更好的建议
- 而且还有助于了解特定项目的原因和方式,从而提供直观的解释。
- 根据短语级别进行情感分析提取:
- 例如,从评论文本中“提供的服务是优秀的,但电池寿命很短”,可以通过短语级情感分析提取形式(F, O, S)的条目(服务,优秀,+ 1)和(电池寿命,短,-1)。
- 其中F代表显示某些产品方面的特征词或短语,
- O代表用户选择表达对特征的态度的意见词或短语,
- 评论特征词时,S是观点词的情感,可以是正面的,也可以是负面的。
- 首先,对文本评论语料库的短语级情感分析生成情感词典,其中每个条目是(F, O, S)三元组,并且特征词一起用作显式特征空间。
- 然后,将这些特征上的用户注意力和item质量集成到统一的分解模型(即EFM)中,后者用于生成个性化的推荐和解释。
RELATED WORK
- 基于矩阵分解(MF)技术的潜在因子模型(LFM)已经获得了极大的普及,因为它们通常优于传统方法并且已经在一些基准数据集中实现了最佳性能。
- 如今的各种MF算法:
- 例如奇异值分解(SVD)
- 非负矩阵分解(NMF)
- 最大边缘矩阵分解(MMMF)
- 概率矩阵分解(PMF)
- 局部矩阵分解( LMF)
- 他们的目标是从用户项目评级矩阵中学习潜在因素,以进行评级预测,并根据这些因素生成个性化建议。
- 问题是:当我们已经知道用户关心某些特定产品特征的时候,难以根据MF的潜在特征提出建议。
- 随着用户评论的增多,我们考虑对用户评论进行情感分析,从而进行推荐。
- 情感分析可以在三个不同的层面上进行:综述/文档级别,句子级别和短语级别。
- review-level 和 sentence-level: 分析尝试将整个评论或句子的情绪分类为预定义的情绪。(正面,负面,中立)
- sentence-level:试图分析提取产品的显式特征,并基于用户用来表达对特征的态度的观点词,进一步分析用户对这些特征表达的情感倾向。构建情绪词典(F,O,S)(Feature,Opinion,Sentiment)
- 我们利用短语级情感分析来模拟用户偏好和项目表现在明确的特征/方面,以获得更详细的用户偏好建模,更准确的预测和更直观的解释。
- 利用显式特征进行推荐的一个重要优势是它能够为推荐和推荐的项目提供直观和合理的解释。
THE FRAMEWORK
- 符号解释
Sentiment Lexicon Construction
- 构建情感词典
- 首先,使用语法分析工具从文本评论中提取特征词集合F
- 然后,提取观点词集合O,并在可能的情况下与特征词进行配对,生成(F,O)
- 最后,基于优化框架对这些情感词词性进行标记,并为每队(F,O)分配情感值S,生成(F,O,S)
Feature-Opinion Pair Mapping
- 给定一个情感词典L和一段文本评论,我们生成一组特征情感(F,S)对来表示评论。
- 同时我们要判断情感对是否被否定词反转,如果被反转则情感对也要被反转。
User-Feature Attention Matrix
- 我们假设不同的用户可能关心不同的功能,他们倾向于更频繁地评论他或她特别关心的功能。
- 因此,我们构建用户特征关注矩阵X,其中每个元素测量用户关心相应产品特征/方面的程度。
- 构建user-Feature矩阵,最后使用sigmoid函数进行归一化。
Item-Feature Quality Matrix
- item特征质量矩阵Y:
- 每个元素测量相应产品特征/方面的item质量
- 我们通过item p 的所有的评论提取特征对(F,S)
- 假设item p的特征Fj被提及k次,这k次提取的Fj的平均情感是sij
- 最后进行归一化。
Integrating Explicit Implicit Feature
- 整合显式和隐式特征
- 目的:如何将这些集成到分解模型中,以获得准确的预测和可解释的建议。
- 可以像分解user-item矩阵一样,分别分解user-feature X 和item-feature Y,
- 这意味着可以基于user-feature 和item-feature 来建立user,item,feature的隐表示。
- 我们使用潜表示U1和U2分别表示,user 和item在明确的product feature上关注意程度。
- 考虑到显式特征可能无法完成解释评分,我们引入了r的潜因子 H1和H2,并且使用P=[U1,H1]和Q=[U2,H2] 来建模整体的评分矩阵A
- 当r = 0时,该模型简化为用户项目评级矩阵A上的传统潜在因子分解模型,这意味着显式特征不用于推荐。
Model Learning for EFM
- 输入:
- A:原始评分矩阵
- X:user-feature 矩阵
- Y:item-feature 矩阵
- m:用户个数
- n:item个数
- p:feature个数
- r:显因子的数量
- r’:潜因子的数量
- λx ,λy : regularization coefficients 正则化系数
Personalized Recommendation
- 基于已有的公式,我们可以生成个性化top-K推荐并提供特征解释
- 我们取用户最关注的k个item 特征进行推荐
- 其中N = max(Aij)用于重新缩放第一部分,在大多数评级系统中N = 5。
- 第一部分是基于用户ui关心的k个最重要的产品特征的用户项目相似性得分。 0≤α≤1是控制基于特征的分数和直接用户项评级之间的权衡的比例。
- 综合用户直接的评分和显因子评分进行推荐