AdobeStock_209605219.jpeg
VoxEU 竞争政策

可疑的商业产品的专家审查

许多专家产品评论非盲和影响舒适的评论家和生产者之间的关系,消费者没有意识到。有偏见的评论在很大程度上是未知的缺点由于缺乏数据和小样本大小。基于独特的数据为产品长期专家评审在食品服务行业,本专栏发现评论者的利益冲突导致评级一个相当大的偏差。这怀疑非盲专家产品评论的价值不受非常严格的规则。

汽车评论家倾向于飞往遥远的目的地,他们“进入一个新的模型,吃三颗星,睡眠五颗星”,所有由制造商支付(Van Putten 2020)(据报道,特斯拉是一个异常;看到霍根2020)。电影评论家们做他们的工作而享受免费食物和住宿在花园斑点像夏威夷(Ravid et al . 2006年)。

简而言之,只要专家评审员进行他们的工作非盲,他们可能会暴露在战术生产商使用有利的评论。生产商有强烈的动机来捕获评论家的评论非常有影响力的专家(例如Ashenfelter和琼斯2013年Reinstein和斯奈德2005),旁边的其他信号(在线)等产品质量口碑(约翰斯顿et al . 2019年)。这种策略有利于评论家下降,不太可能被检测到,并可能被视为一种无害的活跃的工作。

我们对此几乎一无所知的患病率和后果的评论家和生产者之间的关系。唯一的例外是实证研究到随时可见,更多的“正式”,可能的偏见来源如广告发布的出口生产商的审查(路透社,兹特维茨2004)和媒体之间的所有权模式和生产者(德拉维尼亚和Hermle 2017)。给定一个缺乏认识不容易观察到的、非正式的关系,许多专家产品评论可能比消费者更有偏见的认识。

非盲样测试

在一篇新论文。我们提出一个教科书般的例子的偏见主要在食品服务行业专家评审(沃拉德和Van我们2021)。在这个行业的产品和服务往往经验属性,对消费者进行专家评估尤为重要。这也适用于所研究的回顾。

每年36年来,评论者评估质量的鲱鱼在许多商店和鱼站在荷兰。据当地的传统,是腌鲱鱼和冷冻保存,但否则生当。鱼贩的鲱鱼的处理是极其重要的产品很快会变质,可导致严重的食物中毒。

测试了主要新闻报道,对涉及的企业声誉影响。测试小组参观了不同样品的每年约150鱼贩子。每年小组花了大约两个星期来完成他们的旅行。专家组认为鱼质量0到10的范围,允许跨企业,以方便比较。

我们碰巧知道评委之一的利益冲突:鲱鱼的评论家隶属于一个特定的供应商,我们称之为供应商我们可以检测存在偏向企业库存的供应商,因为我们有数据在所有物品评论者的评级。

我们的数据与测试进行了最后两年,2016年和2017年。为每个292审查业务,一个详尽的清单发布产品的属性,进入评审人员的评估。我们刮数据发布插座的web页面。我们也找到了企业库存的供应商的测试。这些数据与批发商以及鱼贩子双重检查。

如果企业储备的整体评级较高的供应商比可以解释这些产品属性,然后我们解释这是偏见的证据。我们确定的假设是,评论者的评估质量完全反映在评级和语言判断个体的属性。

有偏见的评级

一次很明显企业被供应商了,出现了一个引人注目的模式。平均而言,鱼贩子储备供应商收到最后一个评级为8.2;其他企业,仅为5.5。两组的平均排名近50个不同的地方。不足为奇的是,十大特色不成比例的企业储备供应商a .最终的十大改变了一切:这些企业收到了很多媒体的关注,对销售的大的积极的影响。

评级的差异也反映了不同质量的鲱鱼。检测偏差,我们需要充分调整任何质量上的差异。为此,我们创建一个同质的样本企业。这个示例中的所有企业收到相同的临时评级。这个临时评级建立在销售点,一些自由裁量权面板(后来调整评级,如那些基于微生物条件是机械)。

在这个均匀样品,所有鲱鱼是刚做好的,极好地清洗,平均程度的成熟,并获得最高分数的言语判断味道,嗅觉、视觉外观和质地。

没有偏见在这个均匀样本企业,我们不应该看到系统更高的评级鱼贩子了评论家的鲱鱼供应商附属。这不是我们发现。

如图1所示,两组不同的评级,差异具有统计学意义。评级的差距相当于一个点,一半转化成八个地方的排名在测试。看起来小,但考虑到激烈的竞争中排名前十,它产生了重大影响。

图1不同临时评级全部样本(左)和均匀样本(右)

笔记:数量的观察:292(全样本),31(同质样本)。等级差距同质样本可能并不能反映偏差分配质量属性,如清洗质量。

调查的敏感性,我们的研究结果对编码的语言判断味道,气味、外观、质地的鲱鱼,我们要求四个人爱好鲱鱼鲱鱼的质量基于语言判断。

他们的编码是在个别情况下相似但不同。如表1所示,生成的同质样本也发现大量的评级业务储备之间的差距,而不是储备供应商a评级是0.5到0.6的差异;排名的差异,9到12的地方。显然,我们发现的差距不是一个人工制品的方式编码的面板的言论自然语言。

表1临时均匀样本的评分和排名

笔记:均匀样本大小N是均匀的所有因素,进入临时评级不同作者和编码的差异的四个评论者因为口头评判。所有评级的缺口在1%的显著水平。评级和排名并不反映可能的偏见在分配质量属性,如清洗质量。

进一步测试,我们估计的线性模型的完整样本企业的评级相关的所有产品特性进了临时评级。该模型解释了超过90%的评级的变化。此外,估计系数符合什么是知道的专家小组的方式去对他们的业务。

再一次,我们发现企业库存,供应商收到评级高于可以占到产品属性的详尽的清单。这一发现差距的评级是健壮的一系列替代模型规范,包括一个完全非参数规范。

应该注意的是,我们的结果可能只反映了一部分的偏差导致的利益冲突。我们把单个产品属性因素的评估与一个给定的总评。评论家是否歪曲企业如何在一个单独的属性,如清洗质量或他们是否向鱼贩子了供应商对自己即将到来的访问是我们不能建立事后。我们也这个问题抛在了一边,评论者可能有个人喜好的产品,没有共享的所有消费者李(2017)。

结论

基于独特的数据结合知识专家审核人的利益冲突,我们能够表明企业没有一样的评判规则。评论家的利益冲突可能被视为“的工作”是无害的。早些时候我们发现证实怀疑这个特殊的测试报告的作者之一的声音以及不满的鱼贩子,导致36年后的测试。

设置我们研究可能是独特的,因为它提供了一个机会进行这样的实证分析,包括完整的数据为一个详尽的清单的产品属性和一个像样的样本量,但我们没有理由认为,我们的设置是独特的亲密关系如何腐败的非盲产品评论专家。

偏见的专家意见很容易出现,无论是有意识的还是无意识的(戈尔丁和劳斯2000年)。如果这样的评论不受规定非常严格的规则如《消费者报告》(2020),建议消费者不要过于关注专家参与他们应该和不应该购买什么产品。

引用

琼斯Ashenfelter、O、V和G(2013),“对专家意见的需求:波尔多葡萄酒”,《红酒经济8 (3):285 - 93。

《消费者报告》(2020),“食品检测”,web页面。

德拉维尼亚S和J Hermle(2017),“利益冲突导致偏见的报道吗?电影评论的证据”,经济研究的回顾84 (4):1510 - 50。

戈尔丁C和C唤醒(2000),“编排公正:盲目的试音的女音乐家”的影响,美国经济评论90:715 - 41。

霍根,M(2020),“这就是为什么你可能不会看到任何更多的特斯拉汽车杂志上评论”,道路和跟踪,10月6日。

约翰斯顿,D, T负责J Stroebel和黄(2019),“产品采用同伴效应”,VoxEU.org, 9月18日。

李,D(2017),“专业知识和偏差的评估:证据来自美国国立卫生研究院”,美国经济杂志:应用经济学2 (2):60 - 92。

Reinstein, D和C M斯奈德(2005),“专家审查的影响对消费者对体验的需求产品:一个案例研究的电影批评家”,工业经济学杂志53 (1):27-51。

路透社、J和E兹特维茨(2004),“广告影响编辑吗?广告和偏见在金融媒体”,经济学季刊121:197 - 227。

Van Putten B (2020),“Deze汽车酩悦Elon Musk bashen, dat lukt aardig”,任职于《新鹿特丹商业报(荷兰报纸),9月2。

沃拉德、B和J C我们范(2021)“偏见的专家产品评论”,期DP16147讨论论文。

Baidu
map