ACM

ACM通信

首页 / 杂志存档 / 2013年3月(第56卷第3期) / 理解视频质量对用户的影响… /全文

研究突出了

理解视频质量对用户粘性的影响

作者:Florin Dobrian, Asad Awan, Dilip Joseph, Aditya Ganjam, Jibin Zhan, Vyas Sekar, Ion Stoica, Zhang Hui
ACM通讯，2013年3月，Vol. 56 No. 3, page 91-99
10.1145/2428556.2428577
评论

认为: 打印手机应用程序 ACM数字图书馆全文(PDF) 数码版分享: 通过电子邮件发送在reddit分享在StumbleUpon分享分享到黑客新闻在推特上分享在Facebook上分享

随着视频在互联网上的传播成为主流，用户对高质量的期望也在不断提高。在这种情况下，内容提供商了解视频质量是否以及如何影响用户参与，以及如何最好地投资他们的资源来优化视频质量是至关重要的。本文是解决这些问题的第一步。我们使用一个独特的数据集，涵盖不同的内容类型，包括短视频点播(VoD)、长视频点播和流行视频内容提供商的直播内容。通过使用客户端仪器，我们可以测量质量指标，如连接时间、缓冲比、平均比特率、呈现质量和缓冲事件的速率。我们发现用于缓冲的时间百分比(缓冲比率)对所有类型内容的用户粘性影响最大。然而，这种影响的程度取决于内容类型，实时内容受到的影响最大。例如，在90分钟的实时视频活动中，缓冲率增加1%可以减少用户参与超过3分钟。

回到顶部

1.简介

如今，视频内容已经在互联网流量中占据了主导地位，几位分析师预测，这一贡献在未来几年将会增加。^1，15推动这一趋势的是内容交付成本的不断下降，以及基于订阅和广告的新商业模式的出现。最典型的例子是Netflix，它现在已经拥有2000万美国用户，Hulu每月分发超过10亿的视频。

随着互联网视频成为主流，用户对视频质量的期望大大提高;例如，在电视屏幕上观看低于“SD”质量(即480p)的内容是不可接受的。按照赫伯特·西蒙(Herbert Simon)阐述的注意力经济学的精神，视频内容的过量增加了内容提供商的责任，使其最大限度地吸引用户的注意力。¹⁸因此，系统地理解视频质量和用户参与之间的相互作用变得至关重要。这些知识可以帮助提供商更好地投资他们的网络和服务器资源，以优化真正重要的质量指标。²然而，关于视频质量对用户粘性的影响，我们在以下几个方面的理解是有限的:

糟糕的视频质量会降低用户粘性吗?减了多少?
不同的质量指标对用户粘性的影响是否不同?
质量指标的影响是否因内容类型和用户粘性的不同粒度而不同?

本文是回答这些问题的第一步。我们使用独特的数据集客户端测量获得了超过200万次的独特视频观看会话，来自受欢迎的内容提供商的超过100万名观众。利用这个数据集，我们从三个方面分析了视频质量对用户参与的影响:

不同的质量标准:我们捕获启动延迟的特征，视频编码的速率，用户经历缓冲事件的次数和频率，以及观察到的呈现给用户的视频质量。
参与的多个时间尺度:我们在两个层次上量化用户参与度:每次观看次数(即单个视频的观看次数)和每次观看次数(即特定用户所有观看次数的总和)。
不同类型的内容:我们根据视频类型和长度将数据划分为短VoD、长VoD和直播，以代表目前提供的三种主要视频内容类型。

为了识别关键质量度量并理解这些度量之间的依赖关系，我们使用了众所周知的技术，如相关性和信息获取。我们也用回归技术来增加这种定性分析来量化影响。我们的主要观察结果是

缓冲所花费的时间百分比(缓冲比率)对所有类型内容的用户粘性影响最大。然而，对于不同的内容类型，这种影响在数量上是不同的，直播内容受到的影响最大。例如，对于一款高度流行的90分钟的足球游戏，仅增加1%的缓冲比率就会导致用户粘性减少3分钟以上。
流媒体内容的平均比特率对直播内容的影响明显高于VoD内容。
质量指标不仅影响每次观看的参与度，还影响一个观众在一段时间内观看的次数。此外，加入时间对观看者级的参与有更大的影响。

这些结果对于内容提供者如何最好地利用他们的资源来最大化用户粘性具有重要的意义。降低缓冲比可以提高所有内容类型的参与性，最小化缓冲事件的速率可以提高长时间VoD和实时内容的参与性，提高平均比特率可以提高实时内容的参与性。然而，我们也应该考虑缓冲和比特率之间的权衡。我们的最终目标是利用这种测量驱动的见解，以便内容提供商、传输系统和最终用户能够客观地评估和改善互联网视频传输。我们提出的见解是实现这一愿景的微小而重要的第一步。

回到顶部

2.预赛和数据集

本节首先概述数据集是如何收集的。然后，我们将问题空间的三个维度纳入范围:用户粘性、视频质量指标和视频内容类型。

2.1.数据收集

我们已经实现了一个高度可扩展和可用的实时数据收集和处理系统。该系统由两部分组成:(a)视频播放器中的客户驻留仪表库和(b)在数据中心中运行的数据聚合和处理服务。我们的客户端库加载时，互联网用户观看视频在我们的子公司的网站，并监测细粒度的事件和播放器统计。该库收集高保真的原始数据，在客户端生成更高级别的信息，并以最小的开销实时传输这些数据。我们平均每天从不同范围的终端用户、视频内容、互联网服务提供商和内容分发网络的各种附属机构收集和处理0.5TB的数据。

视频播放器插装:图1说明在客户端观察到的视频会话的生命周期。视频播放器会经历多个状态(连接、加入、播放、暂停、缓冲、停止)。例如，如果用户按下屏幕上的暂停按钮，播放器就会进入暂停状态，或者如果视频缓冲区变为空，那么播放器就会进入缓冲状态。通过使用客户端，我们可以观察到所有玩家的状态和事件，还可以收集关于播放质量的统计数据。

2.2.粘性和质量指标

从质量上讲，粘性是用户参与和互动的反映。虽然我们可以通过多种方式定义用户粘性(例如，用户对内容的满意度或点击广告的意愿)，但在本研究中，我们主要关注两个层面上的用户粘性的客观衡量指标:

视场等级:用户连续观看单个视频是一种视图。例如，这可以是观看电影预告片，电视连续剧的一集，或一场足球比赛。兴趣的观看级粘性指标是玩耍的时间查看会话的时间。注意，我们不把流中的广告作为单独的视图来计算;它们是实际内容的一部分。
观众水平:为了获取单个观众(由一个独特的系统生成的客户ID识别的终端用户)的总体体验，我们研究每个观众的观众级参与度指标。我们使用的两个指标是浏览者观看所有视频的次数和总游戏时间。

为了完整起见，我们简要地描述了我们在本研究中使用的五个行业标准视频质量指标²：

加入时间（JoinTime):这表示从玩家开始连接到视频服务器的时间，直到足够的玩家视频缓冲区填满，玩家开始渲染视频帧并移动到播放状态的时间。在图1，这是连接状态的长度。
缓冲比率（BufRatio):这是花费在缓冲上的总会话时间(即游戏时间加上缓冲时间)的百分比。这是一个聚合指标，可以捕捉用户观察到的长视频“冻结”周期。见图1，当视频缓冲区变为空时，播放器进入缓冲状态，当缓冲区被补充时，播放器离开缓冲(回到播放状态)。
缓冲事件的速率（RateBuf)：BufRatio不能捕捉诱导中断的频率。例如，一个视频会话经历了“视频口吃”，其中每个中断都很小，但中断总数很高，可能没有高的缓冲比率，但可能对用户来说很烦人。因此，我们使用缓冲事件的速率．
平均比特率（AverageBitrate):如果4video播放器可以在不同的比特率流之间切换，单个视频会话可以有多个比特率。这种比特率适应逻辑在今天的商业玩家中得到了广泛应用。这个指标就是播放比特率的平均值，再加上播放比特率的持续时间。
渲染质量（RendQual):渲染速率(每秒帧数)是用户视觉感知的核心。这个速率可能会下降，因为CPU效应(例如，如果CPU过载，播放器可能会掉帧)或网络效应(例如，拥塞导致缓冲区变为空)。为了标准化具有不同编码帧率的视频的度量标准，我们将渲染质量定义为流每秒渲染帧与每秒编码帧的比率。

2.3.数据集

我们每周收集接近4TB的数据。平均来说，我们一周的数据捕获了超过3亿的浏览量看了1亿独立观众横跨我们所有的附属内容提供商。本文的分析是基于2010年秋季从我们的五个子公司收集的数据。这些提供商出现在最受欢迎的500强网站中，并提供大量的视频内容，因此提供了互联网视频质量和参与度的代表性观点。

我们将数据组织为三种内容类型，在每种内容类型中，我们从不同的提供者中选择两个数据集。我们选择不同的提供者是为了排除由特定提供者或他们使用的特定玩家优化和算法引起的偏差。对于直播内容，我们使用了2010年最大的体育直播赛事——国际足联世界杯的额外数据。表1总结每个数据集的独特视频和观众的数量，如下所述。为了确保我们的分析具有统计意义，我们只选择在一周内至少有1000次观看的视频。

长视频点播:长视频点播是指时长不小于35分钟，不大于60分钟的视频。它们通常是整集的电视节目。两个长VoD数据集被标记为LvodA而且LvodB．
简短的视频点播:如果视频长度为25分钟，我们将视频剪辑归类为短VoD。这些通常是预告片、短采访、短小品和新闻剪辑。两个短VoD数据集被标记为SvodA而且SvodB．
住:体育赛事和新闻推送通常以实时视频流的形式发布。vod类型的内容和直播流之间有两个关键的区别。首先，在这种情况下，客户端缓冲区的大小是这样的，观看者不会落后于视频源超过几秒钟。第二，所有的观众在时间上大致同步。这两个实时数据集被标记LiveA而且LiveB．作为一个特殊的案例研究，数据集LiveWC相当于世界杯最后三场比赛，平均每场比赛有近100万观众观看。

回到顶部

3.分析技术

在本节中，我们展示了激发我们想要回答的问题类型的初步度量，并简要描述了我们使用的分析技术。

概述:图2显示了数据集的四个质量指标的累积分布函数(CDF)LvodA．我们看到，大多数观看时段体验的质量都很好，也就是有低BufRatio、低JoinTime，且相对较高RendQual．然而，与此同时，受到质量问题困扰的浏览量也不是微不足道的BufRatio大于10%的，有5%JoinTime大于10的，37%的人有RendQual低于90%。最后，只有一小部分视图能够获得最高的比特率。考虑到大量浏览量存在质量问题，内容提供者自然想知道提高质量是否(以及提高多少)可能会潜在地增加用户粘性。

作为一个例子，我们考虑每个来自一个视频对象LiveA而且LvodA，根据质量指标分类不同的游戏环节，并计算每个分类的平均游戏时间图3而且4．这些数字直观地证实了这一点质量问题．与此同时，这些最初的可视化也引出了几个问题:

我们如何确定哪个参数最重要?
这些质量指标是独立的，还是用户粘性和质量指标M之间的观察到的关系是由于M和更关键的指标M之间隐藏的关系?
我们如何量化质量度量的重要性?
是什么导致了这些看似违反直觉的行为?例如,RendQual是负相关的(图4 (d)),而AvgBitrate显示非单调关系(图3 (c))．

为了解决前两个问题，我们使用了众所周知的相关和信息获取的概念。为了度量量化的影响，我们还使用基于线性回归的模型来进行最重要的度量。最后，我们使用特定领域的见解和控制实验来解释异常观测。接下来，我们将简要描述我们所使用的统计技术。

相关:为了避免对变量之间关系的性质作出假设，我们选择肯德尔相关而不是皮尔逊相关。肯德尔相关性是一种等级相关性，它不对潜在分布、噪声或关系的性质作出任何假设。(Pearson相关性假设数据中的噪声为高斯分布，两者关系大致为线性关系。)

给定原始数据向量(x, y)值，其中每个x所测量的质量是否以和为度量标准y对于用户粘性指标(游戏时间或浏览量)，我们是基于质量指标的价值进行划分的。我们为每个感兴趣的质量指标选择合适的bin尺寸:forJoinTime，我们使用0.5s间隔，为BufRatio而且RendQual我们用1%的箱子RateBuf我们使用0.01/min大小的垃圾箱，用于AvgBitrate我们使用20 kbps大小的容器。对于每一个类别，我们都计算了属于该类别的会话/观众的粘性度量的经验平均值。

我们计算每个仓库的平均向量和仓库指数的值之间的肯德尔相关性。我们使用这种分类相关指标有两个原因。首先，我们发现相关系数会因为大量用户拥有高质量的游戏，但却拥有较低的游戏时间而产生偏差，这可能是因为用户的兴趣较低。本文的目的并不是研究用户兴趣。相反地，我们想要了解质量是如何影响用户粘性的。为此，我们查看每个存储库的平均值，并计算存储数据的相关性。第二个原因是规模。在我们的目标分析尺度上，计算秩相关是昂贵的;二进制关联以更低的计算成本保留了定性性质。

信息增益:当变量之间的关系大致单调递增或递减时，相关性是有用的。作为图3 (c)这表明，这种说法可能站不住脚。此外，我们想要超越分析单一的质量指标。首先，我们想要了解一对(或一组)质量度量是否互补，或者它们是否捕获了相同的效果。举个例子，考虑一下RendQual在图3；RendQual可能反映网络问题或客户端CPU问题。因为BufRatio也与游戏时间，我们可能会怀疑RendQual就是镜像同样的效果。然而，识别和揭示这些隐藏的关系是乏味的。第二，内容提供商可能想知道的top-k他们应该优化的指标，以提高用户粘性。

为此，我们利用信息增益，¹⁶这是基于熵的概念。直观地说，这个指标量化了我们对变量的认识X减少另一个变量的不确定性Y；例如，知道什么是AvgBitrate或BufRatio告诉我们关于游戏时间分布呢?我们使用类似的策略来bin数据和游戏时间，我们根据内容的持续时间选择不同的bin大小。

注意，这些分析技术是互补的。相关性提供了参与度和质量之间单调关系的一阶总结。当关系不是单调时，信息增益可以证实相关性或增强相关性。此外，它扩展了我们对跨质量度量分析交互的理解。

回归:肯德尔相关性和信息增益主要是定性测量。理解量化的影响也是有用的;例如，如果我们以给定的数量改善特定的质量指标，那么用户粘性的预期增长是多少?在这里，我们依靠回归。然而，正如可视化显示的那样，质量指标和参与度之间的关系并不明显，许多指标具有内在的相关性。因此，直接应用回归技术可能没有意义。作为一种更简单、更直观的选择，我们使用线性回归来量化最关键质量度量的特定范围的影响。但是，我们只有在视觉上确认关系在这个范围内大致是线性的，以便于解释线性数据拟合之后才会这样做。

回到顶部

4.参与分析

我们首先在每次观看的层面上分析用户粘性，这是我们的兴趣指标游戏时间．我们从长视频内容开始，然后进行直播和短视频内容。在每种情况下，我们计算每个视频的binned相关和信息增益，然后查看所有视频的系数分布。确定了最关键的度量之后，我们在质量度量的特定范围内使用线性回归模型来量化改进质量的影响。

与此同时，内容提供商也想了解高质量是否能提高用户留存率，或者是否能鼓励用户尝试更多视频。因此，我们还通过考虑每个观众的观看次数和观众在1周内观看所有视频的总时间来分析观众的用户粘性。

4.1.长视频点播内容

图5的相关系数的绝对值和带符号值LvodA显示相关性的大小和性质(增加或减少)。我们总结两个数据集的中值表2并发现结果与通用质量度量是一致的BufRatio, JoinTime,RendQual，证实了我们的观察结果并非特定提供者所独有。

结果表明BufRatio有最强的相关性游戏时间．直觉上，我们的预期更高BufRatio减少游戏时间(即负相关程度越高)和越高RendQual增加游戏时间(即正相关)。图5 (b)确认关于这些关系本质的直觉。我们还注意到JoinTime对游戏持续时间影响不大。

接下来，我们使用单变量信息增益分析来证实和补充相关结果。在图6，之间的相对顺序RateBuf而且BufRatio与之相反图5．原因是大部分的概率质量在第一个bin (01%BufRatio)，这里的熵与总体分布相同(未显示)。因此，获得的信息BufRatio较低;RateBuf不受这个问题，有更高的信息增益。奇怪的是，我们看到了AvgBitrate即使它与?相关，是否有很高的信息增益游戏时间很低;我们将在本节的后面讨论这个问题。

到目前为止，我们已经单独地研究了每个质量指标。一个自然的问题是，当两个或多个指标组合在一起时，是否产生了单个指标无法提供的新见解。然而，如果度量标准本身是相互依赖的，那么情况可能就不是这样了。例如,BufRatio而且RendQual可能是相互关联的;因此知道两者是相关的游戏时间不添加新信息。因此，我们考虑了中二元相对信息增益值的分布图7．为了清晰起见，而不是显示所有组合，对于每个度量，我们包括相对信息增益最高的二元组合。我们看到和AvgBitrate提供最高的二元信息增益。尽管BufRatio, RateBuf,RendQual有很强的相关性图5在美国，把它们结合起来确实能增加信息增益，这表明它们是相互依赖的。

令人惊讶的行为AvgBitrate：我们注意到AvgBitrate在单变量和双变量分析中相关性低，但信息增益高。这与我们之前的观察有关图3．之间的关系游戏时间而且AvgBitrate不是单调;它的峰值在800到1000 Kbps之间，在这一区域的两侧都很低，并以最高的速度略微增加。由于这种非单调关系，相关性很低。

然而，知道的价值AvgBitrate可以让我们预测游戏时间因此这是非平凡的信息增益。这还没有解决低的问题游戏时间在10001600kbps波段。这个范围对应的客户端观察许多比特率开关，因为较差的网络条件引起缓冲。因此,游戏时间由于缓冲，这里的值很低，我们已经观察到这是最关键的因素。

4.2.生活内容

图8显示数据集相关系数的分布LiveA中两个数据集的中值汇总表3．我们注意到一个关键的不同LvodA结果:AvgBitrate与直播内容的相关性更强。类似于数据集LvodA, BufRatio是强相关的，而JoinTime弱相关。

无论是长视频点播还是直播内容，BufRatio是一个关键指标。有趣的是，对于直播，我们看到了这一点RateBuf有更强的负相关游戏时间．这表明Live用户比Long VoD用户对每个缓冲事件更敏感。进一步调查，我们发现长视频点播(3秒)的平均缓冲时间比实时视频点播(7秒)小得多。也就是说，在实时内容的情况下，每个缓冲事件都更具有破坏性。由于长视频点播系统的缓冲区大小较大，因此在面对链路带宽波动时，系统性能较好。此外，系统可以更主动地预测缓冲，从而通过切换到另一个服务器或切换比特率来防止它。因此，对于长视频点播，缓冲事件更少、更短。

信息增益分析再次证实了这一点AvgBitrate是一个临界指标吗JoinTime对于实时内容来说不那么重要(未显示)。双变量结果(为简单起见，未显示)模拟了与文中描述的相同的效果图7，其中与AvgBitrate拥有最大的信息收益。

令人惊讶的行为RendQual:图4 (d)显示反直觉的效果RendQual呈负相关游戏时间生活内容。以上结果为LiveA而且LiveB数据集证实，这不是一个特殊的视频，而是一个更普遍的现象。进一步调查，我们发现有很大一部分观众的渲染质量很低，但游戏时间却很长。此外，这些用户的buratio值也非常低。换句话说，这些用户看到一个下降RendQual即使没有任何网络问题，但继续观看视频。

我们假设这种效应是由用户行为和玩家优化结合而产生的。与长时间VoD观看者不同，实时视频观看者可能会在后台运行视频播放器或最小化浏览器(可能还会听评论)。在这种情况下，玩家可能会试图通过降低帧渲染速率来减少CPU消耗。为了证实这一假设，我们在一个受控设置中复制了这一行为，并发现玩家掉落了RendQual到20%。有趣的是,游戏时间高峰图4 (d)也出现在20%。这表明，这种反常的关系是由于用户在后台播放视频时进行了播放器优化。

高影响事件案例研究:内容提供商担心的一个问题是，从典型视频中观察到的情况是否可以应用于“高影响力”的事件(如奥运会)¹⁰)．为了解决这个问题，我们考虑LiveWG数据集。我们关注的是BufRatio而且AvgBitrate，这是我们在之前的讨论中观察到的实时内容的最关键指标。图9的结果LiveWC1大致匹配的结果LiveA而且LiveB．我们还确定了LiveWG2而且LiveWC3都是相同的。这些结果表明，我们的观察结果也适用于这类事件。

4.3.短视频点播内容

最后，我们考虑短视频点播类别。对于数据集SvodA而且SvodB在游戏中，玩家使用的是一组23位比特率的离散集合，不需要切换，也不需要收集缓冲事件数据。因此，我们不显示AvgBitrate(相关性在两点上没有意义)和RateBuf．表4总结两个数据集的中值。我们注意到长视频点播和短视频点播的相似之处:BufRatio而且RendQual是最关键的指标。和之前一样,JoinTime弱相关。短视频点播的信息增益结果在很大程度上反映了相关性分析的结果，我们没有展示这些结果。

4.4.定量分析

正如我们的测量结果所示，它们之间的相互作用游戏时间质量指标可能相当复杂。因此，我们避免了黑箱回归模型，并将我们的分析限制在最关键的度量(BufRatio)，只对的010%范围应用回归BufRatio在视觉上确认这是一个大致的线性关系。

我们注意到，在相同的内容类型中，线性拟合斜率的分布非常相似图10．对于长视频点播，斜率的中值为1，实时为2，对于短视频点播，斜率的中值接近于0。也就是说,BufRatio对直播的量化影响最大，其次是长播，然后是短播。图9还包括在的010%子范围上的线性数据拟合BufRatio为LiveWG数据。这些表明，在选定的子范围内，增加了1%BufRatio可以减少超过3分钟的平均游戏时间(假设游戏持续时间为90分钟)。换句话说，供应商可以通过投入资源减少用户粘性，将平均用户粘性提高3分钟以上BufRatio了1%。注意，3分钟的下降不是从90分钟的内容时间，而是从预期的观看时间，约40分钟;也就是说，用户粘性下降了约7.5%(3/40)。

4.5.查看器级别的订婚

在查看者级别，我们查看总体数量的观点而且玩耍的时间每个观众在所有对象上，不管视频的流行程度。对于每个观众，我们将不同视角的每个质量指标的平均值与这两个总参与度指标联系起来。

图11从视觉上证实了质量指标也会影响浏览量。一个有趣的观察JoinTime观看次数在115秒范围内增加，然后开始减少。我们也看到类似的效果BufRatio，其中前几个箱子的总视图更少。然而，这种效应并不会出现在总游戏时间中。我们推测这是用户兴趣的影响。许多用户质量很好，但对内容不感兴趣;他们取样内容，然后不回来就离开了。真正对内容感兴趣的用户更能容忍较长的连接时间(和缓冲)。但是，在超过某个点后(大约15秒后)，公差会下降JoinTime)．

不同数据集的相关系数值在质量上是一致的(未显示)，也与我们在视图级别观察到的趋势相似。关键的区别是JoinTime在查看级别的影响相对较小，但在查看级别的影响更明显。这具有有趣的系统设计含义。例如，提供者可能决定增加缓冲区大小以缓解缓冲区问题。但是，增加缓冲区大小可能会增加JoinTime．上述结果显示，在不评估观众层面的影响的情况下这样做，可能会降低观众再次访问网站的可能性。

回到顶部

5.相关工作

内容受欢迎:有大量关于建模内容流行程度及其对缓存的影响的文献(例如，Cheng等人，⁶Yu et al .,¹²和Huang等。¹⁴)．虽然我们对质量对用户粘性的影响的分析是正交的，但一个有趣的问题是，如果质量的影响在不同的受欢迎程度上有所不同，例如，小众内容是否更容易受到低质量的影响?

用户行为:Yu等人观察到，许多用户在“采样”一段视频后就离开了。¹²消除这种潜在的偏差是我们进行分类相关性分析的动机之一。其他研究人员研究了IPTV中的信道切换(如Cha等)。⁸)和流系统中的寻求-暂停-向前行为(例如，Costa等。⁷)．这些强调了理解用户行为的需要，从而为测量提供更好的环境，类似于我们的浏览器最小化场景。

视频传输系统的测量:研究社区从使用“黑箱”推断的部署VoD和流媒体系统的测量研究中获益良多(例如，Gill等人，⁴黑et al .,¹³和Saroiu等人。¹⁷)和“白盒”测量(例如，Chang等人，⁹阴et al .,¹⁰和Sripanidkulchai等人。¹⁹)．我们的工作遵循了测量实际部署的丰富传统。与此同时，我们已经迈出了重要的第一步，系统地分析了视频质量对用户粘性的影响。

用户感知质量:之前的工作依赖于控制用户研究来获取用户感知质量指数(例如，Gulliver和Ghinea¹¹)．我们工作的不同只是时间和规模的问题。互联网视频直到最近才被广泛采用;如今，重温用户粘性比以往任何时候都更重要。此外，我们依赖于有数百万观众的真实世界测量，而不是只有少数用户的小规模控制实验。

参与其他媒体:理解用户参与的分析也出现在其他内容交付机制中:网站加载时间对用户满意度的影响(例如，Bouch等人)。⁵)，质量指标的影响，如比特率，抖动和延迟对VoIP通话时长的影响(例如，Chen等。^3.),等等。我们的工作是朝着获得互联网视频传输的类似见解迈出的一步。

回到顶部

6.反射

本文中的发现是一个迭代过程的结果，其中包含了比我们愿意承认的更多的错误开始和误解。最后，我们总结了两个值得警惕的教训，这些教训将更广泛地应用于该量表的未来研究。

补充分析的需要:对于长时间VoD情况，我们观察到平均比特率的相关系数较弱，但单变量信息增益较高。在试图解释这种差异的过程中，我们将行为可视化。在这种情况下，相关性是弱的，因为关系不是单调的。然而，信息增益很高，因为接近自然模式的中间箱具有较低的参与性，因此在游戏时间分布上的熵较低。这个观察让我们看到了一个不同的现象，会话因为网络质量差而被迫切换速率。如果我们把自己局限在纯粹的基于相关性的分析中，我们可能会错过这种效应，并错误地推断出这一点AvgBitrate是不重要的。这突出了在处理大型数据集时使用互补分析技术中的多个视图的价值。

背景的重要性:我们的第二个经验是，虽然统计技术是优秀的工具，但需要谨慎地使用它们，我们需要将这些分析的结果与用户和系统级因素的上下文结合起来。比如，天真地对观察到的行为RendQual直播内容的质量呈负相关，这可能导致对其对用户粘性影响的错误理解。正如我们所看到的，这是用户行为和玩家优化的结果。这就强调了用特定领域的见解和对照实验来重复观察结果来支持统计分析的重要性。

回到顶部

参考文献

1.思科预测,http://blogs.cisco.com/sp/comnents/cisco_visual_networking_index_forecast_annual_update/．

2.推动在线视频的参与度。http://registration.digitallyspeaking.com/akamai/mddec10/registration.html?b=videonuze．

3.陈坤，黄志强，黄鹏，雷军。Skype用户满意度的量化分析。在SIGCOMM学报》(2006)。

4.Gill, P.， Arlitt, M.， Li, Z.， Mahanti, A. YouTube流量描述:从边缘的视角。在IMG学报》(2007)。

5.Bouch, A.， Kuchinsky, A.， Bhatti, N.质量在旁观者眼中:满足用户对互联网服务质量的要求。在气学报》(2000)。

6.程斌，刘旭，张志强，金华。一种p2p视频点播系统的测量研究。在诉讼的期间(2007)。

7.Costa, C.， Cunha, I.， Borges, A.， Ramos, C.， Rocha, M.， Almeida, J.， ribeio - neto, B.分析流媒体中的客户交互。在WWW学报》(2004)。

8.Cha, M.， Rodriguez, P.， Crowcroft, J.， Moon, S.， Amatriain, X.通过IP网络观看电视。在IMC学报》(2003)。

9.张H.，贾敏S.，王W. Zattoo网络的直播表演。在IMC学报》(2009)。

10.尹慧，刘霞，邱瑞霞，夏宁，林昌华，张慧，塞卡尔，V.，闵国光。鸟巢内部:2008年奥运会大型现场视频点播的测量。在IMC学报》(2009)。

11.格列佛，s.r.，吉尼亚，G.定义用户对分布式多媒体质量的感知。ACM反式。Multimed。第一版。通讯。:．2,4(2006年11月)。

12.于慧，郑东，赵宝英，郑伟。大规模视频点播系统的用户行为研究。在Eurosys学报》(2006)。

13.黑旭，梁超，梁军，刘勇，Ross, K.W.一种大规模P2P IPTV系统的测量研究。IEEE反式。Multimed．9(2007)。

14.黄勇，董德明，傅志军，吕建生，黄辰。一种大规模p2p点播系统的挑战、设计与分析。在SIGCOMM学报》(2003)。

15.Cho, K.， Fukuda, K.， Esaki, H.住宅用户对用户流量增长的影响和影响。在SIGCOMM学报》(2006)。

16.米切尔,T。机器学习麦格劳-希尔,1997年。

17.Saroiu, S.， Gummadi, k.p.， Dunn, r.j.， Gribble, s.d.， Levy, H.M.互联网内容传送系统分析。在OSDI学报》(2002)。

18.西蒙，H.A.为信息丰富的世界设计组织。计算机、通讯与公共利益．格林伯格主编，约翰·霍普金斯出版社。

19.Sripanidkulchai, K.， Ganjam, A.， Maggs, B.， Zhang H.用动态应用程序端点支持大规模直播应用的可行性。在SIGCOMM学报》(2004)。

回到顶部

作者

弗罗林Dobrian康维瓦，圣马特奥，加州

Asad Awan康维瓦，圣马特奥，加州

Dilip约瑟夫康维瓦，圣马特奥，加州

Aditya Ganjam康维瓦，圣马特奥，加州

Jibin詹康维瓦，圣马特奥，加州

Vyas以及Sekar纽约州立大学石溪分校

离子斯托伊卡加州大学伯克利分校，圣马特奥，加州。

回族张卡内基梅隆大学，匹兹堡，宾夕法尼亚州，康维瓦，圣马特奥，加利福尼亚州。

回到顶部

脚注

这篇论文的相同标题的原始版本发表在ACM SIGCOMM, 2011年。

回到顶部

数据

图1。视频会话生命周期和相关视频播放器事件的说明。

图2。数据集的四种质量指标的累积分布函数LvodA．

图3。四个质量指标与一个视频的播放时间之间的定性关系LvodA．

图4。四个质量指标与一个视频的播放时间之间的定性关系LiveA．

图5。质量指标与游戏时间之间肯德尔等级相关系数的分布LvodA．

图6。单变量收益在质量指标和游戏时间之间的分布LvodA．

图7。的二元(相对)信息增益分布LvodA．为了简单起见，我们只展示最佳二元组合。

图8。数据集的质量指标和游戏时间之间肯德尔等级相关系数的分布LiveA．

图9。的两个质量度量的影响LiveWC1它是2010年国际足联世界杯最后三场比赛之一。线性数据拟合显示在010%的子范围内BufRatio．

图10。CDF之间斜率的线性拟合游戏时间的010%子范围BufRatio．

图11。可视化的影响JoinTime而且BufRatio关于观看次数和播放时间的LvodA．

回到顶部

表

表1。总结我们研究的数据集。

表2。Kendall等级相关系数的中值LvodA而且LvodB．我们不展示AvgBitrate而且RateBuf为LvodB因为玩家没有切换比特率或收集缓冲事件数据。对于其余指标，结果与数据集一致LvodA．

表3。Kendall等级相关系数的中值LiveA而且LiveB．我们不展示AvgBitrate而且RateBuf因为他们没有申请LiveB．对于其余指标，结果与数据集一致LiveA．

表4。Kendall等级相关系数的中值SvodA而且SvodB．我们不展示AvgBitrate而且RateBuf因为它们在这里不适用。

回到顶部

如果您不是为了盈利或商业利益而制作或分发本作品的部分或全部，并在第一页注明本通知和完整引用，则允许您免费制作本作品的部分或全部数字或纸质副本，供个人或课堂使用。本作品的组成部分必须由ACM以外的其他人享有版权。信用文摘是允许的。以其他方式复制、重新发布、在服务器上发布或重新分发到列表，需要事先获得特定的许可和/或费用。请求发布的权限permissions@acm.org或传真(212)869-0481。

没有发现记录

理解视频质量对用户粘性的影响

1.简介

2.预赛和数据集

3.分析技术

4.参与分析

5.相关工作

6.反射

参考文献

作者

脚注

数据

表

文章内容:

谷歌强制开发人员解释数据收集

苹果对虚拟化软件的挑战

到底是为了什么?