ACM

ACM通信

的观点

搜索互动的机遇与挑战

瑞恩·w·怀特著
ACM通信，2018年12月，Vol. 61 No. 12, page 36-38
10.1145 / 3195180
评论

认为: 打印手机应用程序 ACM数字图书馆全文(PDF) 数码版分享: 通过电子邮件发送在reddit分享在StumbleUpon分享分享到黑客新闻在推特上分享在Facebook上分享

与搜索系统(如Web搜索引擎)交互是大多数人获取信息的主要手段。搜索提供商已经投入了数十亿美元开发搜索技术，这些技术为搜索引擎提供了动力，并在当今的许多虚拟助手(包括谷歌Assistant、亚马逊Alexa、微软Cortana等)中发挥了重要作用。几十年来，搜索为计算机科学家提供了大量的研究挑战，也为行业投资提供了非常有利可图的广告模式。考虑到搜索的巨大成功，搜索通常被认为是一个“已解决的问题”。对于事实调查和导航搜索来说，这是有一定道理的，但在面对复杂的任务和其他挑战时，例如在智能音箱等非视觉设置中呈现结果，交互模型和底层算法仍然很脆弱。¹⁵作为一个社区，我们需要在搜索交互方面进行投资，以解决更广泛的请求，拥抱新技术，并支持搜索交互中经常服务不足的“最后一英里”:任务完成。

回到顶部

搜索交互

在许多情况下，信息的检索和理解是很重要的。每天都有数以亿计的搜索请求进入搜索引擎，甚至在学校里也教授搜索技巧。搜索交互已成为情报学、信息检索和人机交互研究的热点。信息科学家研究了搜索过程中的认知和行为机制。国际关系研究人员开发了收集和查找信息的新方法，包括最近越来越多地使用机器学习。人机交互研究人员研究了与技术的交互，以开发支持诸如信息查找和意义表达等活动的接口。未来的机会很多，包括本观点讨论的三个方面:

十多年来，搜索互动一直沉浸在一场数据革命中，使用大(人口)数据¹和小(个人)数据^3.建立搜索活动模型，改善搜索体验。这使用了传统的数据源(查询、点击)，但更丰富的数据(浏览、光标、生理学、空间上下文等)正在出现，使搜索系统能够更全面地表示兴趣和意图，解锁了复杂的建模方法，如深度学习。
对搜索交互的支持主要集中在帮助搜索者构建查询和选择结果。搜索系统必须发展以支持更复杂的搜索活动，利用技术进步来满足人们对搜索能力日益增长的期望。
虚拟助手提供了与搜索系统互动的另一种方式。助手支持基本的问题回答，但很快就能更充分地理解问题语义，通过对话理解意图，并通过技能链接和技能推荐支持任务完成。

回到顶部

数据革命

在搜索相关的研究中，有三次被记录在案的“革命”:认知(针对智力过程);相关性(理解不同的相关性类型和标准);并且是交互式的(提供搜索支持和捕捉搜索者的偏好)。¹²互动革命一直持续到今天。我们也正在进行第四次革命数据革命，由记录、分析和从用户数据中学习的增强能力和兴趣驱动，包括整体和单独的。将数据挖掘和机器学习模型应用于查询点击数据，已经在排名、查询建议和搜索广告方面取得了进步，并更好地理解了搜索者、他们的活动以及他们的满意度和成功。

展望未来,搜索任务必须被视为搜寻过程中的第一流要素。会话数据仍然只用于增强单个查询^3.当重点应该放在支持端到端任务完成时。Web浏览器跟踪捕捉在线环境中的行为轨迹，可以帮助指导其他人。¹³搜索提供者可以挖掘这些活动序列来利用人群的程序性搜索知识。这些可以用于战略搜索支持，如导游，跨越整个任务，而不仅仅是今天的搜索结果提供的起点。⁴

Web搜索引擎在更好地理解查询的意图方面取得了实质性的进展，例如，识别提到的实体和常见的查询模式。它们不仅用于提高查询结果的精确度和查全率，而且还试图为最有可能的查询含义提供直接的“最佳答案”。除了查询文本，许多新的信号通过新的交互方式(如触摸和手势)以及传感器跟踪信号(包括生理、眼睛注视和运动)可用于搜索系统。光标的移动也可以被大规模收集，在没有点击数据的情况下帮助解释用户的活动。除了交互之外，搜索引擎也越来越多地使用语义数据来更好地理解文档内容。这些数据来自背景知识图和文档本身，采用公共的嵌入语义数据的形式schema.org本体和标记标准(微数据、RDFa和JSON-LD)。云服务意味着从用户和其他地方收集的数据不再局限于特定的机器或应用程序。关于搜索者的纵向数据有助于建立他们兴趣和专业知识的丰富模型。搜索个性化使用来自个人的短期和长期数据，^3.如果数据是稀疏的，它可以扩展到队列。即使是非搜索服务(例如，生产力应用程序)也可以提供数据来丰富上下文模型并提高搜索效率。例如，从电子表格中搜索“VAR”，就会发现意图是方差，而不是风险价值。其他信号，如空间背景和时间，提供了关于搜索情况的丰富信息。

大规模使用活动数据为了解人类状况提供了不可思议的潜力。虽然日志缺乏关于搜索意图、成功、经验和注意力的基本事实，但它们仍然可以帮助描述搜索行为，构建机器学习模型，并做出有意义的发现，例如，预测人群中的流感。⁶这些数据的访问权限仅限于搜索提供商，或者只能从分析公司购买，并收取大量费用，这阻碍了科学进步。为了解决这个问题，搜索提供商已经发布了有限的搜索日志数据和其他资源(例如，微软最近发布了MARCO，^一个机器阅读理解数据集)，一些研究人员广泛共享用户研究数据(这是一个令人鼓舞的趋势)。开放数据移动，例如运用服务提高数据可用性，但不包括搜索数据，至少目前还没有。

机会的丰富不应转化为复杂性的急剧增加。

在使用搜索交互数据(或任何用户数据)进行智能推断时，隐私和数据可靠性是至关重要的。必须解决用户档案的构建和对用户活动的详细监控所引发的隐私问题。系统应获得用户同意，并就所记录的内容和如何使用提供明确的解释。搜索提供商必须负责任，纠正搜索结果中的任何偏差，⁷在用户数据收集和用户抽样中。人类受到许多影响有记录活动的因素的影响¹⁴(例如，认知偏差、行为偏差、常见误解、错误信息和谣言)。这些因素会扭曲行为信号，比如排名算法中使用的点击率，从而产生“过滤气泡”。¹¹在数据收集和实验分析中必须考虑到这一点。⁵

这些经验中的许多都适用于Web搜索之外的领域。很多搜索都是特定领域的，包括法律、医疗和知识产权。即使在Web搜索中，也有不同的垂直领域(包括图像、视频、新闻)，每个领域都有自己的展示格式和交互方法(例如，图像搜索中的“无限滚动”)。垂直搜索和普通搜索之间的界限正在变得模糊，因为垂直搜索的内容渗入了普通搜索结果页面，影响了搜索互动。¹⁰

回到顶部

不断发展的能力和期望

数据可用性的进步，加上新的交互范式(如触摸、凝视、大显示、手势、语音对话)、移动计算能力(包括平板电脑、智能手机、智能手表)以及人工智能的民主化，为信息获取和使用创造了新的机会。搜索者现在可以以更轻量、更自然的方式与搜索系统交互，⁷包括在执行非搜索任务时。信息可视化工具，如Microsoft SandDance^b帮助人们探索和理解数据，建立在先前的可视化人机交互研究的基础上。²机器学习的进步在对话智能和问题回答方面取得了重大进展。近场和远场语音识别的改进，加上新的对话研究，使对话搜索变得可行。即使在当前的交互范式中，深入理解查询和文档语义也可以帮助提供更智能的响应;例如谷歌上的医学症状答案和Bing上的多角度答案。

智能手机和平板电脑等移动设备功能强大，用途广泛。集成了加速计、陀螺仪和接近传感器等硬件，提供了关于用户活动的丰富上下文信号，这对搜索和推荐很有用。来自自我报告和日志分析的证据表明，人们现在在更多的情况下需要搜索支持来解决各种各样的问题(或争论!)，问题的复杂性继续上升。跨越设备的复杂任务也更加频繁。搜索系统可以利用任务活动之间的停机时间来执行“慢搜索”，例如，查找一组相关资源或使用众包来组合答案。

可穿戴和增强现实应用程序支持及时展示相关信息，预期其使用。可听设备(如谷歌Pixel Buds)或头戴显示器(如谷歌Glass、微软HoloLens)等硬件可以在任何设置下提供连续的信息访问。对于某些任务(例如，监视活动)，可以主动提供相关信息，利用用户偏好和位置等信号。积极主动的通知需要谨慎管理，隐私必须得到尊重，包括任何配置个人的隐私。

机会的丰富不应转化为复杂性的急剧增加。谷歌接口设计的流行意味着搜索者希望简单，这是正确的:搜索活动已经足够复杂了。任何新功能都必须是直观的、简单的，并增加明确的价值。

回到顶部

虚拟助手

与虚拟助手(如Amazon Alexa、谷歌Assistant或Microsoft Cortana)的集成允许搜索系统扩展其功能，以更好地理解需求，并支持更高阶的搜索活动，如学习、决策和行动。⁹搜索引擎可以为虚拟助手提供一个入口点，当搜索请求需要额外的参与(例如，非导航)。搜索技术已经为一些虚拟助手提供了动力，而为信息查找而创建的知识库在这里也发挥了作用。端到端任务完成(即从搜索交互到物理世界中的操作)一直以来都不被搜索引擎所重视。这可以通过虚拟助理中的第一和第三方技能来实现。最适合当前环境的技能可以由助手推荐，甚至链接在一起以支持多阶段任务。

虚拟助手特别适合支持搜索交互:它们是个性化的和上下文相关的，它们支持对话，而且它们无处不在(跨应用程序和设备)。深刻理解搜索者和他们的上下文是必要的，以适应系统的响应情况。包括多回合对话框在内的自然交互，使搜索系统能够明确搜索者的需求。对话搜索已经引起了人们的极大兴趣。⁸除了可用性之外，泛在性还有其他优点，即更丰富的数据支持复杂的推断，如自动检测任务完成或估计任务持续时间，以及支持快速恢复任务。

尽管有这样的承诺，搜索助手的整合也不是没有挑战，需要重新考虑搜索交互的几个方面。例如，虽然虚拟助理可以促进对话，但自然语言对话可能是获取答案或完成任务的低效方式。虚拟助手通常出现在无头设备中，如智能扬声器和个人音频，这使得结果列表交流或发现助手功能变得困难。¹⁶此外，传统的搜索广告模式依赖于视觉关注，不能很好地适应只有声音的设置。

回到顶部

展望未来

我们刚刚开始了一段旅程，通过与搜索系统的互动，我们进入了一个更加开明的社会。展望未来，搜索交互的数据革命将加快步伐，搜索者将以新的方式与搜索系统互动，虚拟助手将成为全面的搜索伙伴。在这些和其他支柱的基础上，搜索系统将赋予人们权力，并支持他们重视的活动。这一重要的努力只有在计算机科学内外的专业知识、协作和社区的承诺下才能成功。

回到顶部

参考文献

1.Agichtein, E.， Brill, E.和Dumais, S.通过整合用户行为信息来提高网页搜索排名。在29年的会议记录^th信息检索研究与发展的年度国际ACM SIGIR会议, 2006, 1926。

2.Ahlberg, C.， Williamson, C.和Shneiderman, B.信息探索的动态查询:一种实现和评估。在计算机系统人为因素SIGCHI会议论文集(1992), 619626。

3.Bennett, P.N.等人。建模短期和长期行为对搜索个性化的影响。在35年的会议记录^th信息检索研究与发展国际ACM SIGIR会议, 2012, 185194。

4.正如我们所想的那样。大西洋月刊/101108年(1945年1月)。

5.Eckles, D.， Karrer, B.和Ugander, J.网络实验的设计和分析:减少干扰的偏差。因果推理杂志1(2017年1月)。

6.J. Ginsberg等。使用搜索引擎查询数据检测流感流行。大自然457年， 7232，(2009)， 10121014。

7.在职业图像搜索结果中的不平等表征和性别刻板印象。在三十三届会议的会议记录^{理查德·道金斯}计算机系统中的人为因素年ACM会议, 2015, 38193828。

8.赫斯特,硕士“自然”搜索用户界面。Commun。ACM 54， 11(2011年11月)，6067。

9.探索性搜索:从发现到理解。Commun。ACM 49， 4(2006年4月)，4146。

10.Metrikov, P.等。整个页面优化:页面元素如何与位置拍卖交互。在15年的会议记录^th美国计算机学会经济与计算会议。ACM、583600、2014。

11.Pariser E。《过滤气泡:新的个性化网络如何改变我们的阅读和思考方式》企鹅，纽约，纽约，2011年。

12.罗伯逊，S.E.和Hancock-Beaulieu, M.M.论红外系统的评价。信息处理与管理， 4(1992年4月)，457466。

13.怀特，r.w.，比连科，M.和库塞赞，S.研究使用热门目的地来增强网络搜索的交互性。在30年会议纪要^th信息检索研究与发展的年度国际ACM SIGIR会议。ACM、159166、2007。

14.网络搜索中的信念和偏见。在36年会议纪要^th信息检索研究与发展国际ACM SIGIR会议， acm, 312, 2013。

15.白色,前作空。与搜索系统的交互。剑桥大学出版社，纽约，纽约，2016。

16.虚拟助理的技能发现。Commun。ACM 61， 11(2018年11月)，108115。

回到顶部

作者

Ryen w .白（ryenw@microsoft.com)是美国华盛顿州雷德蒙德微软人工智能研究院的合作研究员和研究经理。

回到顶部

脚注

一个。http://www.msmarco.org/

b。https://www.sanddance.ms/

版权作者。
向所有者/作者请求(重新)发布许可

没有发现记录

搜索互动的机遇与挑战

搜索交互

数据革命

不断发展的能力和期望

虚拟助手

展望未来

参考文献

作者

脚注

文章内容:

过滤为美

关于著名的DARPA红气球挑战赛

数字转型项目中遗产现代化的混合模型