acm-header
登录

ACM通信

中国区域专题:大趋势

应用人工智能造福中国视障人士的实践


视障妇女使用巴士收听应用程序

信贷:微软

据中国残疾人联合会统计,目前中国有1700万视障人士,其中300万为全盲,其余为低视力人士。在过去的二十年里,中国经历了信息技术的巨大发展。传统行业正在融入信息技术,通过网站和移动应用向用户提供服务。视障人士足不出户就能获得各种服务,这是积极的技术进步;例如,他们可以在网上订购外卖,或通过基于应用程序的交通服务预约出租车。

然而,科技的发展也给中国的视障人士带来了挑战。首先,实现海量信息服务的无障碍成本是巨大的。由于视觉障碍和IT开发人员对信息可访问性的认识不足,信息可访问性本身就是一个挑战。这些因素导致很大一部分应用程序不符合可访问性标准。第二,科技的发展导致了城市化和快节奏的生活,户外环境不适合视障人士独自行走。开发技术使视障人士能够在复杂的户外环境中行走也是一项挑战。人工智能的发展为应对这些挑战创造了机会。

建立和推广中国自主的信息无障碍标准体系。这支联合力量结合了政府、大学和百度、阿里巴巴和腾讯等企业的力量。浙江大学作为联合会成员单位,率先制定了中国首个互联网信息无障碍国家标准。有四个主要原则为这个标准提供了基础:可感知性、可操作性、可理解性和健壮性。该标准包含了58个网站和移动应用程序无障碍标准术语,根据其对无障碍使用的影响、通用性和可扩展性以及技术实现难度分为三个级别。该标准可指导互联网内容提供商逐步提高可访问服务能力。这个国家标准正在与万维网联盟的网页内容可达性指南(WCAG) 2.1协调推进,中国将该标准宣传为“互联网上的触感铺路”。

uf1.jpg
数字淘宝这款应用让视障用户更容易购物。

尽管如此,由于开发人员缺乏可访问性意识,对用户真实需求了解不足,无法模拟真实的用户行为,在开发互联网产品时,达到可访问性标准仍然具有挑战性。利用人工智能、媒体计算和众包技术,位于中国杭州的浙江大学汇集了大量关于基于url聚类的网页采样算法和基于主动学习的采样算法的研究,1112障碍点检测法,7基于Web可达性评价指标(WAEM)障碍权重、评价任务分类和调度算法的自动评价系统1(见图1)、用户体验预测算法、6基于用户反馈的屏障权重优化算法,5大规模数据分析等等。图1概述了利用历史用户数据训练模型并在聚类后进行相关性分析的任务分类和调度算法。其结果是一个分配映射,基于该映射可以将任务分配给评估者,以及如何分析评估结果。

f1.jpg
图1。任务分类和调度算法概述。

图2展示了基于众包的互联网信息可及性评价体系的整体过程。该系统以较低的人工成本获得了较高的可达性评价精度,更符合视障用户的真实用户感受。在过程中加入用户的真实反馈,有助于分析不同检测项目对用户直观体验的影响,帮助评价结果尽可能符合用户的真实体验。自2012年以来,中国每年对2000多个政府网站进行评估,包括各部委、各直属机构、各部委下属的国家局和各省政府网站,都在提升中国政府的电子服务质量。

f2.jpg
图2。浙江大学基于众包的互联网信息可及性评价体系。

回到顶部

创新信息可及性交互技术

信息可达性是人机交互研究的热点。近年来,随着传感和计算技术的快速发展,研究人员探索了如何突破GUI范式的无障碍使用,创新智能化和更高层次的无障碍体验。清华大学代表着中国朝着这个方向的积极分子;特别是,它的研究工作突出了一个系统的交叉,通过咨询盲人学校确定用户需求,创新交互技术,并通过与IT公司合作将其应用到实践中。


由于开发人员缺乏可访问性意识,对用户的真实需求了解不足,无法模拟真实的用户行为,在开发互联网产品时,达到可访问性标准仍然具有挑战性。


一个很好的例子是VIPBoard,3.一种为视障用户设计的智能键盘技术。视障用户依靠音频反馈与智能手机互动。这使得现代软件键盘上的单词级自动校正算法无法使用,因为用户在听到想要的字母之前无法继续打字。研究人员运用他们在智能输入方面的经验来解决这个问题。他们迭代了一系列的解决方案,最终提出了一个字符级别的错误纠正机制,它消除了高达65%的错误,并改进了11%的文本输入。然后,通过与搜狗公司的合作,VIPBoard技术被集成到中国最大的输入法软件中,现在每天为成千上万的用户服务。同样,为了提高智能手机的可用性,研究人员提出了EarTouch,8它利用一个电容屏幕来识别和定位用户与屏幕接触的耳朵。EarTouch使用户可以单手输入内容,在公共环境中可以保护用户的隐私。EarTouch已被集成到智能屏幕阅读器中,这不仅使成千上万的视障用户受益,而且还作为一个平台,在信息可访问性方面试验新想法和创新。VIPBoard和EarTouch(如图所示图3)都获得了2019年ACM CHI(人机交互领域的领先会议)的荣誉奖。

f3.jpg
图3。(左)VIPBoard;(右)Eartouch。

除了满足智能手机的基本输入需求外,提高视障人士的文化水平对于视障人士获得更好的就业机会和提高生活质量至关重要。清华大学的研究人员认识到,创新低成本和易于使用的技术是一个突破点,这样每个视力受损的用户都可以从中受益。LightWrite9是一名智能手机上的人工智能老师,使用基于语音的描述性指导和反馈,教视障用户用专门设计的笔画书写英语字母和阿拉伯数字。它可以教用户手写字符,每个字母平均需要1.09分钟。LightWrite是一种实用的写作教学解决方案图4).

f4.jpg
图4。LightWrite系统的体系结构。

为了促进广泛阅读,研究人员专注于提供复习的支持,这是比较概念和提高理解的基本技能。设计和测试了各种导航手势和多模式反馈。最终的阅读界面提供了多个空间和时间线索,以便用户能够快速定位他们所阅读的内容。实验室实验表明,基于应用程序的多重反馈阅读器在阅读时可以达到较高的准确性和访问效率,优于价值数千美元的硬件点显示阅读器。这两种技术都显著降低了视障用户提高文化水平的成本图5).

f5.jpg
图5。读者的复习模式与设计。

回到顶部

无障碍技术的应用

浙江大学与阿里巴巴合作,研究了阅读顺序优化、图像结构理解等相关技术,帮助视障用户获取图像信息。将基于图形到序列的端到端阅读顺序技术与基于人工智能的图像结构学习算法相结合,应用于CDPF开发的屏幕阅读器中。浙江大学还参与了阿里巴巴检测平台的开发,以探索计算机和移动终端等互联网内容的快速解决方案。一些互联网商业服务,如淘宝网上购物平台和支付宝网上支付平台,已经按照国家标准进行了无障碍改造。他们优化了淘宝App的37项功能,涵盖了登录注册、产品搜索、产品购买、收货确认、维权等基础服务。据不完全统计,淘宝上有16万多家残疾人可以使用的网店,246万残疾人通过淘宝购物图6).

f6.jpg
图6。视障人士网上购物。

中国盲文图书馆、阿里巴巴集团和浙江大学已经建立了无障碍智能家居房间的范例。控制中心主要由天猫(原淘宝商城)设计的智能音箱组成,与传感器、机器人吸尘器、智能电视等30多款智能家居硬件产品相连。它改善了安全、清洁、照明、娱乐、圆形控制和厨房区域的可达性;从而使视障人士可以通过语音控制家用电器,实现无障碍生活(如图7).以阿里巴巴集团为代表的智能办公硬件企业成立了智能办公硬件无障碍联盟。31个省份的盲人学校指定并部署了一批智能办公硬件,将面部识别和协同工作技术引入特殊教育领域。在新冠肺炎疫情期间,保证了教学活动的正常进行,实现了与盲人学生及其家长的无障碍交流,实现了智能无障碍学校管理。

f7.jpg
图7。无障碍智能家居的示例房间。

21世纪以来,中国的特殊教育日益发达世纪大学从2000年之前成立的两所大学发展到今天的18所大学,其中许多仍在准备中。例如,长春大学首先提出将特殊教育融入到普通高等教育中,使特殊教育学院的学生在专业课程教学之外,也能获得与全视学生同等的文化素质教育、公共选修课程、文体活动和比赛。全纳教育不仅有利于消除残障学生对亲密关系的恐惧、自卑感和偏执感等不健康心态,还有助于残障学生接触前沿信息技术,进入一流互联网企业(见图8).

f8.jpg
图8。特殊教育的教室。

中国盲文出版社和中国科学院计算技术研究所设计了一种自动的中文和盲文双向翻译技术。传统的翻译方法需要大量的人工检查和修改,而新的翻译技术将N-Gram语言模型与短语翻译规则相结合,创建了一种改进的语言模型,既可以根据盲文分词去除无效的同音词串,又可以将上下文中的完整短语翻译成盲文。在翻译过程中,该技术利用盲文的音色来减少汉字中一些不匹配的候选字。该技术的汉译盲文正确率可达91.43%,汉译盲文正确率可达90.32%,可用于盲文图书编辑出版、盲文教材编制等实际应用。

回到顶部

前景

中国无限制技术正处于快速发展阶段,其特点是创新与实践相结合,并得到了中国残疾人联合会和技术巨头的支持。通过大学的创新和牵引,这样的技术可以尽快落地。未来,我们将在技术无障碍方面投入更多的努力,不仅要支持盲人,还要更好地支持老年人和其他有特殊需求的群体。

人工智能可以帮助视障人士融入社会,平等获取信息。在本文中,我们结合了政府、行业和学术界的力量。政府负责制定政策、规则和管理制度,发挥主导作用,利用高校和科研院所的专家和技术,完善关键技术。在开发一种新的辅助产品和将其推向市场的完整系统的背景下,工业公司了解互联网和市场是如何运作的,而政府则可以利用并将技术转化为产品,利用成熟的市场运作机制将产品和服务推向需要它们的最终用户。此外,中国还有许多特殊的用户群体,如残联、盲人联合会,这有助于确保产品和服务能够满足用户的需求。

回到顶部

参考文献

1.C L。李,王,歌曲,S。,,Z,周,F。,和Bu, j .任务分配策略crowdsourcing-based网页易访问性评估系统。在14国会议记录th面向所有人的网络会议:无障碍工作的未来。(2017)。

2.刘光、徐宏华、于昌、徐宏华、徐淑华、杨春华、王芳、宓华、石勇。触觉罗盘:使视障人士能循着一条有持续方向反馈的路径前进。在CHI 2021会议记录, 1-13。

3.石伟、于、春、范、S、王、芳、王、涛、易、X、毕、X、石、宇。VIPBoard:为视障人士改进屏幕阅读器键盘,具有字符级自动校正功能。在CHI 2019会议论文集, 517年。

4.宋淑娟,卜建军,Artmeier,石凯,王勇,于志,王聪。基于黄金极大似然推理的众包网络可达性评价。在2018年ACM人机交互会议论文集1日到21日。

5.宋松林,卜建军,王玉玉,于志,Artmeier, A.,戴丽娟,王聪。基于专家决策策略的众包系统的网页可达性评价。在2018年可访问物联网学报。

6.宋硕,卜俊杰,沈聪,Artmeier, A, Yu, Z,周强。可靠性感知的网站可达性体验度量。在2018年可访问物联网学报。

7.宋松林,王春春,李丽娟,于志,林X,卜建军:基于部分用户体验顺序的网页可达性评价指标。在14国会议记录th面向所有人的网络。可访问工作的未来。(2017)。

8.王锐、于春、杨X、何伟、石宇。EarTouch:帮助视障人士在移动和公共场景中使用智能手机。在CHI 2019会议论文集, 24岁

9.吴众、于众、徐众、魏涛、邹众、王锐、石宇。LightWrite:仅用智能手机教视障人士书写。CHI 2021会议记录1 - 15,

10.徐思、杨春春、葛伟、于春春、石宇。虚拟铺路:通过振动触觉和音频反馈,为视障人士绘制一条畅通的道路。在ACM交互会议论文集。暴徒。可穿戴无所不在技术4, 4(2020), 99:1-99:25。

11.于志,卜建军,沈春春,王伟,戴亮,周秋青,赵晨。基于多站点协同抽样的网站可达性评价。在《实习生会议录》计算机帮助有特殊需要的人。施普林格,Cham, 2020, 329-335。

12.C M。张,王,但是,J。,,Z,, Y。,,R。,和陈,一个最优的采样方法Web可访问性的量化指标。在12人会议记录thWeb for All Conf。(2015)。

回到顶部

作者

春余是中国北京清华大学的副教授。

Jiajun Bu是中国杭州浙江大学的教授。


cacm_ccbynd.gif本作品遵循创作共用署名-无衍生国际4.0许可协议。https://creativecommons.org/licenses/by-nd/4.0/

数字图书馆是由计算机协会出版的。版权所有©2021 ACM, Inc.


没有找到条目

Baidu
map