您现在的位置是: 财经 > > 正文

AI技术助力视障人群无障碍生活 一些新创意将落地孵化

时间:2023-01-19 13:04:03 来源:界面新闻 发布者:DN032

目前我国有1700多万视力障碍人士,无论是日常生活还是出行,他们都面临着诸多难题。尤其当很多生活服务数字化之后,视障人群将遭遇更多挑战。

近年来,很多互联网科技公司都加入了助力视障群体无障碍生活的行动中,比如腾讯、百度、美团等公司旗下App均面向视障群体进行改造,让交互全部实现语音化,并且通过读屏软件让视障群体能够听懂图片、表情包等。


(资料图片)

但这还远远不够。除了使用App之外,视障人群在日常生活如购物、扫码、整理衣物等具体的场景中存在诸多不便,如何利用新技术为视障人群在更多场景中扫清障碍成为业界讨论的新话题。

在抖音集团近日举办的“AI助力视障群体”技术公益比赛上,由抖音集团产品经理、研发工程师以及清华大学、浙江大学等高校学生组成的12支队伍,分享了他们通过AI技术帮助视障人群在出行、办公、购物、美妆、游戏等不同场景下无障碍生活的创意,一些创意也代表了未来AI技术助力视障人群无障碍生活的新方向,也将可能在抖音公益的助力下孵化落地。据界面新闻了解,目前有几个创意正在申请专利中。

创意1:无障碍的创作工具

这款创作工具服务于视障群体的内容创作者。它用AI技术实现文本转图、图像编辑、色块成图等功能,支持语音交互方式,帮助视力障碍人群进行便捷创作和表达。比如图像编辑功能可实现零门槛修图,该创作工具用语音向视障创作者描述图片内容之后,如果创作者对人物服装、构图等细节不满意的话,可以通过语音发出指令,创作工具可根据指令进行细节修正。

创意2:语音二维码

这是以语音二维码为载体,构建的一种全新扫码体验,即把原来的图片二维码替换成基于空间音频的扫码方式。

语音二维码是基于深度学习技术训练出来的一个编解码系统。商家使用这个编码系统将特定二维码信息打在一个语音信号上,用户只需要拿出终端设备打开麦克风接收来自环境的语音信号,就可以完成一个解码链路。目前该方案已经能做到解码率99.99%,即使在各种噪音叠加的情况下,依然可以做到93.8%的解码准确率。

创意3:无障碍的网络购物解决方案

这是一款面向视障群体的全链路购物解决方案,主要应用于视障群体使用比较困难的直播电商场景,功能包括便利选品、一键优惠券领取,智能取换货等。

部分商品信息其实是存在于图片中,语音适配时很容易缺失这部分信息。该解决方案设计了一键听货功能,视障用户点击之后会读取抖音电商后台的商品信息等关键信息,还可以在语音提示的帮助下领取优惠券。同时,视障用户认证后可以获得一个专属的蓝丝带的头像,当他们和商家进行沟通时,系统会自动提示商家对方视障用户的身份,同时也会提醒商家不要发送图片等没有办法识别的内容。

创意4:短视频无障碍化解决方案

由于视觉元素缺失,视障用户对短视频的理解能力相对于普通用户差很多。该解决方案是为视障用户定制的短视频推荐算法,先判断视障用户对短视频的可理解性,过滤掉这些用户无法理解的视频。该解决方案通过计算视频中可以被转化音频信息来考量视频的信息密度,以判断其是否可被视障人群理解,并以此来判断是否推荐给视障用户。产品Demo在视障用户中的测试已经取得了良好的效果。

创意5:辅助视障人群化妆工具

该工具可以开发成手机App,也可以作为SDK植入到化妆镜等设备中,主要服务于女性视障人群。

视障人群无法在镜子中看到每一个妆画到脸上之后的变化,该辅助工具可以起到纠偏的作用,告诉用户眼线有没有画长,口红有没有出镜,以及化妆之后产生了什么美化效果等。产品的核心技术是一套AI的化妆算法,通过多任务的深度学习模型,再加上对人脸五官分割的能力来实现妆容纠偏的功能。在此基础上,该工具还叠加联通域分析和色彩分析,可以实现更复杂的纠偏。

(文章来源:界面新闻)

标签:

抢先读

相关文章

热文推荐

精彩放送

关于我们| 联系我们| 投稿合作| 法律声明| 广告投放

版权所有© 2011-2020  产业研究网  www.coalstudy.com

所载文章、数据仅供参考.本站不作任何非法律允许范围内服务!

联系我们:39 60 29 14 2 @qq.com

皖ICP备2022009963号-13