• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于图像感知与人脸识别的智能导盲系统设计

区嘉敏 蔡智谋 陈凯茵 梁泳 骆怡
  
卷宗
2023年23期
广东培正学院

摘要:本文是围绕基于图像感知与人脸识别的智能导盲系统设计进行的论文论述。该项发明的设计灵感是基于现代盲人出行所面临的困难以及对现代科技发展的思考而诞生。通过对国内外现状针对辅助盲人出行的科技产品的研发数据,盲人本身存在的不便之处,导盲系统的设计思路与技术支持进行调查与搜集,并在严谨讨论后进行分析与整理。提供可行的技术方案,为盲人助力行走。

关键词:盲人;Fast-SCNN44网络;智能化;安全

1.绪论

1.1研究背景

世界卫生组织统计全世界有盲人9000万,我国每年大约会新增45万的盲人,以及低视力人员135万,这意味着几乎每天每分钟就可能会出现1个盲人和3个低视力患者,并且我国有2.46亿人患有弱视。如果不采取有力措施,2020年我国视力残疾人数将是2013年的4倍,即将达到5000余万人[1]。有研究称,全球盲人数量在2050年将会由3600万增加到1.15亿。来自188个国家的研究数据表明,超过2亿人患有中度至重度的视力障碍。这一数字预计到2050年可能增长到超过5.5亿[2]。

为了协助盲人安全出行,提高他们的生活质量,世界各国在电子导盲系统的研制一直在努力进行。时至今日,世界上已成功研制并引用进日常生活中的电子导盲系统大体可以分为四类:超声波导盲仪、移动式机器人、穿戴式导盲仪和导引式手杖[3]。

我国盲人目前的导盲辅具普遍是普通盲杖,随着科技的快速发展,这种落后的导盲辅具已经无法满足现代化生活的需要,盲人发生交通事故的事件也屡屡发生。无论是智能导盲系统庞大的市场需求,还是落后的导盲辅具与现代化生活的矛盾,都将推动智能导盲系统的快速发展。

1.2研究现状

在国内,对于导盲科技设备的研究在整体上是落后于国外的研究。国内研究的主要方向是手杖式导盲,例如,北京理工大学研制的“导盲杖”和哈尔滨工程大学研制的室内导盲机器人。随着科学技术的不断发展与进步,人们对这类科技产品的需求已不仅只满足于工业流水线化的生产论文网,而是将更多的注意力转移到如何提高人类的生活质量上。当代机器人与科技发展的主流趋势是智能化与多元化,层出不穷的控制算法的提出与应用更为智能化提供了更多的实现方案。导盲机器人作为服务机器人的一种,在外界复杂的环境下,要想使其控制方案更加优化、行进轨迹更加合理,引入新的更先进的传感设备、控制算法以及执行机构是必然趋势。

近几年来,国外的一些公司都在人工智能这类高新技术领域的积极进行研究。例如,在导盲领域,人工智能电脑图像盲人语音APP,Lookout,就利用了安卓系统,通过一个摄像头将它周围的环境数据通过人工智能输入系统,最终向用户报告用户,更好地呈现面对它周围的东西,并能够应对环境的变化。除了谷歌公司在这个领域做研究,微软也创建了一个类似的应用——seeing AI,在Apple Store上发布,提供给ios系统用户使用。

2.盲人存在的主要问题

2.1出行上

2.1.1现在虽然有专门为盲人开发的导航软件和导盲杖,但是导航的路线十分复杂,走了多少米在转弯,这个基本上记不住,而且提示的还是东西南北,对方向感不太好的人来说,其实听了和没听差不多,脑子里也很难形成一个大致印象。

2.1.2还有就是可能导航软件提示已到达目的地附近,但事实上盲人的当前位置与目的地还存在一段距离,不能真正导航到盲人与目的地近在咫尺的状态,即当盲人导航到某早餐店时,软件提示步行导航结束,最理想的状态是,盲人一伸手就能摸到早餐店的门。

2.1.3有一些商场不允许盲人携带导盲犬,给盲人造成许多不便。

2.2生活上

2.2.1目前几乎无法实现室内导航,比如盲人独立逛商场。无法获取当前环境的具体信息(比如前方有楼梯,货架上具体有什么商品等)。

2.2.2与人沟通较困难。许多人都没有接触过盲人,如果沟通不注意很可能产生无效沟通,而且也有语言不通等问题。比如盲人问一个路人:您好,请问能帮我个忙吗?这时候有些路人可能会直接离开,如果排除他们本身有其他事情的原因之后,合理的解释就是,他们可能不知道你要做什么,可能会产生防备心理。

2.3安全上

2.3.1无法识别所来人是否为好人,遇到危险时不能自动报警。

2.3.2当盲人身体情况不好时,无法自动呼叫紧急联系人和救护车。

3.智能导盲系统设计思路

盲人辅助行走的一般方式有人工看护、导盲犬、盲道引导和手杖探路等4种。导盲犬是传统辅助工具,然而导盲犬需要专业训练,使用成本高昂,现阶段在国内很少使用且在出行时非常不便,在乘坐公共交通工具或是进入餐馆及商场容易被拒绝;人工看护需要花费大量时间,人工成本高,不适合一般家庭。根据相关调查显示,我国的盲道和传统导盲手杖的使用率很高,说明大多数盲人需要独立出行,但是盲人在车水马龙的街区中存在很多安全隐患。另外,人们对盲道重要性的认识并不普遍,因为施工、停车等原因会占用盲道,同时盲道只存在于城市公共场所的某些领域,不能满足盲人安全出行需要。传统导盲手杖存在很大局限性,通过手杖敲击地面获得路况信息,无法获取动态障碍物和红绿灯等信息,盲人在空旷平坦的十字路口也容易迷路。[4]据官方统计,我国的残障人士大约有8296万人,由于助残设备的缺失,越来越多的残障人士都不愿出现在外面,进行正常的社交。此款导盲器主张从关爱人类弱势群体的视点出发,以更高层次的理想目标推动着设计的发展与进步,使其更趋于合理、亲切、人性化。

本文研究基于图像感知与人脸识别的智能导盲的系统问题,分析导盲系统的使用要求、人脸识别功能、文字转语音的功能、自动报警功能和不同路况下的控制状态。相比于现有的导盲辅助工具,与现有的智能手杖、穿戴式设备比较优劣,如现有的导盲器具有测距的功能但也未普及,而此款设计运用多种科学技术,携带起来便捷美观,解决盲人自主避障、盲道循迹和红绿灯识别报警等问题,能够更好为盲人提供帮助,保障盲人的安全。

当盲人走在路上时,总会遇到各种各样的困难,如语言不通而导致的交流障碍、独自一人时面对没有盲文的标语的困境以及面对复杂的交通环境无法快速做出反应等。本项目针对以上问题,对导盲器做出以下创新:

3.1人脸识别功能,可录入亲属信息。

随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域,例如人脸识别门禁考勤系统、人脸识别防盗门等。最重要的是,人们更偏爱人脸识别,因为人脸识别是非侵入性的,指纹识别需要用户将手指放在传感器上,虹膜识别需要用户靠相机很近,语音识别则需要用户大声说话,同时,人脸识别能够让人脸信息被动收集,将待识别的人脸特征与数据库中的人脸特征进行对比,根据相似度来判断,如果达到一定的相似度则判断成功。

而导盲器中添加人脸识别该项技术利用了人脸追踪侦测和生物特征识别技术,用于区分形形色色的人。在人脸识别后,系统需要自动记录扫描到的人脸次数,并自动将人群分类为熟人与陌生人。系统将会设置为,熟人见面次数起码为一周10-15次,陌生人见面次数为一周1-2次。在数据将人群分类完之后,将会告诉盲人,对方是否为陌生人。并在3个月之后,系统将会自动清理只扫描到一次的数据,以保证有足够的内存。最后,当盲人遇到危险时,智能报警系统会识别出危险词,如:“救命”、“报警”等,智能报警系统将会发出警报和自动向110进行报警。

3.2可识别交通标识物。

信号灯采集模块信号灯采集模块采用OP7670摄像头,该模块体积小、工作电压低,适合嵌入式应用系统,具有标准的SCCB接口并兼容12C接口,还有一个VGA芯片用来拍摄和处理图像,允许输出8位数据,如Alpine、全帧分辨率和窗口。工作时能够以30帧/s的速度拍摄VGA图像[3]。该模块所有图像处理功能,可通过SCCB接口进行编程,并且用户也能够对图像质量、数据传输和传输格式进行控制,同时Alpine 7670模块支持人工神经网络干预下的图像处理功能,适用于智能家居、物体检测追踪和机器人导航等各种应用,所以能高精度识别红绿灯[1]。

4.智能导盲系统技术支持

4.1快速实时语义分割网络与Fast-SCNN44网络支持

基于快速实时语义分割网络,结合多种注意力机制与信息融合对分割网络进行改进,获得针对不同精度与速度需求的分割网络。制作含有地面区域类别的地面交通标志数据集,选取速度较快的分割网络完成地面交通标志的识别然后对模型输出结果进行图像后处理。将分割模型进行量化加速与多线程并行部署优化,提升了算法的运行速度。再将优化好的算法移植于NVIDIA嵌入式平台。Fast-SCNN44网络是由RudraPKPoudel于2019年提出的速度最快的语义分割双络,如图1。该网络结合了轻量化模型设计,在网络中使用了通道分离的卷积,又设计了瓶颈结构减少通道特征图数量,降低分辨率。使用金字塔池化后,通过上采样恢复分辨率,利用双分支融合浅层与深层的特征,最后经过分类层将像素点进行分类。Fast-SCNN使用了当前轻量化卷积的设计方式又通过不同层特征融合重新组合特征,在CityScapes上获得68%的精度和124FPS的速度。

4.2数据采集与DAB-Net网络支持

首先制作地面交通标志与地面类别的分割数据集,利用改进后精度最高版本的DAB-Net完成地面类别的重新标定,形成包含地面类别的数据集。选取速度最高的原始DAB-Net利用新合成的15类交通标志数据集进行训练,完成地面交通标志识别,然后再对模型的输出结果进行图像后续处理[5]。

量化加速与多线程部署优化。得到地面交通标志分割模型后,为了提升检测速度,对模型进行量化加速处理。在软件应用方面,使用5个线程,设计了多线程并行流水线结构对地面交通标志识别算法进行加速。

嵌入式设备算法移植。将完整地面交通标志算法部署于NVIDIATX2与NVIDIAXavier设备中,完成低功耗嵌入式算法的移植部署。

4.3人脸识别系统支持

以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析算法,融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景。现在可用于身份识别的高科技安检系统人脸识别系统;可以对人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大。

同时也能通过人脸识别系统检测次数

①人脸检测log等级打开

②adb shell setprop persist.vendor.fdtop.log 5

③在抓取的log中搜索关键字facedetect log中face_num的值表示检测到的人脸数,如果为0表示未检测到人脸。

5.结语

随着人工智能技术、图像感知技术、人脸识别技术和传感器技术等一系列科学技术的不断提高,人们的生活不断变化,尤其是残障人士的生活得到了很大的改善。通过人工智能科学技术进一步发展,假以时日,视力障碍人士也可以借助可穿戴式导盲系统的辅助,使得他们如正常人一样在社会中进行日常生活,减少生活中的不便,更加切身体会到社会的美好以及科技进步所带来的益处。

参考文献

[1]张立洁.写在第32个“国际盲人日”之际1.4亿人的节日:让这个世界看见你[J].三月风,2015.

[2]王彤.英国研究:全球失明人数预计到2050年增加两倍[EB/OL].https://health.huanqiu.com/article/9Ca KrnK4uhu,2017-08-04.

[3]王丽丽.电子导盲仪的发展现状与趋势[J].甘肃科技,2012(3):99-100.

[4]郭琳,符豪杰,白靖渊,杨俊杰.一种导盲轮椅智慧控制系统设计及测试[J].自动化与仪表;2023-03-22

[5]赵力瑾.基于移动云计算技术的在线翻译系统设计研究[J].电子设计工程;2021-07-05.

*本文暂不支持打印功能

monitor