• 收藏
  • 加入书签
添加成功
收藏成功
分享

可语音交互的老人陪护系统的设计与实现

徐雍添 杨婷婷 孙博闻 曹沥 王佳忆
  
科创媒体号
2025年286期
上海工程技术大学 管理学院 上海201620

摘要:随着我国老龄化进程加快,空巢老人数量逐年攀升,传统陪护模式面临人力不足、成本高昂等问题,而现有智能陪护产品存在操作复杂、功能单一等缺陷。为解决上述问题,本文设计并实现了一款可语音交互的老人陪护系统。系统采用分层架构设计,包括硬件层、算法层、应用层与用户界面层:硬件层集成麦克风阵列、物联网传感器及蓝牙模块,实现语音、生理数据与环境数据的采集;算法层基于端云协同模式,本地通过 JavaScript 原生 Web Speech API 实现离线语音唤醒与基础交互,云端部署深度神经网络完成复杂语义理解与情感分析;应用层构建健康监护、情感陪伴、紧急救助等模块化服务,其中健康监护模块通过蓝牙连接智能外设采集心率、血氧等数据,基于 3σ 原则实现异常分级预警,情感陪伴模块通过语音特征分析识别老人情绪并动态调整交互策略;用户界面层遵循适老化设计,采用大字体、高对比度及简化操作流程。

关键字:智慧养老;系统设计;语音交互;深度神经网络

0.引言

随着我国老龄化进程加快,空 人数量 国 65 岁 上老年人占比已达全国人口数量的15.7%[1],标志着我国已正式步入老龄化社 同时,老年群体对智能化设备的接受度逐步提升,但现有 的老人陪护系统,通过语音识别、自然语言处理等技术, 实现 人多样化需求。该系统能有效降低陪护压力,提升老人生活质量, 化越来越 重的社会现象结合前人的研究对可语音交互的老人陪护系统提出设计并做出部分实现。 对于老年陪护系统的研究具有一定的意义。

1.研究现状

目前国内吴燕等人设计了一个基于语音交互功能的可视化独居老人陪护系统,可确保老人出现紧急意外情况时得到及时的帮助[2],黄一明等人则是基于语音交互以及人体姿态识别对进行设计,该设计为独居老人提供了一定的服务[3],戴国锋等人则是以 ai 数字人的方式去对于老年人进行陪护,在一定程度上可以满足老年人对于日常生活中的情感需要[4],吴伟美等人则是依据深度学习对于老年人的陪护进行了设计,一定程度上可以满足于老年人的情感需求[5];而刘涛则是对老人终端语音通信进行了设计与实现,从而使得老年人与家人聊天时获得一定的满足感[6]。

综上所述,虽然国内对于老年人陪护具有 定的研究,但更多的仍是通过先进的技术水平去实现语音交互从而满足老人的情感需求,满足于子女对老年人情况的安心 仍有缺陷, 无法满足于患病老人的需求,同时更多的依靠与语音交互从而判断老年人现状,本文基于前人的研究设计 可将情感计算、多模态交互与个性化服务融合于老人陪护系统期望因此提高老年人的生活幸福指数,助力应对老龄化社会带来的挑战,推动老年关怀事业的发展。

2.需求性分析

2.1 功能性需求分析

可语音交互的老人陪护系统的功能需求分析需围绕老年用户的核心需求展开。首先,系统需支持自然语言交互功能,包括语音唤醒、指令识别和语义理解,例如通过关键词如“小助手”激活设备并完成健康提醒、天气查询或通话请求等任务。其次,健康监测模块需整合心率、血压等传感器数据实时追踪用户状态异常时自动推送预警至家属端应用。安全防护功能需包含跌倒检测算法通过摄像头或陀螺仪识别意外摔倒并触发紧急呼叫联系预设监护人。情感陪伴方面需内置个性化对话引擎根据用户兴趣推荐新闻、音乐或生活百科内容同时支持定时提醒用药及日程安排。系统还需兼容智能家居控制功能允许用户通过语音指令调节灯光、空调等设备。数据管理需具备本地与云端双重存储机制保障隐私并实现跨终端同步。为了更好的表述该分析,如图一所示。

图 1 功能性分析

2.2 非功能性需求分析

系统的非功能性需求分析需关注系统的性能、 人的使用需求。因此系统需具备快速响应能力从而保证语音交互从识别到 用隐私加密技术保护用户对话及其健康数据不会被泄露,从而对老年 备操作合法性、可靠性。同时需保证系统故障率低,且支持断网后系统 老年人使用习惯,采用大字体、高比对度显示及语音辅助提示,并通过误触优化降低 复杂 适应不同网络环境以提升适用范围。对于该模块的描述,则如图 2 所示。

图 2 非功能性需求分析

3.可语音交互的老人陪护系统设计

3.1 系统总体设计

可语音交互的老人陪护系统采用分层架构设计,划分为硬件层、算法层、应用层及用户界面层四个核心层级,各层级通过标准化接口实现数据交互与功能协同。硬件层集成麦克风阵列、低功耗摄像头、多类型物联网传感器及蓝牙模块,负责实时采集语音信号、环境数据及设备状态信息,通过 Wi-Fi 与蓝牙双模传输技术实现本地设备互联与数据上传;其中语音采集单元采用 3 米拾音半径设计,适配老年用户活动范围需求。算法层采用端云协同计算架构,本地端基于 JavaScript 实现轻量级语音识别模型与基础指令解析逻辑,满足离线唤醒与简单交互需求;云端部署深度神经网络模型,负责复杂语义理解、情感分析及意图推理,通过 API 网关与本地系统实现数据交互。应用层构建模块化服务体系,包含健康监护、日常提醒、情感陪伴、紧急救助四大核心模块,各模块通过服务注册与发现机制实现动态调用,其中健康监护模块整合语音特征分析与传感器数据,实现跌倒风险评估与异常状态预警功能;情感陪伴模块基于多轮对话管理算法与领域知识库,生成符合老年用户认知习惯的个性化应答内容。用户界面层遵循适老化设计规范,采用 80px + 超大字体、高对比度色彩方案与语音优先的交互逻辑,支持方言输入与简化指令模式,界面操作步骤控制在 3 步以内,显著降低老年用户学习成本。系统通过多模态数据融合引擎实现语音、图像、传感器数据的协同分析,确保服务响应延迟控制在 500ms 以内,满足实时交互需求。

3.2 语音交互子系统设计

语音交互子系统作为核心交互枢纽,采用 "硬件降噪 + 算法优化 + 场景适配" 的三层设计架构,实现自然语音指令的精准识别与拟人化反馈。硬件端配置 6 麦克风环形阵列,通过波束形成技术实现 360° 语音采集与声源定位,集成自适应噪声抑制算法,可将环境噪音抑制 30dB 以上,确保 50dB 嘈杂环境下的语音信噪比≥15dB;同时内置离线语音唤醒模块,支持 "你好小护" 默认唤醒词及自定义修改功能,唤醒灵敏度可通过语音指令调节。软件层采用改进型端到端语音识别框架,基于 Web Speech API 扩展实现方言适配,通过引入加权 CTC 损失函数提升模糊发音的识别精度,词错率控制在 8% 以内;语义理解模块结合双向 LSTM 与 CRF 模型实现意图关键词提取,构建包含 128 个老年人生活场景关键词的词表,支持同义词映射。对话管理模块设计场景化有限状态机,覆盖健康咨询、服药提醒、紧急求助等 18 类高频场景,每个场景预设 3-5条典型对话流程;情感计算单元通过分析语音基频、能量与语速特征,识别 "平静"、"焦虑"、"痛苦" 等 6 种基础情绪状态,自动调整回复语气。语音合成采用参数化合成技术,输出自然度 MOS 评分≥4.2 的女声播报,支持语速三档调节与音量自适应控制。子系统通过 JSON-RPC 2.0 协议与应用层实现数据交互,单次交互响应延迟优化至 300-500ms,满足老年用户实时沟通需求。如图 3 所示

图 3 语音交互设计图

3.3 健康监测子系统设计

健康监测子系统采用 "分布式采集 + 本地化分析 + 分级预警" 的设计架构,实现老年人健康状态的实时监护与风险干预。硬件接口层支持蓝牙 5.0 与 ZigBee 双协议,可连接智能手环、智能血压计、体温贴等外设,数据采样频率根据 设备类型动态调整,确保续航与实时性平衡。

数据处理层部署在本地边缘计算单元,采用滑动窗口算法分析生理参数趋势。异常检测模型构建基于两个核心依据:是 3σ 原则,该原则以数据均值为中心,将均值加减 3 倍标准差的范围作为正常数据区间,超出此范围的数据会被初步判定为异常;二是临床阈值,结合医学标准设定关键生理指标的安全边界。通过两者结合,可精准识别心率骤升、血氧骤降等危险事件。

预警响应机制设计三级处理流程: 级预警 (轻微异常)触发本地语音提示 级预警(中度异常)同步推送短信至家属终端,包含异常数据与建议措施; 预设紧急联系人电话并发送含定位的救助信息[7]。交互功能支持语音 测量,系统响应采用 "语音 +大屏显示" 双模态反馈,数值字体≥ x 确保可视性。数据存储采用本地 密数 与云端备份结合模式,历史数据保留周期 1 年,支持按周 / 月生成健康趋势报告。子系统采用低功耗设计,待机功耗≤ 可实现 7×24 小时不间断运行,满足全天候健康监护需求。如图 4 所示

3.4.系统安全设计

 

图 4 健康监测设计图

系统安全设计是保障老人陪护系统稳定运行与用户隐私的核心模块。在数据安全方面系统采用端到端加密技术所有语音交互与健康数据传输均通过 TLS 协议加密存储时使用 AES-256 算法确保信息防泄露与防篡改。用户身份认证集成多因素验证模块通过声纹识别结合动态口令确认操作者权限防止非授权访问。隐私保护层通过数据匿名化处理敏感信息如姓名、住址等均以脱敏形式存储并支持用户主动控制数据共享范围。硬件端设置防火墙与入侵检测功能实时监测异常行为如高频非法指令或异常网络连接可自动启动保护性断连。系统还建立权限分级机制管理员、家属与医护人员的操作权限逐层受限并通过日志审计追踪数据访问记录。最后定期对系统开展漏洞扫描与渗透测试满足医疗健康类信息系统三级等保要求确保老年人使用的安全性及合规性。

4.可语音交互的老人陪护系统实现

4.1 语音交互模块实现

图 5 语音交互示意图

语音交互模块作为系统与 链 理机制。本系统采用 J 响应效率 练优化识 词库快速提升意合成环节的柔和提+ 模式匹发出具体指令,

4.2 核心功能模块实现

系统核心功能体系围绕语音交互中枢,构建健康监护、生活服务与情感陪伴三大模块,各功能模块通过统一的事件总线实现协同联动。语音交互核心基于 JavaScript 异步事件驱动模型设计,通过封装 Web Speech API 提供统一调用接口:SpeechInterface 类负责语音识别的启动 / 停止、识别结果回调;NluProcessor 类处理自然语言理解,输出结构化的意图信息(如{intent: "medication_reminder", params: {time: "15:30", drug: "降压药"}});DialogManager 类管理对话状态,针对任务型对话实现多轮交互逻辑,系统响应延迟控制在 300-500ms 范围内,满足实时交互需求。健康监护模块采用 "终端采集 + 本地分析" 架构,通过蓝牙低功耗(BLE)连接智能手环等设备,实时获取心率、血氧、运动步数等体征数据;前端通过 JavaScript蓝牙 API 实现数据接收,经本地异常检测算法(基于 3σ 原则)分析,当检测到异常值时,立即触发三级响应机制:一级响应(轻微异常)通过语音提示 "您的心率有点快,请注意休息";二级响应(中度异常)同步推送预警信息至家属微信小程序;三级响应(严重异常)自动启动紧急呼叫流程。用药提醒功能构建闭环管理机制:系统本地存储用药计划数据库(包含药品名称、剂量、频次等信息),通过 TimerService 定时触发提醒,采用 "语音播报 + 屏幕大字提示 + 灯光闪烁" 多模态提醒方式;用户确认方式支持语音应答或物理按键触发,若 10 分钟内未收到确认,系统自动升级提醒级别,依次通过电话语音、社区服务中心联动等方式强化提醒效果。情感陪伴模块通过情感分析引擎实现智能化互动,该引擎基于用户语音特征与文本内容双重维度,识别 "孤独"、"焦虑"、"愉悦" 等基础情绪状态;当连续 3 天检测到孤独倾向时,系统自动触发情感干预流程:播放子女预存的语音留言、推送经典戏曲 / 红色歌曲等怀旧内容、启动虚拟陪伴对话,所有互动内容均支持离线缓存,确保网络不稳定时服务连续性。系统架构采用模块化设计,各功能模块通过EventBus 实现松耦合通信,核心服务均注册为 Web Worker 线程,避免复杂计算阻塞 UI 交互;本地数据存储采用 IndexedDB 实现,确保用户隐私数据、不泄露,满足数据安全要求。

4.3 系统集成测试模块

系统集成测试采用场景化验证方 块的协同工作能力,确保整体功能符合老 模拟智能手环的各类体征 建自动化测试框架, 测试用例设计覆盖 12 类 异常处理能力、设备连接失败 项任务时,CPU 占 保在不同分辨率、操作系 的测试场景中达到 改进 最终版本的系统综合合格率达 98.7%, 满足老年人使用的可靠性与易用性要求。

5.结论

本文围绕老龄化社会背景下空巢老人的陪护需求,完成了可语音交互老人陪护系统的设计、实现与测试工作,主要研究成果如下:

首先,在系统设计层面,构建了 “硬件层 算法层 - 应用层 - 用户界面层” 的分层架构,实现了多模块协同工作。硬件层通过麦克风阵列、物联网传感器等设备保障多 算法层采用端 同模式,平衡了本地离线基础交互与云端复杂语义处理的需求;应用层聚焦健康监 化服务体系;用户界面层遵循适老化设计原则,通过大字体、高对比度及简化操作,降低老年用户使用 其中语音交 子系统通过硬件降噪、算法优化及场景适配,实现了 50dB 嘈杂环境下≥92% 的唤醒词识别准确率与 ≤8 的语音识 词错率,单次交互响应延迟控制在 300-500ms,满足实时交互需求。

其次,在系统实现与测试阶段,基于 JavaScript 原生 Web Speech API 完成语音交互模块开发,避免第三方云服务依赖,同时通过蓝牙 API 实现与智能手环等外设的联动,构建了 “终端采集 - 本地分析 - 分级预警” 的健康监测机制。系统集成测试覆盖 12 类典型老年场景,验证了语音交互、数据采集、应急响应的协同性,在并发任务下 CPU 占用率≤40%、内存占用≤200MB,综合合格率达 98.7%,且断网状态下仍能运行基础功能,满足老年人使用的可靠性与稳定性要求。

最后,相较于现有研究,本系统创新融合了情感计算与多模态交互技术:通过语音特征分析识别老人情绪状态,动态调整回复语气;结合 “语音 + 屏幕 + 灯光” 多模态反馈,优化用药提醒、紧急求助等关键场景的交互体验,尤其针对患病老人的健康监测需求,实现了生理数据异常的分级预警与闭环管理,弥补了现有研究中单一依赖语音交互、难以满足特殊健康需求的不足,为智慧养老提供了可落地的技术方案。

参考文献

[1]国家统计局.2024.王萍萍:人口总量降幅收窄 人口素质持续提升.检索自 https://www.stats.gov.cn/sj/sjjd/202501/t20250117_1958337.html

[2]吴燕,李浩天,郑忠徽,等.基于语音交互的可视化独居老人陪护系统设计[J].现代信息科技,2023,7(22):5-8.

[3]黄一明,吴斌,蔡培森,等.基于语音交互与人体姿态识别的独居老人智能陪护系统[J].电子设计工程,2021,29(13):100-103+108

[4]戴国峰,赵红梅,王智慧,等.面向老年群体的情感陪护 AI 数字人系统探索与实践[J].中阿科技论坛(中英文),2025,(02):55-59

[5]吴伟美,胡建华,张军,等.基于深度学习的智能陪护系统[J].现代信息科技,2022,6(24):23-26+30.

[6]刘涛.老人陪护终端语音通信的设计与实现[D].浙江工业大学,2017.

[7]王丽娟,张俞东.基于移动终端的养老护理员工健康数据实时监测系统[J].自动化技术与应用,2024,43(05):项目来源:创新创业训练计划项目(202510856012)通讯作者:徐雍添(2004 一),男,山西晋城人;本科生;研究方向:信息管理与信息系统

*本文暂不支持打印功能

monitor