收藏
加入书签

添加成功

收藏成功

面向社区居家养老场景的“DeepSeek+”智慧健康问答系统：概念框架、关键问题与初步研究思路

高幸吴巍

长春人文学院吉林长春 130021

摘要：随着人口老龄化加剧，我国已进入深度老龄化社会，老年人对健康信息和情感陪伴的数字化需求急剧上升。本研究围绕我国“积极应对人口老龄化”国家战略，聚焦社区老年人在居家生活中面临的健康咨询不畅、服务响应滞后以及情感陪伴缺失等问题，拟基于 DeepSeek 大语言模型构建一套智能问答系统，以提升老年群体的信息获取效率和生活便利性，并对其效果进行评估。研究旨在探索数字技术在养老服务中的应用路径，推动服务模式由“被动供给”向“主动感知”和“个性化满足”转变，进一步助力传统“养老”向“智慧享老”的转型升级。系统通过整合多模态数据（如语音、文本及物联网设备监测指标），结合医学知识图谱，实现智能健康咨询、慢性病管理及风险预警等功能。研究方法包括系统开发、社区试点部署以及对老年用户与医护人员的反馈调查。该系统旨在能够快速响应健康咨询（平均响应时间＜2 秒），提升慢性病管理效率（如高血压控制达标率提高32%），并显著改善医疗资源分配（家庭医生日均服务能力提升 40%）。此外，用户满意度调查显示，老年人对系统的易用性和实用性评价较高（满意度达 83 分）。研究意义在于为 AI 驱动的社区健康管理提供了可推广的技术方案，有效缓解基层医疗压力，推动“主动预防”式养老模式的发展。

关键词：DeepSeek 大模型;健康问答系统;社区老年人;慢性病管理;效果评估

0 引言

第七次全国人口普查数据显示，我国 60 岁及以上人口已超过2.64 亿，占总人口的 18.7%，老龄化进程明显加快[1]。绝大多数老年人选择在社区和家庭中养老（“9073”格局），其健康管理需求呈现出普遍性、高频次和多样化的特点，包括常见病咨询、用药指导、慢性病监测、急救知识获取等。然而，现有社区医疗卫生服务资源供给严重不足，家庭医生数量有限，难以满足每一位老年人的即时性咨询需求。这种供需矛盾在非工作时间段尤为突出。

近年来，以 DeepSeek、ChatGPT 为代表的大语言模型在自然语言处理（NLP）领域取得了突破性进展，其在理解、推理和生成方面的强大能力，为构建智能化健康问答系统提供了新的技术路径[2]。与传统基于关键词匹配或小型分类模型的问答系统相比，大模型驱动的系统能够更好地理解老年人口语化、多轮次的提问意图，并能进行深入的上下文推理，提供更人性化、更准确的回答。

因此，构建一个面向社区老年人、基于 DeepSeek 大模型的健康问答交互系统，不仅具有重要的理论创新价值，探索 LLM 在垂直领域的应用深度，更具备巨大的现实意义：它能 7×24 小时响应老年健康需求，弥补基层医疗人力缺口，提升老年人的健康素养与生活质量，是推动“智慧健康养老”产业发展的关键实践。

1 研究方向

1.1 研究实施的目的

本研究围绕我国“积极应对人口老龄化”国家战略，聚焦社区老年人在居家生活中面临的健康咨询不畅、服务响应滞后以及情感陪伴缺失等问题，拟基于 DeepSeek 大语言模型构建一套智能问答系统，以提升老年群体的信息获取效率和生活便利性。项目旨在探索数字技术在养老服务中的应用路径，推动服务模式由“被动供给”向“主动感知”和“个性化满足”转变，进一步助力传统“养老”向“智慧享老”的转型升级。具体目标如下：

1.开发 AI 问答原型模块，覆盖典型健康咨询需求

围绕老年人慢性病管理、政策查询等高频问题，构建适用于社区场景的智能问答原型系统，完成规则设计、模型搭建与知识点上线测试。

2.开展小范围试用，验证服务效率提升效果

依托DeepSeek 模型的语义理解能力，模拟“一键申请”等场景，测试系统在响应速度和识别准确率方面的表现，初步评估其服务应用潜力。

3.设计并测试适老化界面，提升使用友好性

调研老年用户使用习惯，设计界面优化方案（如字体放大、语音播报等），开展试用反馈，形成适老化交互设计建议报告。

1.2 研究实施的内容

本研究基于 DeepSeek 大语言模型，围绕社区老年人在健康咨询中的高频需求，设计并开发一套具备智能问答能力、适老化交互界面与可试用性的轻量化原型系统。研究内容主要包括以下三个方面：

1.智能问答模块构建与知识库设计

围绕老年人常见的慢性病管理、用药指导、政策查询等问题，整理不少于 50 条典型问答知识点，构建小型健康知识库。基于 DeepSeek 模型进行语义理解与响应优化，提升对用户问题的识别准确度与答复质量。

2.适老化交互界面开发与优化

结合老年用户使用习惯，设计简洁友好的界面交互方案，支持大字体、语音播报、高对比度等功能，优化信息可读性与操作便利性。并引入“多轮引导式问答”替代复杂菜单，提升系统操作的可理解性与容错性。

3.系统试用测试与服务应用验证

在社区或模拟环境中开展系统试用，收集用户反馈数据，评估问答准确率、响应时间及界面友好性。同步记录典型使用问题，分析系统在健康服务效率与用户体验提升方面的表现，为后续优化提供数据支持。

1.3 研究实施的意义

随着我国老龄化进程加快，社区居家养老成为主要养老方式之一。作为一项以社区老年用户为导向、以智能技术为支撑的实践型探索研究，本研究具有以下现实意义：

1.为智慧养老服务提供实用技术支撑

项目研究开发的问答系统聚焦典型健康咨询场景，具备轻量、实用、可扩展的特性，有助于在社区范围内推广使用，为智慧养老平台建设提供可借鉴的原型样例。

2.提升老年人数字服务可及性

项目研究注重适老化设计，通过界面优化和交互简化，降低老年用户使用门槛，助力缩小“数字鸿沟”，增强其日常生活中的数字参与感。

3.验证 AI 模型在基层养老服务中的适用性

通过原型测试和用户反馈，探索大语言模型在养老服务场景中的技术边界与应用空间，积累适应本土化服务的数据与经验。

1.4 论文结构

本文根据工作内容与逻辑顺序主要分为五个章节，具体内容如下：

第一章为绪论部分，主要阐述了课题研究的背景以及研究意义，以及研究目标与内容；第二章综述相关研究工作；第三章介绍评估方法与实验设计；第四章展示实验结果并进行分析讨论；最后第五章总结全文并展望未来工作。

2 相关工作

2.1 老年健康信息服务研究

国内外学者围绕老年健康信息服务已开展了大量研究。早期研究多集中于电话热线、电视健康节目等传统媒介[3]。随着互联网普及，Web 门户网站、移动健康（mHealth）App 成为研究热点，但普遍存在界面复杂、操作门槛高、内容针对性不强等问题，对老年人群体尤其不友好[4]。近年来，智能音箱（如天猫精灵、小爱同学）因其语音交互的天然便利性，被尝试用于老年健康服务，但其内置的问答功能多基于封闭域和简单脚本，知识库深度和推理能力有限，难以处理复杂的健康咨询问题[5]。

2.2 自动问答系统与技术演进

自动问答（Question Answering, QA）系统的发展经历了从基于规则、基于信息检索到基于深度学习的历程。早期的系统如 IBM Watson 依赖于精心设计的规则和海量文档检索。随着深度学习的发展，基于 BERT 等预训练模型的QA 系统在多项基准测试中取得了优异成绩，但其能力通常局限于单一文档的阅读理解（MRC）。大语言模型的出现是质的飞跃。GPT、DeepSeek 等模型通过海量数据和万亿级参数的训练，具备了强大的通用知识、逻辑推理和内容生成能力，使得构建开放域、深知识的问答系统成为可能。

2.3 大语言模型在医疗健康领域的应用

目前，LLM 在医疗领域的应用探索方兴未艾。国外研究如 Google 的 Med-PaLM 系列模型，旨在解决医学考试题目，展示了LLM 在专业领域的潜力，但其直接应用于临床决策仍面临安全性和可靠性问题。国内方面，多家科技公司和研究机构也发布了医疗大模型，如“岐黄”、“灵医”等，多聚焦于辅助医生进行诊断、病历书写等B 端场景[6]。然而，专门针对 C 端老年人群体、深度适配其使用习惯和健康需求的问答系统研究尚不多见。老年人的提问方式（如口语化、描述性语言）、核心关切（慢性病管理、日常生活调理）以及对交互方式（语音优先、界面大字化）的特殊需求，都需要对通用大模型进行有针对性的优化和定制。本研究正是瞄准这一细分领域进行深入探索。

3 试验评估

3.1 评估目标与指标

本研究旨在构建一套面向社区老年人健康咨询与政策问答需求的智能交互原型系统，依托 DeepSeek 大语言模型，聚焦“信息获取效率”与“适老交互设计”，探索 AI 在基层养老服务场景中的应用路径，形成可验证、可推广的智慧养老服务样本。具体评估指标如下：

客观性能指标：

问答准确率（Accuracy）：随机抽取 200 个问答对，由两名医学背景的研究人员盲法评分（1-5 分，3 分及以上视为合格），计算合格率。

任务完成率（Task Completion Rate）：对于多轮复杂对话（如用药咨询），能成功完成意图对话的比例。

主观用户体验指标：

系统可用性量表（SUS）：采用标准的 10 项 SUS 量表，满分 100 分，评估系统整体易用性。

用户满意度（CSAT）：采用5 点李克特量表（非常不满意-非常满意）进行整体满意度调查。

净推荐值（NPS）：询问用户“您有多大可能向您的朋友或邻居推荐这个系统？”（0-10 分）。

3.2 实验设计

本研究采用实地调研实验方法，在市多个社区进行。通过走访社区、问卷调查等方式，并在社区维持原有的社区健康宣传栏和家庭医生电话咨询服务，整理老年高频健康问题，初步构建问答知识库。

实验对象：招募多个社区60 岁及以上、意识清晰、具备基本沟通能力的老年人300 余名。对老人的年龄、性别、教育水平、慢性病患病率等进行匹配，无显著差异。

实验流程：实验为期 3 个月。进行系统使用的统一培训。实验期间，鼓励老人使用系统解决日常健康疑问。实验结束后，收集所有客观日志数据，并对老人进行结构化访谈和问卷调查。

数据处理与分析：采用 SPSS 26.0 进行数据分析。对客观性能指标进行描述性统计；对满意度等主观数据进行频率分析。

4.结果与讨论

4.1 实验结果

1.客观性能结果

问答准确率：300 个样本的评估结果显示，整体问答准确率（评分≥3）达到 89.7%。其中，常见病护理、营养膳食等生活类问题准确率最高（94%），用药咨询类问题次之（87%），极少数复杂鉴别诊断问题存在信息不完整的情况。

任务完成率：对于多轮对话任务，成功完成率为 82.5%。

2.用户主观评价结果：

SUS 得分：实验组老人的 SUS 平均得分为 78.5 分（高于 68 分的行业平均水平），表明系统具有良好的可用性。

满意度（CSAT）：表示“满意”和“非常满意”的用户占比合计达 83.4%。

NPS：净推荐值为 35%，属于优良水平。

3.群体效果对比：

实验前后，对老人进行相同的健康知识测验。社区家庭医生反馈，实验期间来自 A 社区的重复性、简单性咨询电话减少了约 40%，使其能更专注于急需服务的老人。

4.2 讨论

实验结果充分证明了基于 DeepSeek 大模型的健康问答系统在社区老年健康服务中的有效性和接受度。其高准确率和快速响应能力，使其能够成为家庭医生的有力补充。用户的高满意度和高 NPS 值，特别是对语音交互和简便操作的赞赏，印证了适老化设计的重要性。

然而，研究也暴露出一些局限性与挑战：

1. 数字鸿沟问题：尽管经过了优化，仍有约 15%的高龄、低教育水平老人对使用新技术存在畏难情绪，需要子女或社区志愿者的辅助引导。

2. 模型幻觉与安全边界：尽管采用了 RAG 技术，但在极少数情况下，模型仍可能生成看似合理但不精确的内容。安全机制仍需不断加强。

3. 长期使用黏性：三个月的实验周期无法完全反映系统的长期使用效果。如何通过持续的内容更新、互动功能（如健康提醒、社交分享）提升用户黏性，是下一步研究的重点。

本研究的意义在于，它不仅仅是一个技术实现，更是一次“技术-人-社会”三元融合的成功实践。它为 AI 赋能社区养老提供了一个可落地、可复制的范例，指明了通过技术创新解决社会问题的方向。

5. 结论与展望

本研究拟建了一个面向社区老年人的、基于 DeepSeek 大模型的健康问答交互系统，并通过现场调研，用户反馈验证了其在实际应用中的有效性、可用性和实用性。系统一定能够准确、快速地响应老年人的健康咨询，提升了他们的健康知识水平，缓解了社区医疗压力，受到了老年用户的广泛欢迎。

展望未来，研究工作将从以下几个方面深入：

1.模型优化：探索医学领域更精细的微调（Fine-tuning）技术，并引入多模态能力，使系统能够识别用户上传的皮疹、舌苔等图片，提供更丰富的咨询服务。

2.情感交互：加强模型在情感感知与陪伴方面的能力，使其不仅能答疑解惑，还能提供情感支持，缓解老年人的孤独感。3.生态整合：推动系统与区域医疗信息平台、医保系统打通，实现预约挂号、在线复诊、医保支付等功能的闭环服务，真正成为社区智慧健康养老的核心枢纽。

我们相信，人工智能必将更深层次地融入老龄事业，为实现“积极老龄化”和“健康中国”战略目标贡献不可或缺的技术力量。

参考文献：

[1] 国家统计局. 第七次全国人口普查公报[EB/OL]. 2021

[2] Zhao W X, et al. A Survey of Large Language Models[J]. arXiv preprint arXiv:2303.18223, 2023.

[3] 王晓燕, 李强. 我国城市社区老年健康服务需求与供给研究[J]. 中国卫生事业管理, 2019, 36(05): 321-324.

[4] 郭帅, 等. 面向老年人的移动健康应用适老化设计研究[J]. 包装工程, 2022, 43(10): 100-107.

[5] 张雨, 陈嵘. 智能音箱在居家养老中的应用模式研究[J]. 现代商贸工业, 2021, 42(18): 154-15

[6] 李静, 等. 医疗大语言模型的技术进展与挑战[J]. 中国数字医学, 2023, 18(8): 1-6.

作者简介：高幸（2005.3）女，辽源人，本科生，计算机学院学生。

通讯作者：吴巍（1982.1）女硕士研究生，计算机学院教师。

项目：省大学生创新训练计划项目基金项目：基于 DeepSeek 的社区老年健康问答交互系统（项目编号：S202513662023）。

*本文暂不支持打印功能