- 收藏
- 加入书签
数字化背景下泰安市老年康养旅游数据库构建研究
摘 要:本文立足于数字化的时代背景,分析在数字化背景下建设泰安市旅游资源数据库的必要性,介绍了python网络爬虫的相关知识,运用Requestes和Parsel爬取数据并解析数据内容,并利用Matplotlib、WordCloud和Jieba对数据进行分析,可视化地呈现分析结果,使用phpMyAdmin软件进行数据库的创建管理。
关键词:python;网络爬虫;数据库;可视化分析
1.概述
1.1泰安市老年康养旅游数据库构建必要性
随着我国老龄化程度的加深,老年旅游业据有广阔的市场前景,康养旅游已成为我国旅游发展的新方向。构建泰安市旅游数据库,以老年人群康养旅游为目标市场,改善老年人旅游需求和情感诉求与市场供给不对等的状况。将旅游研究与人口老龄化相结合,把握老年市场需求,为“积极老龄化”在旅游市场中的实践提供理论指导。
1.2泰安市老年康养旅游数据库构建的意义
数字化背景下泰安市老年康养旅游数据库的构建,将旅游业、养老业、康养文化业、休闲体育业、交通运输业等多产业融合,打造了一条涵盖食住行游娱购的上下游产业链。缓解老龄化背景下老年孤独和养老负担,对促进泰安市养老事业及老年康养旅游发展,具有重要的实践意义。
2.相关概念
2.1python语言
Python语言是一种将解释性、编译性、交互性和面向对象相结合的高级程序设计语言,具有高效、易读、易易扩展等特点。Python自带类型丰富的标准库同时还拥有大量的第三方库,其独特的语法结构让使用者易学易上手,不必拘泥于繁琐的语法规则。
2.2网络爬虫
网络爬虫是根据一定规则,自动抓取万维网信息的程序或脚本,爬虫的内容包括文字、图片、视频等多种资料。爬虫的类型大致分为通用型爬虫、聚焦型爬虫、增量型爬虫、深度网络型爬虫等。
2.3PhpMyAdmin
PhpMyAdmin是一款Web-Base模式架构的MySQL数据库管理工具,其特点是让管理者可以通过Web的方式控制和操作MySQL数据库,直观简洁的交互界面,同时支持远程数据库管理。
3.数据来源及获取
3.1数据来源及特点
文本选取市场认可度较高的热门旅游网站,携程网与去哪儿网。通过对网页研究,爬取携程网泰安景区热度评分数据、点评评分数据以及评论数量等内容,爬取去哪网泰安市景区月销量数据、月销额数据等数据进行可视化分析,爬取去哪儿网泰安市景点资源、美食资源、酒店资源、购物资源、交通方式、娱乐资源为数据库构建提供内容支撑。
3.2数据获取
数据爬取主要通过Python爬虫技术来实现,Python架构主要由5个部分组成,分别是调度器、URL管理器、WEB下载器、WEB解析器和待爬取数据。首先明确需要爬取的网站和内容,正确地获取并输入URL,分析网页是否为动态网页,若为动态网页需要对URL进一步分析;使用python第三方数据库Requests库向指定的URL发送请求,获取想要爬取的数据页面的相应信息,目标服务器返回响应;使用parsel库进行数据解析,提取需要的数据内容,通过CSS选择器对元素进行定位依次访问目标数据标签获取内容;使用CSV模块将数据以 CSV格式读取和写入表格数据,将数据存入Excel表格;对数据进行清洗去除无效数据。
4.数据可视化
本文数据可视化分析通过Matplotlib、Wordcloud、Jieba、实现,Matplotlib是Python提供数据绘图功能的第三方库,其Pyplot字库主要用于实现绘制各种数据展示图形。
4.1景区词云分析
词云是目前流行的可视化方法,对文本数据中出现频率不同的“关键词”通过颜色、大小的渲染,词条在词云图片中所占区域的大小代表了出现频率的高低,在视觉上突出表现,形成关键词渲染,从而使用户通过关键词就能了解到文本的主题。使用jieba、Matplotlib、Wordcloud等库提取所爬取数据中的高频率分词,绘制画布导入词云的背景图生成词云。通过对“去哪儿网”泰安市景点简介进行词云图制作分析,“泰山”、“岱庙、“碑”、“建筑”等词体现泰安是极富文化底蕴的城市,以泰山文化为重要内容,其词云如图1所示。
4.2景区热度评分分析
景点热度是指在一定时间内,以用户的分享、广告的宣传等方式,使得该景点受人们关注的程度。一般而言,游客越多该景点的热度值越高,通过对携程网泰安市景区热度评分爬取分析得到,热度评分Top10景点排名如图2所示。
4.3景区点评评分分析
携程网用户点评评分是根据游客发布的游后评价计算得出,包括五个维度:不佳—一般—不错—满意—超棒,分为四个方面,总体评分、景色评分、趣味评分和性价比评分,此处爬取的数据为总体评分,通过分析得到用户点评评分Top10景点排名如图3所示。
4.4景区月销量与月销额分析
门票的月销量是指在一个月内售出的门票张数,月销额是指在一个月内售出的门票张数与单价的乘积,通过分析发现在月销量与月销额中,泰山景区皆居于首位且遥遥领先,泰安市“去哪儿网”月销量与月销额 Top10 景区排名如图 4 和图 5 所示。
5.康养数据库实现
5.1康养数据集成体系
泰安市康养旅游资源数据库的集成体系包含康养旅游吸引物包括康养景区资源和传统文化资源、康养饮食资源、酒店住宿资源、休闲娱乐资源、旅游购物资源、旅游交通资源、康养线路设计等八个数据库。
5.1.1康养旅游吸引物
(1)康养景区资源
康养景区资源下可分设山岳康养资源、森林康养资源、湿地康养资源、田园型康养资源、文化康养资源等。
森林中较高浓度的空气负离子对调节人体机能、维持健康有着重要作用。植物精气可以增加空气中臭氧和负离子含量,增强森林空气的舒适感和保健功能,对咳嗽、哮喘、慢性气管炎、肺结核、神经官能症、心律不齐、冠心病、高血压等都有一定疗效,尤其是对呼吸道疾病的效果十分显著。
(2)传统文化资源
传统文化资源可分传统技艺包括,泰山封禅御宴、泰安豆腐制作技艺、泰安火烧制作技艺、泰山石刻碑拓技艺、泰山酒传统酿造技艺、泰山香传统制作技艺等。传统美术包括,泥塑(泰山泥塑)、泰山糖画、东平湖莲子彩绘工艺、泰山水陆画;传统体育、游艺、杂技:徐家拳、中华子午门功夫等。传统舞蹈:独杆跷、百兽图、逛荡灯等。传统戏剧:山东梆子、泰山皮影戏、宁阳木偶戏、四音戏;传统医药:孟氏正骨、孟氏接骨膏制作技艺、安架庄梁氏正骨疗法、王氏正骨等。传统音乐包括泰山道教音乐、腊山道教音乐、东平硪号子等。民间文学包括,水浒传说、泰山传说、肥桃的传说、宁阳大禹治水的传说、范蠡和陶山的故事、和圣柳下惠的传说等。民俗包括:泰山东岳庙会习俗、泰山豆腐宴民俗、泰山玉民俗、桃木雕刻民俗、宁阳斗蟋、泰山封禅与祭祀习俗、宁阳彩粽及送彩粽习俗、泰山石敢当习俗、东岳大帝与碧霞元君习俗、泰山祭祀习俗等。传统曲艺有端鼓腔。
5.1.2康养饮食
泰安白菜、豆腐和泰山泉水,历来被誉为“泰安三美”。范镇火烧、泰安煎饼、泰山赤鳞鱼、泰山豆腐宴、大河峪有机猕猴桃、肥城桃、泰山香椿酱、莲花山土蜂蜜、泰山芽枣、泰山银环富硒地瓜、泰山银环富硒小麦粉等。
5.1.3购物特产
泰山玉、泰山茶、肥城桃木和泰山麻并称为“泰安四宝”。土特产品如泰山赤鳞鱼、泰山赤灵芝、泰山板栗、泰山核桃、宁阳大枣、肥城桃、泰山黄精、泰山参、牛蒡等。泰山手作商品如泰山花馍、泰山泥塑、大汶口花边、师旷古琴、桃木剑、麦秆扇、聂氏铜器等。泰山旅游文创如敢当当马克杯、如意贴、小公仔、帆布包等。
5.2前端开发
前端拟开发电视应用,汇总整合泰安市现有康养旅游数字化旅游资源构成后端数据库内容支撑,以应用平台为桥梁,研发数字康养旅游产品和实体康养旅游产品满足市场需求。拓宽旅游产品的传统边界,居家缓冲期开发数字旅游产品,外出活跃期开发实体康养旅游产品,数字化与实体化结合互补。通过线上与线下相结合的康养旅游模式,老年群体足不出户就能体验到旅游带来的乐趣。提高了他们的参与度,满足了对健康和娱乐的双重需求。
5.2.1电视应用页面模块介绍
(1)数字康养旅游板块
电视应用包括多种功能,功能栏包括搜索窗口、评论窗口、聊天窗口等社交渠道,其中评论窗口可发表点评语、游记等游后评价内容。主要模块包括,直播模块,由高校志愿者、背包客团体、开发团队亲身游览旅游线路,旅行及行程过程全程直播;景区讲解模块,泰安市各大景区由真人导游录制介绍讲解音频;保健运动模块,提供太极拳、气功、八段锦等教学跟练视频、医疗健康视频、紧急救助教学视频等;营养美食模块,提供泰安特色美食、滋补膳食制作教学视频;泰安特产模块包括泰山文创产品、农副产品、非物质文化遗产产品等介绍推荐及购买渠道,线上下单,快递配送。
(2)实体康养旅游板块
设计多种不同类型的康养旅游产品,如山岳康养旅游线路,森林康养旅游线路,湿地康养旅游线路,文化康养旅游线路等。详细页面包括线路详细信息,价格、游览景区、餐饮、住宿等内容。与旅行社密切合作落实到位,做好意外应急机制,旅行团配备代步车、急救药箱、氧气设备等医疗设备和医疗保障资源,从各方面保障老年人出行安全。
5.3后端开发
康养数据库后端开发选择MySQL作为数据库管理系统,结合PHP语言进行服务端开发,并使用phpMyAdmin工具进行实现。爬取“去哪儿网”康养旅游吸引物资源50条、传统文化资源42条、酒店住宿资源115条、康养美食资源120条、旅游交通资源86条、旅游购物资源119条、休闲娱乐资源117条,自主设计泰安市康养线路8条,共计657条内容。
6.结语
随着大数据时代的到来,从海量的数据中获取自己所需的数据显得尤为重要,我们需要掌握必要的爬虫技术,快速抓取网页数据并对其进行可视化分析与构建所需资源数据库。旅游产业的健康持续发展,必须以科学合理、有计划的旅游资源开发为基础,建立有组织、有计划地开发旅游信息资源的泰安市旅游数据库,开发前端应用结合目标市场,推动泰安市老年康养旅游业发展。
参考文献:
[1]孙楚栋,王业.基于Python的旅游数据可视化应用[J].电脑编程技巧与维护,2022(11):100-103.DOI:10.16184/j.cnki.comprg.2022.11.018.
[2]赵蔷.基于Python爬虫的旅游网站数据分析与可视化[J].电子设计工程,2022,30(16):152-155.DOI:10.14022/j.issn1674-6236.2022.16.033.
[3]田雪丽,郭志斌,刘梦贤.基于Python的网页数据爬取与可视化分析[J].电脑知识与技术,2022,18(06):24-26.DOI:10.14004/j.cnki.ckt.2022.0312.
[4]罗想.基于My SQL的智慧作业系统数据库设计[J].科技视界,2022(24):19-21.DOI:10.19694/j.cnki.issn2095-2457.2022.24.06.
[5]于天乐,秦红.关于建立地方旅游数据库的思考[J].成都大学学报(社会科学版),2008(03):42-43.
1.作者简介:姓名:贾振振通讯作者,1987年3月,女,汉族,山东省莱州市、硕士研究生、讲师、研究方向:康养旅游、单位:山东第一医科大学,山东省泰安市,271000.
2.作者简介:姓名:刘冠忠,1987年1月,男,汉族,山东省肥城市,本科,中2,研究方向:历史,单位:泰山学院附属中学,山东省泰安市,271000.



京公网安备 11011302003690号