选题的目的、理论与实践意义:
选题的目的:随着“互联网+”概念的兴起,有很多传统行业获得了新的发展契机。根据数据统计,用户足不出户就能享受优质的医疗服务,看病贵和看病难这样的问题通过线上医疗问诊得到有效的缓解。系统通过对网站你用户及为平台提供服务的医生,医疗服务数据,评价信息等从用户喜好、行为和使用体验等各个维度探究在线问诊类产品的使用现状,发现用户痛点,并提出优化方案。
理论与实践意义:近几年随着互联网的发展,传统的医疗领域也开始跨入了互联网时代,新兴的在线问诊服务可以方便、快捷的为患者提供优质的医疗服务。目前提供在线问诊服务的第三方平台有很多,而且也有越来越多的公司开始看好互联网医疗的前景。为了分析互联网医疗发展情况,本文使用Python从医疗交流网站上抓取相关医院、医生在线问诊服务情况数据进行数据分析,可以为用户提供优质的相关服务以及让管理者了解医疗健康大数据信息。
研究目的(选题的意义和预期应用价值)
随着科技的发展以及互联网的普及,全球都逐步进入数据化时代,数据化也将遍布生活中的方方面面。线上医疗的发展也在疫情暴发后进入了高速发展时期,各种有关医疗的APP和小程序等如雨后春笋般纷纷探出头。而人工智能就诊属于线上医疗过程中的一个创新型环节,目前还处在萌芽阶段。移动医疗大数据具有为患者提供更加优质服务方面的价值,然而移动医疗和大数据分析相结合的意义在于获得超越个体的集体性知识。与此同时,医疗资源的分布上,发达地区与欠发达地区相差甚远,欠发达地区优质医疗资源稀缺,医疗数据来源日益复杂,数据维度日益增高、数据结构多样化、行业标准不明确等,导致患者、医生、医疗服务提供者、监管者等群体对于移动医疗大数据的应用尚且面临着诸多的风险和限制,因此对于医疗大数据研究的必要性不言而喻。系统将爬取互联网中包含医生的姓名、职称、所在医院、科室、城市、问诊类型、问诊价格、在线问诊量、满意度、推荐热度等信息进行多维度的分析,从而为患者提供更多具有参考价值的信息。
与本课题相关的国内外研究现状(文献综述),预计可能创新的方面
在2015年的政府相关工作报告中,李克强总理首次提出制订“互联网+”行动计划,生物医药等一批新兴产业将作为培育的主导产业,能够促进电子商务以及工业互联网、医疗健康事业的发展。这对移动医疗事业来说是一场新的变革,能够全面地推动移动医疗事业的发展,同时能够带动医疗事业和移动互联网、云计算、大数据、物联网等领域产生跨界融合。移动互联网医疗应用模式大致可以分为两种,一种是B2B模式,主要指医疗机构中医生之间的交流以及医学知识库的应用等;另一种是B2C模式,应用的就是移动互联终端的寻医问药、远程医疗、预约挂号以及随访服务等。随着信息技术的不断更新升级,应用到移动医疗上的APP越来越多。
在互联网快速发展的阶段,尤其在发达国家,信息技术水平较为先进,移动互联网医疗也不例外,其在发达国家的应用较为普遍,不仅能够提供信息化的服务模式,还可以实现远程医疗技术的应用,比如通过手机等移动智能终端设备就可以实现远程医疗。大数据医疗平台,指的是在传统医疗行业处理信息与数据是方式的基础之上,融入现代通信技术,以提高效率,为患者乃至整个行业提供发展的推力。著名的咨询管理公司麦肯锡公司曾在其报告中表示,大数据分析可以帮助美国医疗服务业一年创造3000亿美元的附加值,包括医疗服务业五大领域的15项应用。根据BIS Research一份名为《全球医疗市场大数据分析与预测,2017-2025年》的报告显示,近年来,大数据医疗领域的发展越发迅速,2017年的市场规模约为142.5亿美元,到2025年底预计将增至687.5亿美元。以上两点,足以说明在医疗产业不断升级发展的过程中大数据的重要性,以及大数据医疗平台发展的广阔前景。
本文的创新将利用Python的Requests的框架搭建爬虫网络,爬取互联网医疗问诊网站最新的医疗数数据,并用Django框架做后台爬取数据管理展示,并且研究数据采集系统的历史发展进程为基于Requests框架的数据采集系统的设计与实现奠定了实践基础;研究并分析大数据时代数据的特点,基于在线问诊类产品的使用现状,发现用户痛点,并提出优化方案。
研究的主要内容与可行性分析
本课题研究的主要内容是通过Python、Django框架、MySQL数据库等开发技术搭建系统环境,设计开发一款基于python的医疗问诊服务数据采集及可视化分析系统,提供医疗问诊服务数据的采集、分析的功能。系统预计实现用户登录、以及预测爬取、数据管理、数据分析、用户管理、权限管理、可视化展示等模块功能。
本文设计和实现的基于python的医疗问诊服务数据采集及可视化分析系统,使用pyhton中的pandas、numpy库来进行的数据的处理。利用Pycharm用于作为开发平台,安装Web应用框架Django和数据采集框架Requests,以及关系型数据库MySQL存储系统分析数据,系统将爬取的数据存储excel和MySQL数据库通过Pandas对数据进行清洗和处理分析,因此可以看出系统在各方面可行的。
本课题研究的主要方法和步骤
1、文献研究法:在进行论文初期资料收集时主要采用文献研究法,通过对国内外相关文献的查阅与学习,了解国内外相关课题的研究现状,初步确定本文的研究思路、结构及内容。
2、调查研究法:通过调查掌握当前基于大数据下的医疗服务问诊现状,并从多个方面进行分析问题形成的原因,寻求优化对策与建议,并需借助大量的调查研究,掌握翔实的资料。
3、经验总结法:总结基于大数据下的医疗服务问诊数据的解决,并通过论文或其他形式进行表现。
研究步骤
(1) 学习爬虫技术对基于Requests框架的数据采集系统设计与实现所使用的主要技术进行说明;
(2)分析该数据采集系统的业务需求和功能需求;
(3)对采集的医疗问诊数据进行可视化分析并使用图表进行渲染展示;
(4)确定系统设计原则,对系统总体框架搭建、功能模块划分和数据库设计进行规划和阐述;
(5)设计与实现系统的功能模块。
(6)完成数据分析流程和管理端等功能的程序设计。
(7)实现程序的测试,并解决测试中遇到的bug。