首页 > 数据库 >DRG/DIP 2.0时代下基于PostgreSQL的成本管理实践与探索(下)

DRG/DIP 2.0时代下基于PostgreSQL的成本管理实践与探索(下)

时间:2025-01-23 10:30:22浏览次数:3  
标签:PatientInfo his HIS PostgreSQL -- 抽取 date 2.0 DIP

五、数据处理与 ETL 流程编程实现

5.1 数据抽取与转换(ETL)

在 DRG/DIP 2.0 时代的医院成本管理中,数据抽取与转换(ETL)是将医院各个业务系统中的原始数据转化为可供成本管理分析使用的关键环节。这一过程涉及从医院 HIS 系统中抽取患者诊疗数据,并对其进行格式转换、字段映射等处理,以满足后续成本核算和分析的需求。

医院 HIS 系统是医院信息化管理的核心,包含患者诊疗的全方位信息,如患者基本信息、诊疗记录、费用明细等。与 HIS 系统对接时,可采用 API 接口或中间库的方式进行数据抽取。使用 API 接口对接时,需先与 HIS 系统的开发团队沟通,获取详细的接口文档,明确接口的请求方式(如 GET、POST)、请求参数以及返回数据的格式(如 JSON、XML)。以获取患者诊疗信息为例,若 HIS 系统提供的 API 接口为https://his.example.com/api/patient_info,请求方式为 POST,请求参数为患者的住院号inpatient_no,则在 PostgreSQL 中可使用http_request函数(需安装相关扩展,如http_post)来发送请求,示例代码如下:

-- 安装http_post扩展(若未安装)

CREATE EXTENSION IF NOT EXISTS http_post;

-- 发送POST请求获取患者诊疗信息

SELECT http_post('https://his.example.com/api/patient_info',

    '{"inpatient_no": "20230101001"}',

    'Content-Type: application/json'

);

上述代码通过http_post函数向 HIS 系统的 API 接口发送 POST 请求,传递患者住院号信息,接口返回的患者诊疗信息可进一步处理和存储到 PostgreSQL 数据库中。

采用中间库方式对接时,HIS 系统将数据定期同步到中间库(如 MySQL 数据库),PostgreSQL 再从中间库中抽取数据。可以使用dblink扩展来实现跨数据库连接和数据抽取。假设中间库为 MySQL,已安装mysql_fdw扩展并配置好连接参数,示例代码如下:

-- 安装mysql_fdw扩展(若未安装)

CREATE EXTENSION IF NOT EXISTS mysql_fdw;

-- 创建外部服务器

CREATE SERVER his_mysql_server

    FOREIGN DATA WRAPPER mysql_fdw

    OPTIONS (host '192.168.1.100', port '3306', dbname 'his_database');

-- 创建用户映射

CREATE USER MAPPING FOR current_user

    SERVER his_mysql_server

    OPTIONS (username 'his_user', password 'his_password');

-- 导入中间库中的患者诊疗信息表

IMPORT FOREIGN SCHEMA his_schema

    LIMIT TO (patient_info)

    FROM SERVER his_mysql_server INTO public;

上述代码通过mysql_fdw扩展创建了与 MySQL 中间库的连接,导入了中间库中的患者诊疗信息表到 PostgreSQL 数据库中,以便后续进行数据处理。

从 HIS 系统抽取的数据往往需要进行格式转换和字段映射,以符合成本管理系统的数据模型。数据格式转换方面,日期格式可能在 HIS 系统中以不同的格式存储,如YYYY-MM-DD、MM/DD/YYYY等,而成本管理系统要求统一的日期格式。在 PostgreSQL 中,可使用to_date函数进行日期格式转换,示例代码如下:

-- 将HIS系统中格式为MM/DD/YYYY的日期转换为YYYY-MM-DD格式

UPDATE patient_info

SET admission_date = to_date(his_admission_date, 'MM/DD/YYYY')

WHERE his_admission_date ~ '^\d{2}/\d{2}/\d{4}$';

字段映射是将 HIS 系统中的字段对应到成本管理系统中的字段。HIS 系统中的患者姓名字段可能为patient_name,而成本管理系统中为name,则可通过UPDATE语句进行字段映射,示例代码如下:

-- 字段映射,将HIS系统中的patient_name映射到成本管理系统中的name

UPDATE patient_info

SET name = his_patient_name;

在实际应用中,可能还需要处理复杂的数据结构,如 HIS 系统中可能将患者的多个诊断信息存储在一个字段中,以逗号分隔,而成本管理系统要求将每个诊断信息存储在单独的字段或数组中。可使用string_to_array函数将逗号分隔的诊断信息拆分为数组,示例代码如下:

-- 将HIS系统中逗号分隔的诊断信息拆分为数组

UPDATE patient_info

SET diagnosis_array = string_to_array(his_diagnoses, ',');

通过以上数据抽取与转换的编程实现,能够将医院 HIS 系统中的原始数据转化为符合成本管理系统要求的数据格式和结构,为后续的成本核算、分析和管理提供准确、可靠的数据基础。

5.2 时间窗口处理与增量抽取

在医院成本管理系统中,数据的持续更新和增长是常态。为了减少系统负载,提高数据处理效率,按医保结算周期(如月度)进行增量抽取数据是一种行之有效的方法。这种方法能够避免每次都对全量数据进行处理,仅抽取自上次抽取时间点以来发生变化的数据,从而显著降低数据传输和处理的工作量。

在 PostgreSQL 中,实现时间窗口处理和增量抽取可以借助数据库的时间戳字段和相关的查询语句。假设患者诊疗信息表PatientInfo中有一个UpdateTime字段,记录了每条记录的最后更新时间。要实现每月的增量抽取,可以使用以下步骤和代码示例:

首先,确定时间窗口。以月度为例,获取当前月份的起始时间和结束时间。在 PostgreSQL 中,可以使用date_trunc函数和generate_series函数来生成时间窗口。获取当前月份的起始时间和结束时间的代码如下:

-- 获取当前月份的起始时间

SELECT date_trunc('month', current_date) INTO start_date;

-- 获取当前月份的结束时间

SELECT (date_trunc('month', current_date) + INTERVAL '1 month - 1 day') INTO end_date;

上述代码中,date_trunc('month', current_date)函数将当前日期截断到月份,得到当前月份的起始时间,存储在start_date变量中。(date_trunc('month', current_date) + INTERVAL '1 month - 1 day')则是在当前月份起始时间的基础上加上 1 个月再减去 1 天,得到当前月份的结束时间,存储在end_date变量中。

接下来,根据时间窗口进行增量抽取。使用WHERE子句结合UpdateTime字段来筛选出在时间窗口内更新的记录。从PatientInfo表中抽取当前月份更新的患者诊疗信息的代码如下:

-- 从PatientInfo表中抽取当前月份更新的记录

SELECT *

FROM PatientInfo

WHERE UpdateTime BETWEEN start_date AND end_date;

上述代码通过BETWEEN运算符,筛选出UpdateTime字段在start_date和end_date之间的记录,即当前月份更新的患者诊疗信息。

在实际应用中,还可以结合INSERT INTO...SELECT语句,将增量抽取的数据插入到另一个表中,用于后续的处理和分析。将当前月份更新的患者诊疗信息插入到MonthlyPatientInfo表中的代码如下:

-- 将当前月份更新的记录插入到MonthlyPatientInfo表中

INSERT INTO MonthlyPatientInfo

SELECT *

FROM PatientInfo

WHERE UpdateTime BETWEEN start_date AND end_date;

上述代码将从PatientInfo表中筛选出的当前月份更新的记录插入到MonthlyPatientInfo表中,方便对每月的增量数据进行单独处理和分析。

为了确保每次增量抽取的准确性和连续性,可以记录上次抽取的时间点。在每次抽取完成后,更新记录的时间点,以便下次抽取时能够准确获取自上次抽取以来的增量数据。可以使用一个单独的表来记录抽取时间点,假设该表名为ETLTimeStamp,包含TableName(表名)和LastExtractTime(上次抽取时间)字段。更新和获取抽取时间点的代码如下:

-- 更新ETLTimeStamp表中PatientInfo表的上次抽取时间为当前月份的结束时间

UPDATE ETLTimeStamp

SET LastExtractTime = end_date

WHERE TableName = 'PatientInfo';

-- 从ETLTimeStamp表中获取PatientInfo表的上次抽取时间

SELECT LastExtractTime

FROM ETLTimeStamp

WHERE TableName = 'PatientInfo';

上述代码中,第一条UPDATE语句将ETLTimeStamp表中PatientInfo表的LastExtractTime更新为当前月份的结束时间,以便下次抽取时能够准确获取自上次抽取以来的增量数据。第二条SELECT语句则是从ETLTimeStamp表中获取PatientInfo表的上次抽取时间&#x

标签:PatientInfo,his,HIS,PostgreSQL,--,抽取,date,2.0,DIP
From: https://blog.csdn.net/kkiron/article/details/145316489

相关文章

  • Android 12.0 系统添加自定义屏保并设置为默认屏保功能实现
    1.前言在12.0的系统rom定制化开发中,在进行相关项目开发的过程中,由于需要在系统锁屏休眠的时候,需要显示相关的背景,就是自定屏保功能,所以就需要添加自定义的屏保,然后在上一篇已经实现在进行锁屏休眠的时候进入屏保的功能,这里就介绍下自定义屏保和设置默认屏保功能就可以了2.......
  • 数据迁移丨借助 pg2mysql 从 PostgreSQL 到 GreatSQL
    数据迁移丨借助pg2mysql从PostgreSQL到GreatSQL上篇《数据迁移丨借助AI从PostgreSQL到GreatSQL》介绍了如何使用AI+pg_dump/COPY的方式将PostgreSQL迁移到GreatSQL中,各位同学看过之后,会发现两款数据库还是有一些差异,例如对象层次结构、数据类型等方面,如果采用......
  • Ubuntu 22.04上编译安装C++ libconfig库
    一、前言libconfig是一个C/C++配置文件解析库,支持读取和写入配置文件。它使用了一种简单易懂的语法,非常适合用于各种项目的配置管理。本文将详细介绍如何在Ubuntu22.04上编译和安装libconfig库。二、环境准备在开始编译安装libconfig之前,需要确保系统已经安装了必要的开发工具......
  • Spring MVC:HTTP 请求的参数传递2.0
    本篇博客接上文:SpringMVC:Spring前置知识&HTTP请求的参数传递1.0-CSDN博客目录1.传递json- @RequestBody1.1json1.1.1什么是json1.1.2json的语法1.1.3json和Java中对象的转换1.1.4json优点1.2传递json2.获取路径参数- @PathVariable2.1......
  • Ubuntu22.04上Docker的安装
    在Ubuntu22.04上安装Docker可以帮助您快速构建、测试和部署应用程序。Docker是一个开源的容器化平台,它使开发人员能够将应用程序及其依赖项打包到一个标准化的单元中。本文将详细介绍如何在Ubuntu22.04上安装和配置Docker。一、更新系统首先,确保您的系统软件包是最新的。这有......
  • 火山引擎数据飞轮2.0:聚焦Data+AI,驱动企业数智化转型
    数字化浪潮席卷全球,数据与人工智能的融合正给各行各业带来巨大变革,不仅重塑数据处理流程,更在决策支持、业务优化、产品创新等多个维度上展现巨大的潜力。 近期,火山引擎数智平台技术和产品专家受邀出席DataFun首届“数据与人工智能解决方案大会”,围绕数据飞轮2.0模式,及Data+AI......
  • 30天开发操作系统 第 16 天 -- 多任务 v2.0
    前言大家好!昨天我们已经实践了很多关于多任务的内容,不过今天我们还得继续讲多任务。可“老是讲多任务都听腻了啊!”,但多任务真的非常重要(当然,如果你不想做一个多任务的操作系统那就不重要啦)。从咱们制作的操作系统角度来说,希望大家能够在充分做好多任务机制的基础上,再......
  • DBeaver 22.0 最新版下载及安装教程
    DBeaver简介DBeaver是一个通用的数据库管理工具和SQL客户端,支持MySQL,PostgreSQL,Oracle,DB2,MSSQL,Sybase,Mimer,HSQLDB,Derby,以及其他兼容JDBC的数据库。DBeaver提供一个图形界面用来查看数据库结构、执行SQL查询和脚本,浏览和导出数据,处理BLOB/CLOB数据,修......
  • 运维系列&安卓系列【仅供参考】:fastutil-7.2.0.jar下载依赖包超时问题,Android
    fastutil-7.2.0.jar下载依赖包超时问题,Androidfastutil-7.2.0.jar下载依赖包超时问题,Android摘要正文fastutil-7.2.0.jar下载依赖包超时问题,Android摘要文章介绍了在下载FastUtil-7.2.0.jar时遇到的网络问题,提出解决方案是使用阿里云的国内镜像,并给出了G......
  • 数据迁移丨借助 AI 从 PostgreSQL 到 GreatSQL
    数据迁移丨借助AI从PostgreSQL到GreatSQL本文将介绍如何从PostgreSQL到GreatSQL的数据迁移,并运用AI协助迁移更加方便。迁移的方式有很多,例如:pg_dump:导出SQL文件,修改后导入GreatSQL数据库。COPY:导出txt文本文件,导入GreatSQL数据库。pg2mysql:从PostgreSQL迁......