首页 > 其他分享 >MSDS 490: Healthcare Analytics and Decision Making

MSDS 490: Healthcare Analytics and Decision Making

时间:2024-11-10 19:30:09浏览次数:1  
标签:patient No Decision analysis Analytics liver Healthcare survival MELD

MSDS 490: Healthcare Analytics and Decision Making

Project 3

Due Date: 11/18/2024 (Monday Midnight)

Submission Instructions: zip all your files (R code, data, Word document, figures, etc.) into one, following the file naming convention Last Name First Name Project#.zip Use online submission tools in Canvas to submit this project.

Total Score:  100.

Liver cirrhosis is a late stage of scarring (fibrosis) of the liver caused by many forms of liver diseases, such as hepatitis, chronic alcoholism, and metabolic disease.  It is a severe condition that can lead to liver failure, and it is associated with significant morbidity and mortality.  The progression of liver cirrhosis is often staged, and various clinical factors can influence patient survival.  This project utilizes a dataset of cirrhosis patient to estimate their survival using survival analysis.

Dataset Information.  The dataset includes clinical and demographic variables, along with survival out- comes.  It provides information on patient age, gender, clinical conditions (Patient Disease Stage, Frailty), lab results (Albumin, Triglycerides, Platelets, Total Cholestrol), and derived scores (MELD). The data also has information on the day at which MELD score became available.  Two types are outcomes are possible for a patient prior to the study end time or patient getting lost to the study:  (1) patient receiving a liver trans- plant; (2) death (indicated by ‘D’). The number of days between liver cirrhosis and these events (N Days) and the type of event (Status) is also provided in the table in the ‘Status’ column:  ‘C’ indicates censored, ’D’ indicates death, and ’CL’ indicates liver transplant.

Variable Name

Type

Description

Missing Value

ID

Integer

Unique identifier

No

N Days

Integer

number of days between diagnosis and the

earlier of death, transplantation, or study analysis time

No

Status

Categorical

status of the patient C (censored),

CL (censored due to liver tx), or D (death)

No

Age

Intger

age (days)

No

Gender

Categorical

Male (M) or Female (F)

No

Albumin

Continuous

albumin

No

Triglycerides

Continuous

triglycerides

Yes

Platelets

Integer

platelets per cubic (ml/1000)

Yes

Stage

Categorical

initial stage of the disease

No

Cholesterol

Integer

serum cholesterol (mg/dl)

Yes

Frailty

Categorical

low (L), intermediate (I), and severe (S)

No

MELD TimeStamp

String

days at which the MELD score is available

No

MELD

Integer

MELD score

No

Note:    Treat ’CL’ as a ’C’ for parts 1-7.  Consider the columns MELD and MELD TimeStamp only for Part 9.

1.  Use the Multivariate Imputation by Chained Equations  (MICE) method to impute missing values in the dataset,  setting the number of multiple imputations to  10 for  10  cycles.   After  completing the imputations, pool the imputed datasets and analyze the results.  Your analysis should include a comparison of the distributions (mean,median, etc) of features before and after imputation.

2.  Plot Kaplan-Meier survival curves stratified by different stages of liver cirrhosis.  How does the survival probability differ across the stages of cirrhosis?

3. Ignore MELD score covariate, 代写MSDS 490: Healthcare Analytics and Decision Making and associated date information.   Calculate the hazard ratios for all attributes in the dataset using Cox proportional hazards regression. Which features significantly affect survival?

4.  Check the proportional hazards assumption and also the linearity assumption of continuous covariates (Albumin, SGOT) in the Cox model.

5.  Assume that the frailty variable does not meet the proportional hazards assumption.   Stratify the analysis by frailty.   How  do the hazard ratios change when stratifying by frailty,  and what is the impact on the model?

6.  Adjust the model to include interaction terms between frailty and gender. With the interaction terms included, interpret the hazard ratio of frailty patient with frailty status ‘L’ with those with status ‘I’ and ’S’ .

7.  Plot the adjusted survival curves stratified by different stages.  How do these curves differ from the Kaplan-Meier curves?

8.  Assuming CL as a competing event, perform. a competing risks analysis.  What are the subdistribution hazard ratios for death and transplant?  How do the results of the competing risks analysis compare to the traditional Cox regression model? Plot the cumulative incidence graph.

9.  Consider the MELD score as a time-varying covariate.  Rerun the Cox regression analysis including this covariate. How do the results change when incorporating the MELD score as a time-varying covariate?

标签:patient,No,Decision,analysis,Analytics,liver,Healthcare,survival,MELD
From: https://www.cnblogs.com/comp9321/p/18538346

相关文章

  • ffmpeg Decisions
    ThedecisionsfromtheTCwillbesentonthemailinglist,withthe[TC]tag.Internally,theTCshouldtakedecisionswithamajority,orusingranked-choicevoting.EachTCmembermustvoteonsuchdecisionaccordingtowhatis,intheirview,bestfor......
  • 论文概览 |《Urban Analytics and City Science》2024.09 Vol.51 Issue.7
    本次给大家整理的是《EnvironmentandPlanningB:UrbanAnalyticsandCityScience》杂志2024年9月第51卷第7期的论文的题目和摘要,一共包括20篇SCI论文!论文1Spatialinequalitiesandcities:Areview空间不平等与城市:综述【摘要】ThisspecialissueofEnvironm......
  • DBA3803: Predictive Analytics in Business
    DBA3803: PredictiveAnalytics in BusinessOverviewAnalytics is best learned by applyingthe methods andtechniquesto real-world data and problems. Forthis project:1.  Identify  a  real-world  problem or an area where predicti......
  • DBAP011 Business Analytics
    DBAP011BusinessAnalyticsQualityDiagnosisattheKelpiesFurnitureScotlandDUEDATEThursday31st October2024,11amIntroductionTheKelpiesFurnitureScotland(KFS)isafamilybusinessspecializinginthedesignandmanufactureofcontemporaryfu......
  • 3DA3 C02 Predictive Data Analytics
    Assignment1,Commerce3DA3C02-PredictiveDataAnalyticsTocompletethisassignment,pleasecreateaJupyternotebook.Thecodeinyourjupyternotebookshouldprovideanswerstoquestionsaskedintheassignment.Pleasesubmittheassignmentbyuploadin......
  • Cisco Secure Network Analytics 7.5.1 发布下载,新增功能概览
    CiscoSecureNetworkAnalytics7.5.1发布下载,新增功能概览CiscoSecureNetworkAnalytics7.5.1-领先的网络检测和响应(NDR)解决方案SecureNetworkAnalytics(formerlyStealthwatch)-NetworkVisibilityandSegmentation请访问原文链接:https://sysin.org/blog/ci......
  • Cisco Secure Network Analytics 7.5.1 - 领先的网络检测和响应 (NDR) 解决方案
    CiscoSecureNetworkAnalytics7.5.1-领先的网络检测和响应(NDR)解决方案SecureNetworkAnalytics(formerlyStealthwatch)-NetworkVisibilityandSegmentation请访问原文链接:https://sysin.org/blog/cisco-secure-network-analytics/,查看最新版。原创作品,转载请保......
  • 生信机器学习入门4 - 构建决策树(Decision Tree)和随机森林(Random Forest)分类器
    机器学习文章回顾生信机器学习入门1-数据预处理与线性回归(Linearregression)预测生信机器学习入门2-机器学习基本概念生信机器学习入门3-Scikit-Learn训练机器学习分类感知器生信机器学习入门4-scikit-learn训练逻辑回归(LR)模型和支持向量机(SVM)模型1.决策树(Dec......
  • BFA507 Accounting and Accountability for Decision
    BFA507AccountingandAccountabilityforDecisionMaking-Sem2,2024AssessmentTask2:OralpresentationDue: Week10-Friday,4thOctober2024at5.00pmILOsAddressed: ILO1,ILO2Maximumlength/format: 5-minutevideopresentationincluding:Powerpo......
  • 正在寻找 4 中的开源 Google Analytics 替代品?
    如果您是开发人员,您可能已经花了一些时间寻找合适的分析工具。我们在你之前做到了!大多数人默认使用GoogleAnalytics,但它并不总是完美的选择,特别是如果您担心设置复杂性、隐私、持续支持(作为小团队)或定制。今天我们向您介绍Litlyx,它是GoogleAnalytics的开源替代品,旨在简化您......