480 - EVALUATING REWARD FUNCTIONS FOR BLOOD GLUCOSE CONTROL USING REINFORCEMENT LEARNING IN THE ARTIFICIAL PANCREAS - The 13th International Conference on Advanced Technologies & Treatments for Diabetes

480 - EVALUATING REWARD FUNCTIONS FOR BLOOD GLUCOSE CONTROL USING REINFORCEMENT LEARNING IN THE ARTIFICIAL PANCREAS

AS01 Closed-loop System and Algorithm

480 - EVALUATING REWARD FUNCTIONS FOR BLOOD GLUCOSE CONTROL USING REINFORCEMENT LEARNING IN THE ARTIFICIAL PANCREAS

Session Type

E-POSTER VIEWING (EXHIBITION HOURS)

Session Name

CLOSED-LOOP SYSTEM AND ALGORITHM

Abstract

Abstract

Background and Aims

Reinforcement learning (RL) is a promising option for adaptive and personalized algorithms for the artificial pancreas. However, when adapting reinforcement learning algorithms to new domains where a natural reward function is not given directly, such as in the T1DM case, suitable reward functions have to be crafted by hand. This design process is susceptible to errors and is in fact a general open area of research within RL.

In this work we train a single RL agent using several different reward functions in the hybrid closed loop setting. We evaluate both generic and domain-knowledge based rewards functions.

Methods

We test eight different reward functions in-silico on the Hovorka simulator. The reinforcement learning agent is trained using Trust-Region Policy Optimization (TRPO), a policy gradient algorithm that has shown previous competitive performance controlling blood glucose level in T1DM.

Performance is measured in terms of the average reward of the algorithms as well as average time in-range, -hypo and -hyper. A total of 100 days with randomized meals and fixed seed are used for generating the test averages.

Results

We test the algorithm on episodes lasting one and a half day containing four randomized meals and simulated carbohydrate counting errors. Figure 1 shows an example comparing two different reward functions - a Gaussian reward function and an asymmetric function designed to spend less time in hypoglycemia.

Conclusions

Our in-silico experiments shows that by tuning the reward function using domain specific knowledge of T1DM, we are able to avoid hypoglycemic events while increasing overall time-in-range.

Hide

Previous ePoster

479 - DEEP REINFORCEMENT LEARNING IN THE PREDICTION OF BLOOD GLUCOSE

Next ePosters

481 - THE USABILITY OF A HYBRID CLOSED-LOOP INSULIN DELIVERY SYSTEM: SIMULATED USE STUDIES OF THE TANDEM T:SLIM X2 INSULIN PUMP WITH CONTROL-IQ TECHNOLOGY

482 - ESTIMATION OF INSULIN ASPART AND LISPRO PEAK ACTION TIME AT POPULATION AND INDIVIDUAL LEVELS FROM INSULINEMIA MEASUREMENTS OF TYPE 1 DIABETIC PATIENTS

483 - INVESTIGATING EFFECTS OF INSULIN ESTIMATION ON FUTURE INSULIN SENSORS’ DESIGN AND IMPLICATION FOR DIABETES MANAGEMENT

484 - A NOVEL SIMULATION ENVIRONMENT MODELING REALISTIC INTERACTIONS BETWEEN PATIENTS AND DECISION SUPPORT SYSTEMS

485 - USE OF DO-IT-YOURSELF HYBRID CLOSED-LOOP IS ASSOSICIATED WITH BETTER GLUCOSE MANAGEMENT AND HIGHER QUALITY OF LIFE AMONG ADULTS WITH TYPE 1 DIABETES

486 - USER PERCEPTIONS AND SATISFACTION WITH DO-IT-YOURSELF CLOSED-LOOP SYSTEMS FOR TYPE 1 DIABETES

503 - PERFORMANCE OF THE LILLY AUTOMATED INSULIN DELIVERY (AID) SYSTEM: RESULTS OF EARLY PHASE FEASIBILITY STUDY

504 - PERFORMANCE OF OMNIPOD PERSONALIZED MODEL PREDICTIVE CONTROL ALGORITHM WITH MULTIPLE SETPOINTS AND MEAL AND EXERCISE CHALLENGES IN ADULTS AND ADOLESCENTS WITH TYPE 1 DIABETES

480 - EVALUATING REWARD FUNCTIONS FOR BLOOD GLUCOSE CONTROL USING REINFORCEMENT LEARNING IN THE ARTIFICIAL PANCREAS

480 - EVALUATING REWARD FUNCTIONS FOR BLOOD GLUCOSE CONTROL USING REINFORCEMENT LEARNING IN THE ARTIFICIAL PANCREAS

Abstract

Background and Aims

Methods

Results

Conclusions

Previous ePoster

479 - DEEP REINFORCEMENT LEARNING IN THE PREDICTION OF BLOOD GLUCOSE

Next ePosters

481 - THE USABILITY OF A HYBRID CLOSED-LOOP INSULIN DELIVERY SYSTEM: SIMULATED USE STUDIES OF THE TANDEM T:SLIM X2 INSULIN PUMP WITH CONTROL-IQ TECHNOLOGY

482 - ESTIMATION OF INSULIN ASPART AND LISPRO PEAK ACTION TIME AT POPULATION AND INDIVIDUAL LEVELS FROM INSULINEMIA MEASUREMENTS OF TYPE 1 DIABETIC PATIENTS

483 - INVESTIGATING EFFECTS OF INSULIN ESTIMATION ON FUTURE INSULIN SENSORS’ DESIGN AND IMPLICATION FOR DIABETES MANAGEMENT

484 - A NOVEL SIMULATION ENVIRONMENT MODELING REALISTIC INTERACTIONS BETWEEN PATIENTS AND DECISION SUPPORT SYSTEMS

485 - USE OF DO-IT-YOURSELF HYBRID CLOSED-LOOP IS ASSOSICIATED WITH BETTER GLUCOSE MANAGEMENT AND HIGHER QUALITY OF LIFE AMONG ADULTS WITH TYPE 1 DIABETES

486 - USER PERCEPTIONS AND SATISFACTION WITH DO-IT-YOURSELF CLOSED-LOOP SYSTEMS FOR TYPE 1 DIABETES

503 - PERFORMANCE OF THE LILLY AUTOMATED INSULIN DELIVERY (AID) SYSTEM: RESULTS OF EARLY PHASE FEASIBILITY STUDY

504 - PERFORMANCE OF OMNIPOD PERSONALIZED MODEL PREDICTIVE CONTROL ALGORITHM WITH MULTIPLE SETPOINTS AND MEAL AND EXERCISE CHALLENGES IN ADULTS AND ADOLESCENTS WITH TYPE 1 DIABETES

505 - EFFICACY OF REAL-TIME MEAL DETECTION AND REMINDERS ON APPLE WATCH

506 - UTILIZING BEHAVIORAL PROFILES IN A MULTISTAGE MPC TO IMPROVE POSTPRANDIAL GLUCOSE CONTROL