화학공학소재연구정보센터
학회 한국화학공학회
학술대회 2021년 가을 (10/27 ~ 10/29, 광주 김대중컨벤션센터)
권호 27권 2호, p.1516
발표분야 공정시스템
제목 Optimal Decision-making Model for Renewable Energy Supply Chain Using Reinforcement Learning
초록 본 연구에서는 Mathematical Programming (MP) 중 하나인 Mixed Integer Linear Programming (MILP)로 풀어내던 공급망 최적화 문제를 Reinforcement Learning (RL)로 풀어내는 방법에 대해서 논한다. MP는 문제의 크기가 커지거나 복잡해지면(e.g., NP-hard) 수리모델을 구현하기 어려워질 뿐 아니라 해를 구하는데 드는 계산비용이 기하급수적으로 증가한다는 단점이 있다. RL을 통한 공급망 최적화 모델은 이러한 한계를 극복하고 모델 파라미터가 불확실성을 내포하고 있는 환경에서도 의사결정을 할 수 있다는 면에서 강인함(robustness)과 융통성(flexible)을 보인다. 따라서 본 연구에서는 MP를 통해 구해낸 최적 값을 목표로 학습하는 RL 기반 동적계획법 풀이 방법론을 개발함으로써 변동하는 모델 파라미터(수요, 가격, 등) 속에서 최선의 의사결정을 하는 인공지능을 구현한다. Renewable energy curtailment의 저장계획에 대한 case study를 진행하여 RL을 통한 공급망 최적화에 필요한 환경을 구축하였으며, 다양한 RL 알고리즘 비교와 하이퍼파라미터 튜닝을 완료하여 일반적으로 사용할 수 있는 튜닝 된 모델을 제안한다.
저자 강현주1, 강동주2, Niaz Haider3, 유준3, 나종걸1
소속 1이화여자대, 2서울대, 3부경대
키워드 공정최적화
E-Mail
원문파일 초록 보기