時間:2022年12月2日(星期五)下午15:00-16:30
地點:#騰訊會議:622-389-115
報告人:周一帆 教授
報告人簡介:
周一帆,教授,博導,擔任中國“雙法”研究會工業(yè)工程分會常務理事,中國運籌學會可靠性分會理事,中國創(chuàng)造學會理事。擔任IEEE PHM國際會議Arrangement Chair和多個國際會議Session chair。主持國家自然科學基金面上項目兩項,國家自然科學基金青年基金一項,教育部博士點基金一項,江蘇省重點實驗室開放基金兩項。發(fā)表論文SCI/EI檢索論文40余篇,其中包括以第一作者/通訊作者在《Reliability Engineering and System Safety》、《Applied Mathematical Modelling》、《IEEE Transactions on Reliability》、《Computers & Industrial Engineering》等期刊發(fā)表SCI論文16篇。在東南大學“我最喜愛的導師”評選中被評為“十佳導師”。
報告內(nèi)容簡介:
多智能體強化學習和深度強化學習是近年來興起的求解大規(guī)模馬爾可夫決策過程的重要方法。為基于馬爾可夫決策過程進行大型多部件系統(tǒng)維修優(yōu)化和多倉庫系統(tǒng)庫存優(yōu)化提供了新的思路。本報告介紹了強化學習、多智能體強化學習和深度強化學習的原理和方法。展示了其在維修優(yōu)化和庫存優(yōu)化中的應用。比較和討論了強化學習和啟發(fā)式算法在求解此類問題時的優(yōu)缺點,以及兩種算法的不同適用范圍。最后討論了未來的研究方向。
(承辦:管理科學與物流系、長三角研究院數(shù)字經(jīng)濟創(chuàng)新研究中心、科研與學術(shù)交流中心)