亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于異步優(yōu)勢(shì)執(zhí)行器評(píng)價(jià)器學(xué)習(xí)的自適應(yīng)PID控制設(shè)計(jì)

摘要:針對(duì)已有自適應(yīng)PID控制器收斂速度慢和計(jì)算效率低的不足,基于異步優(yōu)勢(shì)行動(dòng)者評(píng)論家(Asynchronous Advantage Actor-Critic,A3C)算法設(shè)計(jì)了一種新的自適應(yīng)PID控制器.該控制器利用A3C結(jié)構(gòu)的多線程異步學(xué)習(xí)特性,并行訓(xùn)練多個(gè)行動(dòng)者評(píng)論家(Actor-Critic,AC)結(jié)構(gòu)的智能體,每個(gè)智能體采用多層前饋神經(jīng)網(wǎng)絡(luò)逼近策略函數(shù)和值函數(shù)實(shí)現(xiàn)在連續(xù)動(dòng)作空間中搜索最優(yōu)的參數(shù)整定策略,以達(dá)到最佳的控制效果.算法在提高計(jì)算效率的同時(shí)降低了學(xué)習(xí)樣本的相關(guān)性.在仿真實(shí)驗(yàn)中通過(guò)與已有的多種自適應(yīng)PID控制器性能的對(duì)比分析說(shuō)明,該方法具有收斂速度快、自適應(yīng)能力強(qiáng)的特點(diǎn).

關(guān)鍵詞:
  • 深度強(qiáng)化學(xué)習(xí)  
  • 異步優(yōu)勢(shì)執(zhí)行器評(píng)價(jià)器  
  • 自適應(yīng)pid控制  
作者:
孫歧峰; 任輝; 段友祥
單位:
中國(guó)石油大學(xué)(華東)計(jì)算機(jī)與通信工程學(xué)院; 山東青島266580
刊名:
信息與控制

注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社

期刊名稱:信息與控制

信息與控制雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國(guó)內(nèi)刊號(hào)為:21-1138/TP。堅(jiān)持指導(dǎo)性與實(shí)用性相結(jié)合的原則,創(chuàng)辦于1972年,雜志在全國(guó)同類期刊中發(fā)行數(shù)量名列前茅。