新書推薦:
《
我真正想要什么?:智慧瑜伽答问/正念系列
》
售價:HK$
58.2
《
元朝理财记 从成吉思汗的崛起到元朝的衰亡
》
售價:HK$
98.6
《
欧洲史:一本书历览欧洲数千年兴衰起伏,理解欧洲文明何以铸就今日世界
》
售價:HK$
333.8
《
趣学CCNA——路由与交换(第2版)
》
售價:HK$
100.6
《
世界航空地理(世界国别与区域地理研究丛书)
》
售價:HK$
244.2
《
学术的中心:英法德美
》
售價:HK$
87.4
《
为什么要读人类学
》
售價:HK$
77.3
《
井邑无衣冠 : 地方视野下的唐代精英与社会
》
售價:HK$
95.2
|
內容簡介: |
《多臂机序列决策:策略、性能及应用》在介绍无休多臂机贯序决策理论体系的基础上,讨论无线通信网络资源序列分配过程中不完美检测、部分检测、资源动态性问题,提出线性时间复杂度的近视策略、怀特因子策略、启发式策略,分别得到近视策略的优化性闭式条件、怀特因子策略的可行性条件及因子闭式表达。同时,将上述理论和方法推广至异构资源状态的系统,提出相应的策略。
|
目錄:
|
目录“博士后文库”序言前言第1章 绪论 11.1 引言 11.1.1 多臂机 11.1.2 无休多臂机 21.2 技术难点 4参考文献 4第2章 同构两态完美观测多臂机:短视策略及性能 62.1 引言 62.2 系统模型和优化问题 82.3 正则收益函数 102.3.1 正则收益函数定义 102.3.2 值函数的性质 112.4 贪婪策略的优化性 142.5 *优性条件应用 162.5.1 应用1 162.5.2 应用2 172.5.3 应用3 172.6 引理证明 182.6.1 引理2.9的证明 182.6.2 引理2.5~引理2.7的证明 182.7 本章小结 24参考文献 24第3章 同构两态完美观测多臂机:第二高策略及性能 263.1 引言 263.2 系统模型和优化问题 273.2.1 系统模型 273.2.2 决策问题及策略 293.2.3 动机 303.3 伪值函数 313.4 优化性分析 323.4.1 正相关信道(λ.0) 323.4.2 奇数K的负相关信道(λ<0) 353.4.3 偶数K的负相关信道(λ<0) 363.5 优化性扩展 363.5.1 探测多个信道 363.5.2 探测两个信道访问其中一个信道 363.6 仿真实验 363.6.1 正相关信道(λ.0) 373.6.2 负相关信道(λ<0) 383.7 引理证明 393.7.1 引理3.2的证明 393.7.2 引理3.3的证明 433.7.3 引理3.4的证明 463.8 本章小结 50参考文献 50第4章 同构两态非完美观测多臂机:短视策略及性能 524.1 引言 524.1.1 机会谱访问 524.1.2 无休多臂机及短视策略 524.2 系统模型和优化问题 534.2.1 系统模型 534.2.2 无休多臂机模型 544.2.3 短视策略和正则收益 554.3 短视策略优化性分析 564.3.1 符号说明 564.3.2 辅助值函数及属性 584.3.3 短视策略优化性 604.4 分析讨论 624.5 引理证明 634.5.1 引理4.5的证明 634.5.2 引理4.6的证明 644.5.3 引理4.7的证明 674.5.4 引理4.8~引理4.10的证明 694.6 本章小结 77参考文献 77第5章 同构两态非完美观测多臂机:第二高策略及性能 795.1 引言 795.2 系统模型和优化问题 795.2.1 系统模型 795.2.2 混合尺度决策问题 815.3 小尺度与大尺度问题 825.3.1 小尺度决策 825.3.2 大尺度决策 855.3.3 启发式策略 865.4 优化性分析:信道正相关(p11.p01) 865.4.1 伪值函数 865.4.2 场景ζ+.<1 865.4.3 场景ζ+1 895.5 引理5.3(.+ζ<1,λ.0)的证明 905.6 本章小结 99参考文献 99第6章 异构两态非完美观测多臂机:因子策略及性能 1006.1 引言 1006.1.1 背景简介 1006.1.2 主要结果和贡献 1006.2 相关工作 1016.3 系统模型和优化问题 1016.4 怀特因子及可行性简介 1046.5 怀特因子和调度策略 1066.5.1 怀特因子 1066.5.2 调度策略 1086.5.3 技术挑战 1086.6 线性化分析:基于不动点理论 1096.7 门限策略和伴随动态系统 1136.7.1 门限策略 1136.7.2 伴随动态系统 1146.8 值函数线性化:信道负相关 1156.8.1 区间1[p11,ω0)和区间2[ω0,Γ(p11)) 1166.8.2 区间3 1176.8.3 区间4 1186.9 值函数线性化:信道正相关 1186.9.1 区间n.1:[Γn(φ(p11)),Γn+1(φ(p01))) 1206.9.2 区间n.2:[ˉωn0,Γn(φ(p11))) 1216.9.3 区间n.4:[Γn(φ(p01)),ωn0) 1236.9.4 区间n.3:[ωn0,ˉωn0) 1246.9.5 区间5:[ω0,p11) 1246.10 因子计算:信道负相关 1246.10.1 区间1 1256.10.2 区间2 1266.10.3 区间3 1266.10.4 区间4 1276.11 因子计算:信道正相关 1286.11.1 区间1 1286.11.2 区间2 1296.11.3 区间3 1296.11.4 区间4 1306.11.5 区间5 1306.11.6 区间6 1306.12 仿真实验 1316.12.1 怀特因子策略和优化策略 1316.12.2 怀特因子策略和短视策略 1326.13 本章小结 133参考文献 133第7章 异构两态非完美观测多臂机:前看策略及性能 1367.1 引言 1367.1.1 背景简介 1367.1.2 主要贡献 1377.2 系统模型和优化问题 1387.2.1 系统模型 1387.2.2 优化探测序和停止问题 1397.2.3 停止探测决策 1397.3 ν步前看策略 1417.3.1 上下界 1417.3.2 ν步前看策略的结构 1427.3.3 ν步前看策略实现 1437.3.4 低复杂性实现:一步前看策略 1447.4 仿真实验 1507.4.1 同构信道 1507.4.2 异构信道 1527.5 本章小结 152参考文献 152第8章 同构多态完美观测多臂机:短视策略及性能 1558.1 引言 1558.1.1 研究简介 1558.1.2 技术贡献 1568.2 系统模型和优化问题 1578.2.1 系统模型 1578.2.2 信息态 1588.2.3 优化问题 1598.2.4 短视策略和部分序 1608.3 短视策略优化性分析 1638.3.1 值函数及其解耦性 1638.3.2 状态转换矩阵结构属性 1648.3.3 短视策略优化性 1648.4 短视策略优化性:扩展情况 1678.5 案例分析 1698.6 引理和命题证明 1718.6.1 引理8.1的证明 1718.6.2 命题8.3的证明 1728.6.3 命题8.4的证明 1738.6.4 命题8.5的证明 1748.6.5 引理8.2的证明 1758.6.6 命题8.6的证明 1808.6.7 命题8.7的证明 1828.7 本章小结 183参考文献 184第9章 同构多态非完美观测多臂机:短视策略及性能 1879.1 引言 1879.2 系统模型和优化问题 1879.2.1 系统模型 1879.2.2 信息态 1889.2.3 短视策略 1899.3 短视策略优化性分析 1909.3.1 辅助值函数及解耦性 1909.3.2 条件 1919.3.3 性质 1929.3.4 优化性分析 1959.3.5 讨论 1979.4 优化性扩展 1989.4.1 条件 1989.4.2 优化性分析 1999.4.3 扩展:调度多个信道 2009.5 引理证明 2009.5.1 引理9.1的证明 2009.5.2 引理9.2的证明 2029.6 本章小结 208参考文献 208第10章 异构多态完美观测多臂机:因子策略及性能 20910.1 引言 20910.1.1 相关工作 20910.1.2 主要贡献 21010.2 系统模型和优化问题 21010.2.1 任务、信道和用户模型 21010.2.2 服务器模型 21210.2.3 机会调度问题 21210.3 多臂机模型及分析 21210.3.1 任务–信道–用户 21210.3.2 多臂机和机会调度 21310.4 可因子性分析和因子计算 21510.4.1 状态转换矩阵和门限结构 21510.4.2 可因子性分析 21610.4.3 因子计算 22010.5 可因子性扩展及调度策略 22110.5.1 可因子性扩展 22110.5.2 转换矩阵近似 22210.5.3 调度策略 22210.6 仿真实验 22310.6.1 场景1 22510.6.2 场景2 22610.6.3 场景3 22710.7 引理和定理证明 22810.7.1 引理10.1的证明 22810.7.2 引理10.2的证明 23210.7.3 定理10.2的证明 23510.8 本章小结 237参考文献 237编后记 240
|
|