Provisioning Edge Inference as a Service via Online Learning 阅读笔记
创始人
2024-05-30 09:11:51
0

通过在线学习提供边缘推理服务

一、论文研究背景、动机和主要贡献

研究背景

趋势:机器学习模型训练从中央云服务器逐步转移到边缘服务器

好处:

  • 与云相比:a.低延迟 b.保护用户隐私(数据不会上传到云)
  • 与on-device相比:克服设备电量、资源限制

研究动机

挑战:

  • 边缘推理需要对跨网络的机器学习模型进行管理
  • 云->边缘涉及准确性和资源消耗之间的权衡;且涉及决策耦合:当前所做的任何决策都有可能限制下一步所做的决策(资源需求是在线变化的)
  • 推断任务的到达是不可预测的,如何清除任务推断队列是具有挑战性的

主要贡献

研究了在异构、资源受限的分布式边缘基础设施上在线优化机器学习服务的整体推理精度问题,同时适应不可预测的推理工作量

  • 将问题建模为一个带有长期约束的时变非线性整数规划:
    整数规划{问题目标:最大化整体推理精度问题约束{队列状态转换机器学习模型选择和交付推理工作负载分布整数规划\begin{cases}问题目标:最大化整体推理精度 \\问题约束\begin{cases}队列状态转换\\机器学习模型选择和交付\\推理工作负载分布\end{cases}\end{cases} 整数规划⎩⎧​问题目标:最大化整体推理精度问题约束⎩⎧​队列状态转换机器学习模型选择和交付推理工作负载分布​​
    决策存在滞后性:只有决策了,才知道是否满足约束。

    方案:选择设计在线算法,优化目标和上限累积,长期约束违反随时间的推移。

  • 我们设计了多项式时间在线算法

    该算法由一个在线学习组件一个随机舍入组件组成,该组件在每个时隙中进行分数阶决策,而不观察当前输入,并将分数阶决策转换为整数,而不改变期望中的约束违反

    • 在线学习组件:凸凹等效公式,采用以前的输入而非当前的输入。
    • 随机舍入组件:将分数决策舍入为整数,同时让两个分数相互补偿,并保持随机整数的期望等于相应的分数。
  • 性能:只会对最优性损失产生次线性动态遗憾,而对长期约束违反则会产生次线性动态拟合【两个指标】

二、系统模型和问题公式化

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sgHL920J-1678173510342)(%E9%80%9A%E8%BF%87%E5%9C%A8%E7%BA%BF%E5%AD%A6%E4%B9%A0%E6%8F%90%E4%BE%9B%E8%BE%B9%E7%BC%98%E6%8E%A8%E7%90%86%E6%9C%8D%E5%8A%A1.assets/image-20230305131629138.png)]

系统模型

边缘计算设备:一系列分布式异构边缘N={1,2,...,N}\mathcal{N}=\{1,2,...,N\}N={1,2,...,N},使用cnc_ncn​表示边缘的容量。

机器学习模型:M个机器学期模型M={1,2,...,M}\mathcal{M}=\{1,2,...,M\}M={1,2,...,M},预训练并存储在云中。

  • 模型m在t时刻的精度损失:am,ta_{m,t}am,t​
  • 模型资源需求:dmd_mdm​
  • 模型大小:sms_msm​
  • 模型m的推理能力:pmp_mpm​

推断工作负荷处理:

  • 用户在t时刻提交到边缘N的推断数量:rn,tr_{n,t}rn,t​
  • 先进先出队列长度:qn,tq_{n,t}qn,t​
  • 迁移代价:bn,tb_{n,t}bn,t​

控制变量:

  • 在t时刻,边缘n是否拥有模型m:zn,m,t={1,0}z_{n,m,t}=\{1,0\}zn,m,t​={1,0}
  • 在t时刻,边缘n上驻留的模型m的实例数量:xn,m,tx_{n,m,t}xn,m,t​
  • 在t时刻,从边缘n迁移到边缘n’的用户查询数量:yn,n′,ty_{n,n',t}yn,n′,t​

问题公式化

问题目标:最小化整体的精度损失
∑t=1T∑n∑mam,txn,m,t\sum_{t=1}^T\sum_n\sum_m a_{m,t}x_{n,m,t} t=1∑T​n∑​m∑​am,t​xn,m,t​
问题约束:

  • 队列状态转换,保证队列长度非负
    ∀t,n:qn,t+1=[qn,t+∑n′yn′,n,t−∑mpmxn,m,t]+qn,1≥0,qn,T+1=0\forall t,n:q_{n,t+1}=[q_{n,t}+\sum_{n'}y_{n',n,t}-\sum_mp_mx_{n,m,t}]^+\\ q_{n,1}\geq 0,q_{n,T+1}=0 ∀t,n:qn,t+1​=[qn,t​+n′∑​yn′,n,t​−m∑​pm​xn,m,t​]+qn,1​≥0,qn,T+1​=0

  • 推理工作负载分布
    ∀t,n:∑n′yn,n′,t=rn,t\forall t,n:\sum_{n'}y_{n,n',t}=r_{n,t} ∀t,n:n′∑​yn,n′,t​=rn,t​

  • 迁移代价
    ∀t,n:∑msm[zn,m,t−zn,m,t−1]++τ∑n′,n′≠n(yn,n′,t+yn′,n,t)≤bn,t\forall t,n:\sum_ms_m[z_{n,m,t}-z_{n,m,t-1}]^++\tau\sum_{n',n'\neq n}(y_{n,n',t}+y_{n',n,t})\leq b_{n,t} ∀t,n:m∑​sm​[zn,m,t​−zn,m,t−1​]++τn′,n′=n∑​(yn,n′,t​+yn′,n,t​)≤bn,t​
    下载模型+创建新的模型实例

  • 确保只有当模型决定驻留在边缘时,边缘才能有模型的实例
    ∀t,n,m:dmxn,m,t≤zn,m,tcn\forall t,n,m:d_mx_{n,m,t}\leq z_{n,m,t}c_n ∀t,n,m:dm​xn,m,t​≤zn,m,t​cn​

  • 确保用于处理推理查询的资源处于边缘容量之内
    ∀t,n:∑mdmxn,m,t≤cn\forall t,n:\sum_md_mx_{n,m,t}\leq c_n ∀t,n:m∑​dm​xn,m,t​≤cn​

  • 变量为整数
    ∀t,n,n′,m:xn,m,t,yn,n′,t∈N,zn,m,t∈{0,1}\forall t,n,n',m:x_{n,m,t},y_{n,n',t}\in \N,z_{n,m,t}\in\{0,1\} ∀t,n,n′,m:xn,m,t​,yn,n′,t​∈N,zn,m,t​∈{0,1}

问题公式化:

问题:没有用户推理查询的先验知识,否则在知道这样的工作量之前,可在每个时间段动态地做出决策,同时仍然满足每个时间段的约束;

解决方式:选择只在长期内强制约束,并设计在线算法使目标最小化,并约束累积约束违反随时间的变化。
min⁡∑t=1T{∑n∑mam,txn,m,t}s.t. ∀n:∑t=1Tgt0,n≤0,∀n:∑t=1Tgt1,n:=∑t=1T{∑n′yn,n′,t−rn,t}≤0,∀n:∑t=1Tgt2,n:=∑t=1T{rn,t−∑n′yn,n′,t}≤0,∀n:∑t=1Tgt3,n≤0,∀n,m:∑t=1Tgt4,n,m≤0,∀t,n:htn:=∑mdmxn,m,t−cn≤0,var. ∀t,n,m:xn,m,t,yn,n′,t∈N,zn,m,tload∈{0,1},\begin{aligned} \min & \sum_{t=1}^T\left\{\sum_n \sum_m a_{m, t} x_{n, m, t}\right\} \\ \text { s.t. } & \forall n: \sum_{t=1}^T g_t^{0, n} \leq 0, \\ & \forall n: \sum_{t=1}^T g_t^{1, n}:=\sum_{t=1}^T\left\{\sum_{n^{\prime}} y_{n, n^{\prime}, t}-r_{n, t}\right\} \leq 0, \\ & \forall n: \sum_{t=1}^T g_t^{2, n}:=\sum_{t=1}^T\left\{r_{n, t}-\sum_{n^{\prime}} y_{n, n^{\prime}, t}\right\} \leq 0, \\ & \forall n: \sum_{t=1}^T g_t^{3, n} \leq 0, \\ & \forall n, m: \sum_{t=1}^T g_t^{4, n, m} \leq 0, \\ & \forall t, n: h_t^n:=\sum_m d_m x_{n, m, t}-c_n \leq 0, \\ \text { var. } & \forall t, n, m: x_{n, m, t}, y_{n, n^{\prime}, t} \in \mathbb{N}, z_{n, m, t}^{l o a d} \in\{0,1\}, \end{aligned} min s.t.  var. ​t=1∑T​{n∑​m∑​am,t​xn,m,t​}∀n:t=1∑T​gt0,n​≤0,∀n:t=1∑T​gt1,n​:=t=1∑T​{n′∑​yn,n′,t​−rn,t​}≤0,∀n:t=1∑T​gt2,n​:=t=1∑T​{rn,t​−n′∑​yn,n′,t​}≤0,∀n:t=1∑T​gt3,n​≤0,∀n,m:t=1∑T​gt4,n,m​≤0,∀t,n:htn​:=m∑​dm​xn,m,t​−cn​≤0,∀t,n,m:xn,m,t​,yn,n′,t​∈N,zn,m,tload​∈{0,1},​
约束转换为长期版本,并予以简化处理:

在这里插入图片描述

ItI_tIt​是x,y,z组成的矩阵。

三、在线算法设计

在线学习:每一个时隙的决策应该从刚刚过去的决策中学习。

设计了一种新型的边缘推理多项式时间在线算法(OAEI),它有两个组成部分:

  • 在线学习组件:克服对不确定用户查询的遗忘,并根据先前的观察输入结果返回部分决策
  • 随机舍入组件:将分数决策转换为整数决策

在线算法组件

在这里插入图片描述

设计了一种交替的原对偶方法。注意到,求解的凸问题:

在这里插入图片描述

等价于求解:

在这里插入图片描述

那么Lagrange函数为:

在这里插入图片描述

因此,我们可以在通过修改的下降步骤使Lt(I,λt+1)\mathcal{L_t}(I,λ_{t+1})Lt​(I,λt+1​)相对于原始变量I最小化和通过双上升步骤使Lt(It,λ)\mathcal{L}_t(It,λ)Lt​(It,λ)相对于拉格朗日乘子λλλ最大化之间进行交替。具体来说,在时刻t+1t+ 1t+1,解决了以下问题:

在这里插入图片描述

为了将分数决策It,tI_t,tIt​,t转换为整数,提出了一个随机舍入组件作为算法2。

该方式是基于primal dual的,是不是可以理解成等价为内点法创建的另一种创新的、适用于本问题的一种解法

随机舍入组件

随机舍入组件这里只关注01整型变量zn,m,tz_{n,m,t}zn,m,t​如何处理的。

Step1:分别处理每个小数值,并将其舍入为整数,其期望是舍入后的小数值本身,如第1行到第5行所示。

其实对于0~1之间的数而言,上述的操作及相当于根据数据接近1的程度对其取1或0

更具体地说,分数值可以分为两部分:小数部分⌊At⌋\lfloor A_t\rfloor⌊At​⌋和实部分AtA_tAt​。小数作四舍五入的概率。

相关内容

热门资讯

重磅!一线城市房地产调控全面松... 一线城市房地产调控全面松绑,释放购房新信号2025 年,房地产市场风云突变,一则重磅消息如惊雷般响彻...
晶科能源携多款创新光储方案亮相... 转自:证券日报网    本报记者 曹琦    6月11日至13日,第十八届(2025)国际太阳能光伏...
“山有木兮卿有意,昨夜星辰恰似... “山有木兮卿有意,昨夜星辰恰似你”是什么意思?“山有木兮卿有意,昨夜星辰恰似你”的意思是“我对你有意...
股权转让+增资 日联科技拿下... 转自:证券日报网    本报记者 李亚男    6月13日晚间,日联科技集团股份有限公司(以下简称“...
一个人开什么店好,两万块开什么... "劳动人民、劳动灵魂和劳动都是人."这在去年开始流行,所有工作的人都拿他们的工作开玩笑。经过几十年的...
杭州市城区周边哪里有菜地(旱地... 杭州市城区周边哪里有菜地(旱地)或山地租?我想租个几亩种种?若有,大概要多少钱一亩?杭州市城北郊区就...
西湖不欢迎“粗暴的手” 转自:中国环境网近日,“杭州西湖石刻有人拔断松鼠尾巴”一事引起了网友们的关心和讨论。对此,西湖水域管...
吕姓股民向普利退发起索赔 许峰...   受损股民可至Hehson股民维权平台登记该公司维权:http://wq.finance.sina...
家里有几个多事的大姑姐怎么办 家里有几个多事的大姑姐怎么办其实只要心态放平一点就好了,家里的大姑姐平常也没有什么事情做,所以只能聊...
贝尔计划赛季末重返皇马,贝尔重... 贝尔计划赛季末重返皇马,贝尔重回皇马的主要原因有哪些?齐达内让他进入首发,不是信任,而是希望在今年夏...
名侦探柯南为什么会有快兰的说法 名侦探柯南为什么会有快兰的说法你可以去看剧场版十四天空中的遇难船的1分30秒的预告片里面有……小兰和...
求跟侠岚类型的动画片 求跟侠岚类型的动画片《千年寻》一样!
刘备为何不踏实治理好夺取的荆州... 刘备为何不踏实治理好夺取的荆州四郡,而是非要借南郡?因为南郡的地理位置太过于紧要,是荆州四郡的门户,...
问道手游70套装怎么做 问道手... 问道手游70套装怎么做 问道手游70级极品套装打造步骤全面解析首先来说的第一个问题 套装是由超级...
苏超第四轮燃爆,网友:小龙虾大... 格隆汇6月14日|据央视财经,在苏超第四轮赛事中,淮安队将迎战南京队,被大家调侃是“小龙虾”与“盐水...
卓驭科技CEO沈劭劼:智能驾驶...   2025第十七届轩辕汽车蓝皮书论坛于2025年6月13日-15日在广州举行。卓驭科技CEO沈劭劼...
倾世王妃的繁体字怎么写的啊 倾世王妃的繁体字怎么写的啊倾世皇妃__倾世皇妃倾世王妃差别就在第一个字
羊城夏夜上演“粤乐新唱·潮挞非... 中新网广州6月14日电 (程景伟 文瑶)当高胡的悠扬遇见架子鼓的爆裂,当粤剧的锣鼓铿锵与贝斯的低沉吟...
前5月我国人民币贷款增加10.... 转自:中工网人民日报海外版北京6月13日电(记者徐佩玉)中国人民银行13日发布的金融统计数据显示,前...
光纤宽带机房为什么有尖叫声 光纤宽带机房为什么有尖叫声呵呵,主板设备,交换机里面有很多小的散热风扇,你听到的声音应该是风扇的声音...