用一个例子告诉你 怎样在spark中创建广播变量
创始人
2024-06-03 01:21:55
0

目录

1.什么是广播变量(Broadcast Variables)

2.使用广播变量 

3.重点关注


1.什么是广播变量(Broadcast Variables)

广播变量是Spark提供的一个共享变量(Shared Variables),允许同一个Executor中的多个Task读取同一份数据
    默认情况下,如果Executor节点上使用到了Driver端定义的变量(通过算子传递)
    算子会将该变量的副本发送的每个Task任务,反序列化后存储在Task节点内存中
    但是Spark为我们提供了一个共享变量,允许Driver端和Task之间共享一个变量
    降低通信成本和内存成本


2.使用广播变量 

  test("对吧 广播变量和join算子") {// 初始化 spark配置实例val sparkconf: SparkConf = new SparkConf().setMaster("local[4]").setAppName("")// 初始化 spark环境对象val sc: SparkContext = new SparkContext(sparkconf)var list: List[(Int, Int)] = List((1, 21), (2, 23), (3, 30), (4, 35))val rdd: RDD[(Int, String)] = sc.parallelize(List((1, "张飞"), (2, "赵云"), (3, "关羽"), (4, "奉先"), (5, "子路")))/** 使用spark的join算子** */val joinResult = rdd.join(sc.parallelize(list))joinResult.foreach(println(_))println("------------------------------------")/** 使用广播变量* */// TODO 1. 在Driver端声明广播变量val bc: Broadcast[Map[Int, Int]] = sc.broadcast(list.toMap)val bcResult: RDD[(Int, (String, Any))] = rdd.map(e => {// TODO 2. 在Task中读取广播变量val map: Map[Int, Int] = bc.value(e._1, (e._2, bc.value.getOrElse(e._1, null)))}).filter(_._2._2 != null)bcResult.foreach(println(_))while (true) {}sc.stop()}


3.重点关注 

1.广播变量是怎样 提升计算效率?
      减少了数据分发的次数,降低通信成本
      避免了Task节点反序列化变量副本,降低了内存成本
2.使用场景
     关联静态维表
     过滤黑名单、白名单
     join

传送门1: 传送门

传送门2:  传送门2

相关内容

热门资讯

广发中证传媒ETF联接E净值上... 广发中证传媒交易型开放式指数证券投资基金发起式联接基金(简称:广发中证传媒ETF联接E,代码0188...
求婚大概要准备些什么东西呢? 求婚大概要准备些什么东西呢?求婚大概要准备好,鲜花,戒指,还有一个浪漫又温馨的场地,如果喜欢热闹的可...
长得好看没钱的女生,嫁给了有钱... 长得好看没钱的女生,嫁给了有钱的男生变成了夫人。长得帅没钱?长得好看没钱的女生,嫁给了有钱的男生变成...
霍金名言:幸福是什么 霍金名言:幸福是什么霍金名言:幸福是什么霍金名言:幸福是什么我的手指还能活动,我的大脑还能思维;我有...
悬疑探险小说排行榜有没有? 悬疑探险小说排行榜有没有?悬疑探险小说排行榜有没有?首推当然是大名鼎鼎的《鬼吹灯》和《盗墓笔记》,《...
穿越火线中哪把枪最好 穿越火线中哪把枪最好麒麟。屠龙。AK。大炮
小鲤鱼跳龙门中大螃蟹帮小鲤鱼干... 小鲤鱼跳龙门中大螃蟹帮小鲤鱼干什么剪水草。画面中,小鲤鱼们在寻找龙门的路上经过一片芦苇丛时,有一条小...
华夏中证云计算与大数据主题ET... 华夏中证云计算与大数据主题交易型开放式指数证券投资基金(简称:华夏中证云计算与大数据主题ETF,代码...
保健ETF净值上涨1.02% 华泰柏瑞中证全指医疗保健设备与服务交易型开放式指数证券投资基金(简称:保健ETF,代码516790)...
生物科技ETF基金净值上涨1.... 民生加银中证生物科技主题交易型开放式指数证券投资基金(简称:生物科技ETF基金,代码516930)公...