Spark sql读取数据库和ES数据进行处理代码
创始人
2024-03-28 13:43:52
0

读取数据库数据和ElasticSearch数据进行连接处理

import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.apache.log4j.Level;
import org.apache.log4j.Logger;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.sql.DataFrame;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SQLContext;

import com.dinpay.bdp.rcp.domain.FlowMain;
import com.dinpay.bdp.rcp.util.CodisUtil;
import com.dinpay.bdp.rcp.util.Constant;
import com.google.gson.Gson;

import redis.clients.jedis.Jedis;

/**
 * 首页的数据,定时Job定时刷新
 */
public class MainFlowProcedure{
     private static Logger logger = Logger.getLogger(MainFlowProcedure.class.getSimpleName());

     public static void main(String[] args) {
         
       //屏蔽日志
       Logger.getLogger("org.apache.spark").setLevel(Level.WARN);
       
       //配置SparkConf
       SparkConf conf = new SparkConf().setAppName("MainFlowProcedure").setMaster("local[2]");
       JavaSparkContext sc =new JavaSparkContext(conf);
       SQLContext sqlContext = new SQLContext(sc);
       
       registerTable(sqlContext,"t_sys_attention_library");
       registerTable(sqlContext,"t_sys_big_order");
       registerTable(sqlContext,"t_sys_doubtful_order");
       registerTable(sqlContext,"t_rc_event");
       registerESTable(sqlContext, "t_order");

       sqlContext.sql("select merchant_id,count(order_id) as txcnt ,sum(tx_money) as txamount from t_order group by merchant_id")
                    .registerTempTable("t_order_merchant");
    
       sqlContext.sql("select t2.merchant_id,count(t1.order_id) as bigcnt from t_sys_big_order t1 join t_order t2 on t1.order_id = t2.order_id group by t2.merchant_id")
                    .registerTempTable("t_big_merchant");


       sqlContext.sql("select t2.merchant_id,count(t1.order_id) as dbtcnt from t_sys_doubtful_order t1 join t_order t2 on t1.order_id = t2.order_id group by t2.merchant_id")
                  .registerTempTable("t_doubt_merchant");

       sqlContext.sql("select merchant_id,count(*) as rccnt from t_rc_event group by merchant_id")
                    .registerTempTable("t_rc_merchant");
       
       sqlContext.sql("select t1.merchant_id,t2.txcnt,t3.dbtcnt,t4.bigcnt,t2.txamount,t5.rccnt from t_sys_attention_library t1 left join t_order_merchant t2 on t1.merchant_id = t2.merchant_id left join t_doubt_merchant t3 on t1.merchant_id = t3.merchant_id left join t_big_merchant t4 on t1.merchant_id = t4.merchant_id left join t_rc_merchant t5 on t1.merchant_id = t5.merchant_id")
                  .registerTempTable("t_attention");
       //生成结果集
       DataFrame resultDF =sqlContext.sql("select t.merchant_id,t.txcnt,t.dbtcnt,t.bigcnt,t.txamount,t.rccnt from t_attention t"); 
       
       List flowMains = resultDF.javaRDD().map(new Function(){public FlowMain call(Row row){
FlowMain flowMain = new FlowMain();
               flowMain.setMerchantId(row.getString(0));
               flowMain.setTxCnt(row.isNullAt(1)?0:row.getInt(1));
               flowMain.setSuspectCnt(row.isNullAt(2)?0:row.getInt(2));
               flowMain.setBigAmountCnt(row.isNullAt(3)?0:row.getInt(3));
               flowMain.setTxAmount(row.isNullAt(4)?0.0:row.getDouble(4));
               flowMain.setTxRate("偏高");
               flowMain.setRcEventCnt(row.isNullAt(5)?0:row.getInt(5));
               return flowMain;
           }
       }).collect();
       
       Gson gson = new Gson();
       String res = gson.toJson(flowMains);       
       //连接codis进行操作,每次将新生成的数据,放到对应的key中
       Jedis jedis = CodisUtil.getJedis() ;
       jedis.set("mainFlow", res);
       logger.info("插入到Codis数据完成!!!");
       sc.stop();
   }
   
   //获取数据库的表注册为临时表
   private static void registerTable(SQLContext sqlContext,String dbtable){
       Map mcOptions =new HashMap();
       mcOptions.put("url", Constant.URL);
       mcOptions.put("driver", Constant.DRIVER);
       mcOptions.put("dbtable", dbtable);
       mcOptions.put("user", Constant.USER);
       mcOptions.put("password", Constant.PASSWD);
       DataFrame jdbcDF = sqlContext.read().format("jdbc").options(mcOptions).load();
       jdbcDF.registerTempTable(dbtable);
   }
   
   //获取ElasticSearch中的索引注册为表
   private static void registerESTable(SQLContext sqlContext,String index){
       Map esOptions =new HashMap();
       esOptions.put("es.nodes", Constant.ESNODES);
       esOptions.put("es.port", Constant.ESPORT);
       esOptions.put("es.index.auto.create", "true");
       
       DataFrame OrderDF = sqlContext.read().format("org.elasticsearch.spark.sql")
                                   .options(esOptions)
                                   .load(index+"/"+index);
       OrderDF.registerTempTable(index);
   } 
   
}

相关内容

热门资讯

股价走高触发强赎 7月将有两只... 近日,银行正股股价表现强势,多只银行转债触发强制赎回条款。7月1日是杭银转债最后一个交易日,其最后转...
300548,“改名”,股价历... 科技股和顺周期板块再现“跷跷板”走势。今天上午,顺周期板块走强,银行、有色金属、白酒、新能源等板块上...
明阳电路在昆山投资成立集成电路... 人民财讯7月2日电,企查查APP显示,近日,昆山华芯微测集成电路有限公司成立,法定代表人为窦旭才,经...
民生银行“易创E贷”获“202... 在近日举行的第七届数字普惠金融大会上,民生银行“易创E贷”产品凭借在服务科技型中小微企业的创新与实践...
机器人大军逼近,很快,亚马逊的...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 亚马逊正迅速接近仓库...
广东省教育考试院通报:不存在中... 7月2日,广东省教育考试院发布通报称,7月1日下午广东省初中学业水平考试(以下简称“中考”)数学科目...
国际油价承压 中东油企拟放缓全... 财联社7月2日讯(编辑 秦嘉禾)在国际油价下行压力加剧背景下,中东两大国有能源巨头——沙特阿美(Sa...
光伏50ETF、光伏龙头ETF... 光伏设备板块走强,亿晶光电、欧晶科技涨停。银华光伏50ETF、汇添富光伏龙头ETF、浦银安盛光伏龙头...
世界银行发布重磅预测:黄金今年... 错过上半年,别再错过下半年!世界银行继续看好贵金属前景,黄金、白银、铂金或将继续延续强势……世界银行...
洪灝称高分红投资策略应继续有所... 【#洪灝称高分红投资策略应继续有所表现#】中国股市近期一个显著趋势是分红和回购活动显著增加。其中,许...