spark 至轻云演示

Last updated on November 20, 2024 am

🧙 Questions

演示至轻云快速使用

☄️ Ideas

1. 购买服务器

过滤4核心8GB,然后任意选一个

20241101175851

选择Centos 7.9 64位的系统版本

20241101175920

注意安全组需要开放端口号,8080808180824040
固定宽带 1MB

20241101175947

自定义root密码

20241101180035

获取抢占服务器的内网ip和外网ip

20241101180120

系统信息如下
  • 系统:Centos7.9
  • 资源:4核8GB
  • 外网ip:47.92.206.49
  • 内网ip:172.16.215.83
  • 账号:root
  • 密码:Zhiqingyun123..

2. 进入服务器

ssh root@47.92.206.49

20241101180227

3. 安装java环境

sudo yum install java-1.8.0-openjdk-devel java-1.8.0-openjdk -y 
java -version

20241101180421

4. 下载至轻云安装包

等待时间会比较久,大约1个GB大小安装包

cd /tmp
nohup wget https://isxcode.oss-cn-shanghai.aliyuncs.com/zhiqingyun/zhiqingyun.tar.gz >> download_zhiqingyun.log 2>&1 &
tail -f download_zhiqingyun.log

20241101181047

5. 解压安装包

cd /tmp
tar -vzxf zhiqingyun.tar.gz

20241101181114

6. 启动至轻云

cd /tmp/zhiqingyun/bin
bash start.sh

20241101181156

7. 检测服务是否启动

20241101181317

8. 访问至轻云服务

1M的带宽,首次加载,大约40s

20241101181443

9. 创建用户租户

  • 创建用户zhiqingyun
  • 创建租户体验租户

10. 上传许可证

在官网的最下面,可以免费获取体验许可证

20241101181637

20241101181601

20241101181700

11. 安装集群

退出后台管理,使用zhiqingyun账号登录

20241101181813

20241101181829

20241101181846

StandAlone类型的集群,支持默认安装spark服务

20241101181911

20241101181923

推荐使用内网ip
host:172.16.215.83
用户名: root
密码: Zhiqingyun123..
默认安装Spark: 打开

20241101182039

20241101182056

20241101182118

20241101182151

20241101182209

12. 访问spark服务

20241101182243

20241101182258

13. 添加mysql数据源

如果用户没有可测试的mysql数据源,可以通过docker快速启动测试mysql

docker run \
  --name zhiqingyun-mysql \
  --privileged=true \
  --restart=always \
  -d \
  -p 30306:3306 \
  -e MYSQL_ROOT_PASSWORD=zhiqingyun123 \
  -e MYSQL_DATABASE=test_db \
  mysql:8.0
  • dbType: Mysql
  • jdbcUrl: jdbc:mysql://47.92.206.49:30306/test_db
  • username: root
  • password: zhiqingyun123

20241101185611

20241101182933

14. 新建作业流,执行默认sparksql

20241101183016

20241101183042

20241101183120

默认sql为查询当前时间

20241101183235

20241101183248

12. 新建jdbc执行sql

创建两个表,一张原始表一张结果表,并在原始表中插入一条数据

-- 原始表
create table users(
    username varchar(100),
    sex int,
    birth datetime
);
-- 结果表
create table users_result(
    username varchar(100),
    sex int,
    birth varchar(100)
);
insert into users values('zhangsan',13,now());

20241101183356

20241101183429

13. 新建jdbc查询sql

通过jdbc查询作业,查看原始表中的数据。

select * from users;

20241101183455

20241101183511

14. 自定义函数参考

15. 上传资源中心

自定义函数需要先上传编译的jar包

20241101183821

20241101183910

20241101183940

20241101183951

16. 新建自定义函数

20241101184033

  • 名称:to_chinese_date
  • 类型:UDF
  • 类名:com.isxcode.star.udf.Func
  • 返回类型:string
  • 备注:将时间格式转成中文

20241101184138

20241101184151

17. 使用自定义函数

新建sparksql查询作业,使用sparksql将原始表中的日期格式改成中文格式,并同步到结果表中。

CREATE TEMPORARY VIEW from_table
USING org.apache.spark.sql.jdbc
OPTIONS (
    driver 'com.mysql.cj.jdbc.Driver',
    url 'jdbc:mysql://47.92.206.49:30306/test_db',
    user 'root',
    password 'zhiqingyun123',
    dbtable 'users'
);
CREATE TEMPORARY VIEW to_table
USING org.apache.spark.sql.jdbc
OPTIONS (
    driver 'com.mysql.cj.jdbc.Driver',
    url 'jdbc:mysql://47.92.206.49:30306/test_db',
    user 'root',
    password 'zhiqingyun123',
    dbtable 'users_result'
);
insert into to_table select username,sex, to_chinese_date(birth) from from_table;
select * from to_table;

20241101184312

20241101184516

18. 自定义作业使用

上传资源中心

20241101184740

20241101184813

  • 应用名称: pi-demo
  • mainClass: org.apache.spark.examples.SparkPi
  • 请求参数: 10

20241101184903

20241101184941

19. 查看pi计算结果

20241101185144

20241101185206

可以查看pi的结果值

20241101185219

产品手册


spark 至轻云演示
https://ispong.isxcode.com/hadoop/spark/spark 至轻云演示/
Author
ispong
Posted on
October 23, 2024
Licensed under