这是一个能够透视Spark SQL执行结果,找出每一行数据源头的工具。借助Spark计算引擎完成结果数据的溯源功能。
java -version,看看JDK是否已经准备好,我们需要的是1.8或更高版本SPARK_HOMEtar -xzvf spark_tracer.gz解压缩工具软件spark_tracer目录,执行./run.sh,开启数据溯源工具trace 行号 表名; 显示指定的原始数据
数据生产的逻辑复杂多变,传统方法可能束手无策。Spark SQL Tracer可以帮你解决这些问题:
使用Spark SQL Tracer,让数据溯源变得简单、直观。 如果您没有Spark的环境,网站提供了web界面的演示地址:http://sqllineage.com/trace 可以验证数据溯源工具的溯源功能。