请问在两种PythonAPI中取数有性能差距的原因

测试场景

case1:使用loadTableBySQL

case2:使用 select属性查询数据

attachments-2022-12-hhSgiFYm6392a4adef8ae.png结果:性能差距100倍

请先 登录 后评论

1 个回答

Jax Wu

第一种: 使用loadTableBySQL是在server端执行好了查询脚本

第二种: 其实只是拼接好了命令,并未实际执行查询脚本

综上:

两种数据都是并未将数据传输到客户端,都是需要加.toDF才会将数据传输到客户端。之所以有差距100倍,第二种只是拼接字符串

请先 登录 后评论