星星软件园

首页 > 电脑软件 > 应用软件 > 数据库类 >  分布式SQL查询引擎(Presto) v0.241官方最新版
分布式SQL查询引擎(Presto) v0.241官方最新版

软件大小:23.9 MB

软件语言:简体中文

更新时间:2020-10-31

软件授权:免费版

软件类别:数据库类

应用平台:Win7/Win8/Win10

推荐星级:

官方网站: https://www.starxz.com/

  • 软件介绍
  • 相关软件
  • 相关教程
  • 下载地址

Presto是一款功能实用的分布式sql查询工具,该工具是一个基于Java开发的开源分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节,它本身并不存储数据,但是可以接入多种数据源,并且支持跨数据源的级联查询。

分布式SQL查询引擎(Presto) v0.241官方版

Presto介绍

Presto是一个针对大数据的分布式SQL查询引擎,第一次构建Presto后,你可以将项目加载到你的IDE中并运行服务器,我们建议使用IntelliJ IDEA,因为Presto是一个标准的Maven项目,你可以使用根pom.xml文件将其导入到你的IDE中。

软件特点

1.多数据源、混合计算支持:支持众多常见的数据源,并且可以进行混合计算分析;

2.大数据:完全的内存计算,支持的数据量完全取决于集群内存大小。他不像SparkSQL可以配置把溢出的数据持久化到磁盘,Presto是完完全全的内存计算;

3.高性能:低延迟高并发的内存计算引擎,相比Hive(无论MR、Tez、Spark执行引擎)、Impala 执行效率要高很多。根据Facebook和京东的测试报告,至少提升10倍以上;

4.支持ANSI SQL:这点不像Hive、SparkSQL都是以HQL为基础(方言),Presto是标准的SQL。用户可以使用标准SQL进行数据查询和分析计算;

5.扩展性:有众多 SPI 扩展点支持,开发人员可编写UDF、UDTF。甚至可以实现自定义的Connector,实现索引下推,借助外置的索引能力,实现特殊场景下的 MPP;

6.流水线:Presto 是基于PipeLine进行设计,在大量数据计算过程中,终端用户(Driver)无需等到所有数据计算完成才能看到结果。一旦开始计算就可立即产生一部分结果返回,后续的计算结果会以多个Page返回给终端用户(Driver)。

应用说明

1.实时计算:Presto 性能优越,实时查询工具上的重要选择。

2.Ad-Hoc查询:数据分析应用、Presto 根据特定条件的查询返回结果和生成报表。

3.ETL:因支持的数据源广泛、可用于不同数据库之间迁移,转换 和 完成 ETL 清洗的能力。

4.实时数据流分析:Presto-Kafka Connector 使用 SQL对Kafka的数据流进行清洗、分析。

5.作为MPP:Presto Connector 有非常好的扩展性,可进行扩展开发,可支持其他异构非SQL查询引擎转为SQL,支持索引下推。

安装说明

Presto安装:

Presto是一个标准的Maven项目。只需从项目根目录运行以下命令:

./mvnw clean install

在第一个构建中,Maven将从Internet下载所有依赖项并将它们缓存在本地存储库(~/.m2/repository)中,这可能会花费大量时间。随后的构建将更快。

Presto有一套全面的单元测试,可能需要几分钟才能运行。您可以在构建时禁用测试:

./mvnw clean install -DskipTests

环境需求

Mac OS X或Linux

Java 8 Update 151或更高版本(8u151 +),64位。支持Oracle JDK和OpenJDK。

Maven 3.3.9+(用于建筑)

Python 2.4+(用于与启动脚本一起运行)

支持的数据源

常见的RDBMS都支持,如:Oracle、MySQL、PG等;

NoSQL:MongoDB、Redis、ElasticSearch 等;

大数据:Hive、HBase(第三方)、Kudu、Kafka 等;

Presto 支持从多种数据源获取数据来进行运算分析,一条SQL查询可以将多个数据源的数据进行合并分析。如如下SQL:a可以来源于MySQL,b可以来源于Hive。

相关专题
  • 下载地址
分布式SQL查询引擎(Presto) v0.241官方最新版