作为全新架构的实时分析平台,Vertica 有很多的创新,特点包括:
列式存储和计算
通过列式计算和强大的主动
数据压缩
,大幅降低成本高昂的磁盘
I/O
(主要是传统的以行为存储单位的
SQL
数据库使用),执行查询的速度可提升 50 到 1000倍,
存储成本
最高削减 90%。
基于无共享的MPP 架构,支持在线添加数量不限的X86 工业标准服务器,可根据需求任意扩展解决方案。
实时分析
通过内存与磁盘混合存储架构,以及原生支持kafka 消息系统的连接,支持数据实时装载和秒级分析。
Vertica 支持关系数据库
事务处理
和ACID 规范,支持SQL-92/SQL-99/SQL-2003 标准,提供
ODBC
、JDBC、
ADO.NET
接口规范
驱动,完全兼容传统关系数据库的开发、使用和管理习惯,可以轻松与现有的
ETL
和
报表工具
集成,保护客户已有的投资。
可扩展的数据库内部分析框架
采用面向用户定义的过程式分析的强大开发框架,实现了对于数据库内部处理的
开放式
访问。除了使用内置的 SQL 分析和
聚合函数
外,还可借助 C++/Java/
R语言
软件开发
人员套件 (
SDK
) 定义自己的定制函数。SDK 功能可保证沙盒安全,并使函数能够并行运行以加快
运行速度
。
Vertica 可以作为SQL 分析引擎直接部署到Hadoop 集群中,直接存取HDFS上的数据;也可以通过标准SQL
直接访问
Hive 等管理的数据,并与Vertica 管理的数据进行
关联分析
;另外Vertica 还提供应用
编程接口
(
API
)支持与
MapReduce
、Pig 等框架构建结构化、半结构化和非结构化深度融合的
大数据分析
应用。
不间断运行,并具有数据复制、
故障转移
和恢复功能;Vertica 进行了
性能优化
,并且对业务和运营团队完全透明。
通过强大的 API 集合来监控系统的资源、
后台进程
、工作负载及性能,通过工作负载分析和
数据库设计器
自动优化数据库,简化
系统管理
。
2005年,发表《C-Store: A Column-oriented DBMS》论文,Vertica系统公司成立。
2010年,Vertica在Sybase发起的
专利侵权诉讼
中胜出,法院驳回了所有侵权请求。
2011年3月,
惠普
公司收购Vertica系统公司。
2006-2012年,发布了1.0-6.x,奠定了MPP列式
数据库引擎
地位。
2013年,发布7.0,重点增加了Flex Tables支持
半结构化数据
的快速探索、Live Aggregate Projections支持数据实时聚合。
2014年,发布7.1,重点增加地理
空间信息分析
扩展、SQL on Hadoop的新部署模式。
2015年,发布7.2,重点增加了高性能ORC/Parquet开放格式读取功能、Kafka流式数据为批量加载功能。