《PostgreSQL 分布式数据库的开源新选择 CloudberryDB -马涛(可分享).pdf》由会员分享,可在线阅读,更多相关《PostgreSQL 分布式数据库的开源新选择 CloudberryDB -马涛(可分享).pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、PostgreSQL中社区第13届PostgreSQL中国技术会聚焦云端创新 汇聚智慧共享涛 HashData 联合创始PostgreSQL 分布式数据库的开源新选择 CloudberryDBPostgreSQL中社区HashData 企业产品03Greenplum 闭源0102PostgreSQL中社区录contentsCloudberryDB 开源PostgreSQL中社区公司简介北京酷克数据科技有限公司2016年3,酷克数据成,由Greenplum和Apache HAWQ的三位核研发员创,专注于云端数据仓库等数据平台类产品研发。公司总部位于北京,在上海、州、深圳、天津、武汉、杭州、新加坡
2、/洛杉矶(筹)等地设分机构。国家新技术企业信息技术应创新作委员会会员单位中国数据产业态联盟会员单位专注云化技术路线16年开始专注投云原技术路线(创新性采元数据、存储、计算三层分离架构),充分利云平台近乎限的存算资源,及弹性伸缩特性,以更低成本、更快的速度对越来越多样的数据进越来越复杂的分析,让数据能够便捷效地流动、交易、融合。拥有顶级团队成员核团队由Pivotal、Teradata、IBM、Yahoo!、Oracle和华为等资深云计算、分布式数据库和数据专家组成。服务众多知名企业服务融、电信、能源、互联等业头部客,其中最客规模已超过20000个节点。01Greenplum 闭源PostgreS
3、QL中社区PostgreSQL中社区Greenplum 源码归档事件回顾源码只读,无法获取更新,过往 Release、PR、Issue 清空,Slack 关闭;无提前通知,一顿操作猛如虎。已进入纯商业闭源开发,商业版 7.2 发布。PostgreSQL中社区何以应对 GP 源码归档及后续闭源险?开源开源诉求:原有 Greenplum 社区用户(如科研院所)、开发者、下游厂商、生态项目伙伴(如 ApacheMADlib 等)开源:词语不变,意义不同,“变”与“不变”基本不变:开放源码,遵循 Apache License v2,授予商用、修改、分发等权利根本改变(当前 理想目标):所有权:由单一厂
4、商控制的开源,转向中立软件基金会所属;每个软件都有生命周期,归档由社区投票决定,而非单一厂商共识机制:由单一厂商内部决策,转向基于共识的社区决策和治理全向开放:由单一厂商内部开放,转向面向社区的文档、设计、讨论、决策开放社区驱动:鼓舞终端用户、下游厂商由单纯消费者,转向参与上游决策与贡献反馈为大众计:商业产品昂贵费用对中小团队无法承担为生态计:闭源造成原有开源生态中断、丧失支持为自己计:新生代同类开源竞品项目追赶和壮大PostgreSQL中社区Cloudberry Database:接棒 Greenplum 继续前由前原厂 Greenplum 开发团队倡议发起(HashData 拥有全球 To
5、p2 原厂 Greenplum 内核开发团队)目标:与 Greenplum 保持原生兼容,实现无缝迁移,成为 Greenplum 的最佳开源替代You can use Cloudberry the way using Greenplum作为 Greenplum 的衍生版,不是简单地 Fork 代码,而是有所为并形成价值差异化:具备更新 PostgreSQL内核版本、持续增强 Greenplum 分析能力等GitHub:https:/ Apache License v2.02CloudberryDB 开源PostgreSQL中社区PostgreSQL中社区Cloudberry Database:
6、关键新增程特性支持轻松升级PostgreSQL 内核支持非结构化数据统一纳管多场景性能优化实现行列混合存储支持全文检索引擎安全增强支持集群扩缩容图形化管理工具PostgreSQL中社区Cloudberry Database:关键新增程特性详解(1)持轻松升级 PostgreSQL 内核版本(已开源)减少 Greenplum 对 PostgreSQL 内核强侵入、降低强耦合度,以“扩展插件/Library”模式重构部分实现,支持PostgreSQL 内核版本轻松升级。持统管理结构化数据(已开源)引入“Directory Table”概念特性,用于存储、管理和分析非结构化数据对象,实现集中管理和统