導(dǎo)語(yǔ):市場(chǎng)上首個(gè) K8s 上的大數(shù)據(jù)平臺(tái),開(kāi)源了!
智領(lǐng)云自主研發(fā)的首個(gè)完全基于Kubernetes的容器化大數(shù)據(jù)平臺(tái)
Kubernetes Data Platform (簡(jiǎn)稱KDP)
開(kāi)源啦!
開(kāi)發(fā)者只要準(zhǔn)備好命令行工具,一鍵部署
Hadoop,Hive,Spark,Kafka, Flink, MinIO ...
就可以創(chuàng)建以前要花幾十萬(wàn)甚至幾百萬(wàn)才可以買(mǎi)到的大數(shù)據(jù)平臺(tái)
無(wú)需再花大量的時(shí)間和經(jīng)費(fèi)去做重復(fù)的研發(fā)
高度集成,單機(jī)即可體驗(yàn)大數(shù)據(jù)平臺(tái)
在高級(jí)安裝模式下
用戶可在現(xiàn)有的K8s集群上集成運(yùn)行大數(shù)據(jù)組件
不用額外單獨(dú)建設(shè)大數(shù)據(jù)集群
項(xiàng)目地址:
https://github.com/linktimecloud/kubernetes-data-platform
辛辛苦苦研究出來(lái)的成果,為什么要開(kāi)源?
這波格局開(kāi)大,老板有話說(shuō)
問(wèn)題1:我們?yōu)槭裁匆_(kāi)源?
我們的產(chǎn)品一直是基于大數(shù)據(jù)開(kāi)源生態(tài)體系建設(shè)的。之前就一直有開(kāi)源回饋社區(qū)的計(jì)劃,但是因?yàn)橹癒ubernetes對(duì)于大數(shù)據(jù)組件的支持還不夠成熟,我們也一直在迭代與Kubernetes的適配,F(xiàn)在我們的企業(yè)版已經(jīng)在很多頭部客戶落地并且在生產(chǎn)環(huán)境下高效運(yùn)行,覺(jué)得這個(gè)版本已經(jīng)可以達(dá)到大部分生產(chǎn)級(jí)項(xiàng)目的需求,集成度以及可用性是能夠幫到有類似需求的用戶的,希望這次開(kāi)源能夠降低在Kubernetes上集成大數(shù)據(jù)組件的門(mén)檻,讓更多Kuberenetes和big data社區(qū)的同行們可以使用。
問(wèn)題2:開(kāi)源版本的KDP,能干啥?
KDP可以很方便的在Kubenetes上安裝和管理常用的大數(shù)據(jù)組件,Hadoop,Hive,Spark,Kafka, Flink, MinIO 等等,不需要自己一個(gè)一個(gè)去適配,可以直接開(kāi)始使用。然后KDP也提供集成的運(yùn)維管理界面,用戶可以從界面管理所有組件的安裝配置,運(yùn)行狀況,資源使用情況,修改配置。而且KDP會(huì)將一個(gè)大數(shù)據(jù)組件的所有負(fù)載(容器,pod)作為一個(gè)整體管理,用戶不需要在Kubernetes的控制平面上去管理單獨(dú)的負(fù)載。
問(wèn)題3:最大的亮點(diǎn)是?
只要你已經(jīng)在使用Kubernetes,那么在現(xiàn)有集群上十幾分鐘就可以啟動(dòng)一個(gè)完整的大數(shù)據(jù)集群,馬上開(kāi)始使用,極大的降低了大數(shù)據(jù)平臺(tái)的使用門(mén)檻。因?yàn)槲覀冞@個(gè)流程是高度集成的,整個(gè)安裝過(guò)程在一個(gè)單機(jī)環(huán)境下也都能啟動(dòng)(例如使用單機(jī)kind虛擬集群都可以),所以在測(cè)試和實(shí)驗(yàn)環(huán)境下都可以高效使用。當(dāng)然,啟動(dòng)之后Day 2的很多好處,例如資源的高效利用和集成的運(yùn)維管理,也是KDP提供的重要功能。
KDP,即在Kubernetes上使用原生的分布式功能搭建及管理大數(shù)據(jù)平臺(tái)。
將多套大數(shù)據(jù)組件集成在Kubernetes之上,同時(shí)提供一個(gè)整體的管理及運(yùn)維工具體系,形成一個(gè)完全基于Kubernetes的大數(shù)據(jù)平臺(tái)。企業(yè)級(jí)KDP更是支持在同一個(gè)Kubernetes集群中同時(shí)運(yùn)行多個(gè)大數(shù)據(jù)平臺(tái)以及多租戶管理的能力,充分發(fā)揮Kubernetes云原生體系的優(yōu)勢(shì)。
KDP,通過(guò)對(duì)開(kāi)源大數(shù)據(jù)組件的擴(kuò)展和集成,實(shí)現(xiàn)了傳統(tǒng)大數(shù)據(jù)平臺(tái)到K8s大數(shù)據(jù)平臺(tái)的平穩(wěn)遷移。
作為市場(chǎng)上首個(gè)可完全在Kubernetes上部署的容器化云原生大數(shù)據(jù)平臺(tái),智領(lǐng)云自主研發(fā)的KDP,深度整合云原生架構(gòu)優(yōu)勢(shì),將大數(shù)據(jù)組件、數(shù)據(jù)應(yīng)用及資源調(diào)度混排,納入Kubernetes管理體系,從而帶你真正玩轉(zhuǎn)云原生!
總體框架
簡(jiǎn)單來(lái)講,KDP可以允許客戶在Kubernetes上運(yùn)行它所有的大數(shù)據(jù)組件,并把它們作為一個(gè)整體管理起來(lái)。
在Kubernetes上運(yùn)行大數(shù)據(jù)平臺(tái)有三個(gè)好處:
第一,更高效的大數(shù)據(jù)組件集成:KDP提供標(biāo)準(zhǔn)化自動(dòng)化的大數(shù)據(jù)組件部署和配置,極大地縮短了大數(shù)據(jù)項(xiàng)目開(kāi)發(fā)和上線時(shí)間;
第二,更高效的大數(shù)據(jù)集群運(yùn)管:KDP通過(guò)大數(shù)據(jù)組件與K8s的集成,在K8s之上搭建了一個(gè)大數(shù)據(jù)組件管理抽象層,標(biāo)準(zhǔn)化大數(shù)據(jù)組件生命周期管理,并提供UI界面進(jìn)一步提升了部署、升級(jí)等操作的效率;
第三,更高的集群資源利用率:利用K8s的資源管理和配額機(jī)制,與其它系統(tǒng)共享K8s資源池,精細(xì)化資源管理,對(duì)比傳統(tǒng)大數(shù)據(jù)平臺(tái)約30%左右的資源利用率,KDP可大幅提升至60%以上。
社區(qū)
我們期待您的貢獻(xiàn)和建議!最簡(jiǎn)單的貢獻(xiàn)方式是參與Github議題/討論的討論。 如果您有任何問(wèn)題,請(qǐng)與我們聯(lián)系,我們將確保盡快為您解答。
微信群:添加小助手微信拉您進(jìn)入交流群
釘釘群:搜索公開(kāi)群組號(hào) 82250000662
貢獻(xiàn)
參考開(kāi)發(fā)者指南,了解如何開(kāi)發(fā)及貢獻(xiàn) KDP。
https://linktimecloud.github.io/kubernetes-data-platform/docs/zh/developer-guide/developer-guide.html