6月22日,由中國信通院作為指導(dǎo)單位,阿里云、Grafana Labs聯(lián)合舉辦,云原生應(yīng)用平臺、天池平臺主辦的首屆阿里云可觀測技術(shù)峰會完美落幕。阿里云智能云原生應(yīng)用平臺負(fù)責(zé)人丁宇正式發(fā)布阿里云可觀測套件(Alibaba Cloud Observability Suite,ACOS),讓可觀測數(shù)據(jù)價(jià)值真正做到不止于觀測。
一、基于自身實(shí)踐,阿里云對于可觀測趨勢的判斷
作為國內(nèi)首批大規(guī)模踐行微服務(wù)架構(gòu)與DevOps的先行者,阿里云認(rèn)為作為向下連接基礎(chǔ)設(shè)施,向上承載業(yè)務(wù)的重要組成部分,應(yīng)用是云原生時(shí)代的最佳觀測視角,并具備著以下趨勢:
1.可觀測性成為云原生紅利釋放的前提條件
可觀測以應(yīng)用為中心,通過將日志、鏈路、指標(biāo)、事件等各種可觀測數(shù)據(jù)源進(jìn)行關(guān)聯(lián)、分析,更加快速、直接地找出根因。并提供一個(gè)可觀測界面,讓用戶可以靈活自由的在這些可觀測數(shù)據(jù)中進(jìn)行探索與分析。與此同時(shí),可觀測能力與云服務(wù)打通,即時(shí)強(qiáng)化應(yīng)用的彈性擴(kuò)縮容、高可用等能力,在發(fā)現(xiàn)問題時(shí)能夠更加快地解決相關(guān)問題,恢復(fù)應(yīng)用服務(wù)。企業(yè)對于運(yùn)維的要求不再局限于被動發(fā)現(xiàn)問題,而是更及時(shí)、主動、準(zhǔn)確地發(fā)現(xiàn)問題與洞察原因,為事前預(yù)防、事中處理、事后復(fù)盤提供決策依據(jù)。與此同時(shí),應(yīng)用相關(guān)的可觀測數(shù)據(jù)類型不斷豐富,指標(biāo)、日志、事件、鏈路相互連接,其背后的業(yè)務(wù)價(jià)值不斷釋放。
2.碎片化觀測趨勢已成,優(yōu)秀開源項(xiàng)目成為標(biāo)準(zhǔn)
隨著Kubernetes等云原生技術(shù)引領(lǐng)研發(fā)、運(yùn)維研發(fā)模式變革:Day0&Day1追逐效率,引發(fā)Day2復(fù)雜度大幅提升。企業(yè)IT架構(gòu)全棧上云催生統(tǒng)一監(jiān)控訴求,分布式云進(jìn)一步加劇復(fù)雜度。可觀測成為降低分布式熵增的唯一手段,應(yīng)用成為云原生可觀測最佳視角。全面云化,可觀測技術(shù)再次成為主角
可觀測開源、商業(yè)化項(xiàng)目不斷涌現(xiàn),國內(nèi)可觀測市場心智逐步形成,Prometheus、Grafana、Opentelemetry等可觀測標(biāo)準(zhǔn)也逐漸形成。SRE/DevSecOps/BizOps/FinOps/ChatOps新范式出現(xiàn),可觀測能力成為多重角色的共同關(guān)注點(diǎn)。
3.可觀測是保障安全生產(chǎn)與業(yè)務(wù)連續(xù)性的核心要素
不止于大促保障與日常輪值,如何圍繞自身實(shí)際業(yè)務(wù)需求,打造符合業(yè)務(wù)需求的可觀測能力,保障業(yè)務(wù)連續(xù)性成為眾多SRE團(tuán)隊(duì)的業(yè)務(wù)挑戰(zhàn)。
二、不止于觀測,阿里可觀測套件正式發(fā)布
阿里云于6月22日正式發(fā)布阿里云可觀測套件(Alibaba Cloud Observability Suite,ACOS)。阿里云可觀測套件圍繞Prometheus服務(wù)、Grafana服務(wù)和鏈路追蹤服務(wù), 形成指標(biāo)存儲分析、鏈路存儲分析、異構(gòu)構(gòu)數(shù)據(jù)源集成的可觀測數(shù)據(jù)層,同時(shí)通過標(biāo)準(zhǔn)的PromQL和SQL,提供數(shù)據(jù)大盤展示,告警和數(shù)據(jù)探索能力。為IT成本管理、企業(yè)風(fēng)險(xiǎn)治理、智能運(yùn)維、業(yè)務(wù)連續(xù)性保障等不同場景賦予數(shù)據(jù)價(jià)值,讓可觀測數(shù)據(jù)真正做到不止于觀測。
與眾多第三方服務(wù)或開源自建方案不同,阿里云可觀測套件實(shí)現(xiàn)多層次連接,全面打破數(shù)據(jù)孤島,挖掘數(shù)據(jù)背后的業(yè)務(wù)價(jià)值。
第一,向上形成兼容開源標(biāo)準(zhǔn)的統(tǒng)一觀測界面
與應(yīng)用實(shí)時(shí)監(jiān)控服務(wù)ARMS的應(yīng)用層監(jiān)控(APM)、前端體驗(yàn)監(jiān)控(RUM)、基于eBPF技術(shù)的K8s監(jiān)控、云監(jiān)控等阿里云自研可觀測產(chǎn)品雙向連接,將可觀測數(shù)據(jù)與分析能力以開放標(biāo)準(zhǔn)(PromQL)、統(tǒng)一開放界面(Grafana)的形式提供給用戶,便于用戶的再集成與二次加工。ARMS也全面支持OpenTelemetry SDK進(jìn)行自定義埋點(diǎn)的增強(qiáng)。
第二,向下連接阿里云可觀測數(shù)據(jù)存儲類產(chǎn)品
統(tǒng)一諸如日志服務(wù)SLS、Elasticsearch服務(wù)等可觀測數(shù)據(jù)存儲,以及散落在異構(gòu)數(shù)據(jù)存儲設(shè)施中(如Clickhouse、Lindorm、RDS)的可觀測數(shù)據(jù),實(shí)現(xiàn)可觀測數(shù)據(jù)源管理與異構(gòu)數(shù)據(jù)間無縫探索。
第三,橫向連接阿里云所有應(yīng)用管控產(chǎn)品與中間件產(chǎn)品
阿里云所有應(yīng)用管控(EDAS、SAE、ACK、FC等)與中間件產(chǎn)品全面擁抱開源可觀測標(biāo)準(zhǔn),并與可觀測套件進(jìn)行連接。目前,已有超過50款阿里云云服務(wù)通過Prometheus標(biāo)準(zhǔn)進(jìn)行觀測。
三、擁抱開源生態(tài),大力發(fā)展生態(tài)伙伴
阿里云作為國內(nèi)可觀測領(lǐng)域的引領(lǐng)者,不試圖用一站式產(chǎn)品或方案去解決所有問題。阿里云積極擁抱開源生態(tài),提供Prometheus監(jiān)控服務(wù)、Grafana服務(wù)、兼容OpenTelemetry、Skywalking等主流開源協(xié)議的鏈路追蹤服務(wù),共同形成新一代阿里云可觀測套件。使用標(biāo)準(zhǔn)化技術(shù)向下連接存量、碎片化可觀測數(shù)據(jù),向上幫助客戶形成自己獨(dú)有、無廠商鎖定的可觀測解決方案,實(shí)現(xiàn)真正的客戶成功。
在擁抱開源標(biāo)準(zhǔn)的同時(shí),我們積極反哺可觀測開源社區(qū)。Java診斷開源工具Arthas已成為可觀測領(lǐng)域最受歡迎開源工具之一,自研高性能可觀測數(shù)據(jù)采集器iLogtail也在眾多開發(fā)者的努力下,逐漸成為世界一流的開源可觀測數(shù)據(jù)采集器。
為了提供更豐富、優(yōu)質(zhì)、低門檻的可觀測服務(wù)與能力,阿里云大力發(fā)展生態(tài)伙伴。自2017年與Elastic公司合作,合力打造標(biāo)準(zhǔn)、可靠、低成本全觀測場景存儲及分析產(chǎn)品Elasticsearch。過去一年,阿里云與Grafana Labs、博睿數(shù)據(jù)、諧云、袋鼠云等企業(yè)達(dá)成戰(zhàn)略合作,與阿里云自研可觀測體系無縫集成,把引領(lǐng)業(yè)界標(biāo)準(zhǔn)的優(yōu)秀產(chǎn)品與技術(shù)服務(wù)帶給阿里云的海量客戶。
四、阿里云可觀測套件深受行業(yè)認(rèn)可
阿里云可觀測憑借其完備產(chǎn)品能力與良好的生態(tài)集成能力,以及出色的成本優(yōu)勢,收獲了國內(nèi)外行業(yè)機(jī)構(gòu)的高度認(rèn)可。阿里云應(yīng)用實(shí)時(shí)監(jiān)控服務(wù)ARMS在今年獲得中國信通院首批可觀測產(chǎn)品先進(jìn)級認(rèn)證。同時(shí),阿里云連續(xù)兩年進(jìn)入Gartner APM與可觀測魔力象限,今年更是成為唯一入選的中國廠商。
萬物皆云的時(shí)代,可觀測性讓云計(jì)算更易用高效,也將可觀測數(shù)據(jù)的業(yè)務(wù)價(jià)值最大程度釋放。“觀測力”已成為每個(gè)IT人的必備核心競爭力。不止于觀測,可觀測幫助企業(yè)分析、洞察并實(shí)現(xiàn)高質(zhì)量的決策與業(yè)務(wù)創(chuàng)新。而阿里云將不斷推動可觀測技術(shù)演進(jìn)與落地實(shí)踐,幫助企業(yè)真正實(shí)現(xiàn)高質(zhì)量數(shù)字化轉(zhuǎn)型與創(chuàng)新。