KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

引言

“我們應該忘記小的效率,在大約97%的時間里:過早的優(yōu)化是萬惡之源。

----Donald Knuth《結構化編程與go to語句》

圍繞 Kubernetes 所構建起來的項目儼然已經(jīng)成為了現(xiàn)代基礎設施的骨干。下圖來自 Kubernetes 在 GitHub 網(wǎng)站的代碼相關度的圖示(來源:阿里巴巴開源治理辦公室 趙笙雨):

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

從這個角度來看,Kubernetes 像傳統(tǒng)意義上的計算機操作系統(tǒng)一樣,不僅要承載底層的網(wǎng)絡、存儲、資源調(diào)度等功能,還要擔起各種應用調(diào)用的管理、性能的監(jiān)控、以及身份/安全/策略等,一個分布式的操作系統(tǒng)儼然已經(jīng)成型。那么我們不妨以這樣的一個角度來切入,來試圖探究 Kubernetes 的衡量與效用。

分論壇主題介紹  

可觀察性  

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

你很難想象沒有衡量的世界是什么樣的?從人體的溫度、心臟跳動的次數(shù)、大氣的壓力、計算機的運算能力、磁盤的存儲能力、電商網(wǎng)站的交易量……毋寧說這個世界由可觀察性 - 衡量來驅動的,你知道目前人類百米速度可以達到多少、超級計算機可以每秒計算多大的數(shù)據(jù)、人類距離火星有多遠、距離下一次哈雷彗星略過地球還有多少天……沒有衡量,現(xiàn)代人恐怕連門都出不了,今天的交通是否擁堵?空氣濕度如何?風力多大?飛機是否延時?現(xiàn)在時刻是幾時?我昨天下的訂單,今天什么時候可以拿到?

回到計算機本身,回到分布式系統(tǒng)本身,我們要知道 Kubernetes 的網(wǎng)絡流量、服務發(fā)現(xiàn)、性能調(diào)度等等諸多指標項,方能進行改進和優(yōu)化。本屆 KubeCon + CloudNativeCon 帶來的關于可觀察性的議題有關于圍繞 Kubernetes 的各種監(jiān)控工具的介紹和實踐:

來自 Improbable 的兩位工程師 Dominic Green 和 趙一凡,給我們介紹Improbable 如何能成功擴展指標平臺,達到全球規(guī)模。Prometheus 是Improbable平臺的堅實基礎,Thanos 是一個 OSS 項目,可確保 Prometheus 抓取工具的全球查詢和高可用性。通過添加 Envoy,Improbable 可以解鎖跨集群、跨云通信,支持工程師全面監(jiān)控遍布全球的 Kubernetes 平臺。

Alibaba 因為有雙11背書,有著全球罕見的交易高峰挑戰(zhàn),所以對性能的可觀察性、可用性、故障的快速恢復有著難以項背的經(jīng)驗,這次峰會帶來兩場關于此方面的分享,分別是:  

關于 Prometheus 和 Thanos 的擴展,來自阿里巴巴的工程師 Tao Li 和他的同事 Guo'an Qin 來分享:1、如何使用 Prometheus 支持大規(guī)模場景?2、如何使用 Thanos 實現(xiàn)低查詢延遲,從而解決多個 Prometheus 實例導致的數(shù)據(jù)查詢問題?3、我們從 Prometheus 和 Thanos 配置中汲取的經(jīng)驗教訓,例如目標發(fā)現(xiàn)以及記錄和警報規(guī)則管理。

關于超大規(guī)模的容器故障恢復,由阿里巴巴的工程師 Xiong Huan 帶來:如何利用 1-5-10 提高大規(guī)模容器的可靠性:1、如何在本地建立一個有效代理,在 1 分鐘內(nèi)檢測到問題;2、如何借助專家知識庫智能診斷容器問題;3.如何以故障驅動型方式自動恢復容器問題。

來自 Apache 基金會的頂級項目 SkyWalking 項目展示,這充分體現(xiàn)了社區(qū)的寬容性,來自 Apache 成員,SkyWalking 的 PMC Sheng Wu,將和他在 Tetrate 的同事 Lizan Zhou 來和大家分享 SkyWalking 和 Envoy 配合,在沒有代碼注入技術或 Istio Mixer 的情況下,我們可以從 Envoy 構建遙測并在 SkyWalking 中進行分析,并且性能良好。用戶可以獲得清晰直觀的服務拓撲圖、指標圖、請求詳細信息和錯誤消息。充分體現(xiàn)開源的開放優(yōu)勢,無縫整合所有兼容性的項目。

那么,KubeCon + CloudNativeCon 的可觀察性論壇都有哪些精彩演講呢?

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

內(nèi)容更新請參閱選擇:KC+CNC - 可觀察性。

身份 + 安全 + 策略

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

似乎所有人都會在開源的易用性和安全性上下功夫,就在整個行業(yè)趨于開源和基于云的大勢之下,唯有一個領域巍然不動,甚至還有上升的趨勢,那就是關于身份/安全/策略的問題,這其中的永恒平衡之道,確實也是充滿商業(yè)機會的空間??纯催@次有何精彩的平衡之道:

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Isaku Yamahata – Intel云軟件架構師

來自 Intel 的 Isaku Yamahata 和來自阿里巴巴的 Xiaoning Li 將給我們帶來,Software Guard Extention (SGX) 提供只信任英特爾和 SGX 實施,連 OS / VMM / BIOS 都不信任的可信執(zhí)行環(huán)境 (TEE)。它需要修改應用,但由于各種原因有時很難修改應用。理想情況下,未修改的用戶二進制文件可以在 SGX 安全區(qū)中運行。帶來允許未修改的二進制文件在 SGX TEE 中運行的庫操作系統(tǒng)。它通過替換共享庫來掛鉤系統(tǒng)調(diào)用。Go 是云原生應用的最流行語言,具有使用靜態(tài)鏈接的獨特能力。對 Graphene LibOS 進行了增強以支持 golang 二進制,并將其硬化以供生產(chǎn)使用。將分享為 Graphene - SGX LibOS 添加 golang 支持的經(jīng)驗以及未來的計劃。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Torin Sandall – Styra軟件工程師

來自微軟公司的 Nikhil Bhatia 和 Styra 的 Torin Sandall 將介紹由 Google、Microsoft 和 CNCF 的開放策略代理 (OPA) 項目與社區(qū)共同開發(fā)的全新 Gatekeeper 項目。在這次分享中,作為聽眾的您將會了解如何著手使用上游策略庫,其中包括適用于常見場景的規(guī)則,例如鏡像注冊表白名單、標簽管理等。還將了解如何使用自己的自定義規(guī)則擴展 Gatekeeper,然后將其貢獻回社區(qū)。最后,如何在軟件生命周期的不同階段(例如CI / CD 和審計)應用相同的策略。

Google 提出的 SPIFFE,該提議使用 SPIFFE 提出的信任域和捆綁標準解決了不同信任域之間的基本身份聯(lián)合問題。作為 SPIFFE / SPIRE 的重要協(xié)作者,Istio 采用此標準來支持與 SPIRE 和其他身份系統(tǒng)的聯(lián)合。這一新提出的標準可支持多個服務網(wǎng)格安全地建立信任,從而進行跨網(wǎng)格安全通信。以上內(nèi)容將由 Google 的工程師 Yonggang Liu 和 Wenchenglu 來共同分享。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Brandon Lum – IBM軟件工程師

來自IBM的工程師則會介紹關于加密容器鏡像方面的內(nèi)容,他們會向觀眾展示用戶如何在構建過程中創(chuàng)建加密容器的端到端流程,以使用建議的 ImageDecryptSecrets 在 Kubernetes 集群上運行加密容器鏡像。以及還將展示加密鏡像 OCI 規(guī)范如何通過容器鏡像的分層來進行細粒度加密。最后,會討論下 Image Encryption 將如何集成到容器生態(tài)系統(tǒng)中,并討論容器 DevSecOps 管道創(chuàng)新的幾種可能性。他們是 Brandon Lum 和 Harshal Patil。

那么,KubeCon + CloudNativeCon 的安全 + 身份 + 策略論壇都有哪些精彩演講呢?

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

內(nèi)容更新請參閱選擇:KC+CNC - 安全 + 身份 + 策略。

性能  

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

從匠藝的角度來講,工程師恨不能榨干計算機的每一份能力,但是往往事情并不是那么理想的狀態(tài),還是需要根據(jù)實際的場景進行適當?shù)恼{(diào)整,這個世界沒有適合所有人腳的鞋子的,只能具體的情況具體分析。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Scott Zhou –騰訊 專家工程師

Serverless 是騰訊云押寶的重要技術領域,所以總要和這個扯上點關系,不過 Serverless 確實遇到很大的挑戰(zhàn)就是如何快速的響應突入起來的代碼請求,即所謂的冷啟動問題,騰訊的工程師 Scott Zhou 和 Yanbo Li 分三個部分來講解他們的實踐:首先,會介紹下騰訊云的 SCF 架構 - 包括網(wǎng)絡、基礎設施和功能部署 - 以及導致冷啟動延遲的因素。接著會介紹下為改進冷啟動而正在進行的架構更改,包括對彈性網(wǎng)絡接口的改進、從容器到微虛擬機的遷移、功能代碼部署和資源重用。最后,會介紹下如何將 ML 與自動縮放相結合,以避免冷啟動。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Google 這個環(huán)節(jié)仍然不會缺席,由 Jingyi Hu 和 Wenjia Zhang 帶來的是 etcd 相關的內(nèi)容,首先,必須監(jiān)控是否存在 leader,否則系統(tǒng)將變得不可用。此外,頻繁的領導變動可能會影響共識系統(tǒng)的性能。因此,leader 相關指標至關重要。其他一些 etcd 指標也需要特別注意。磁盤 I / O 和網(wǎng)絡 I / O 相關指標提示物理約束。延遲和吞吐量指標只有在硬件配置中進行交叉引用時才有意義。我們將向大家介紹 etcd 基準測試工具,解釋重要的 etcd 指標,并最終幫助您了解如何在一些案例研究中應用 etcd 指標。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Josh Berkus – Red Hat社區(qū)領導

云原生改變了一些過去的基準測試,比如數(shù)據(jù)庫,紅帽作為企業(yè)開源的帶頭人,敢為身先也是絕了,Josh Berkus 將會和大家分享在過去幾個月中,紅帽對 PostgreSQL、CockroachDB 和文件系統(tǒng)的基準測試結果,以便讓聽眾可以做出最好的權衡。甚至還會教您如何對自己的平臺進行基準測試。

阿里巴巴認為自己是 Kubernetes 的不錯的實踐者了,甚至開始改進原生的功能,比如 Kubernetes Master 節(jié)點的性能,這次帶來的分享是如何進行各種基準測試和性能分析的。又是如何對主設備進行調(diào)整/微調(diào),并將主設備的性能提升 100 倍以上。目前,運行 10K 節(jié)點 kubernetes 集群同運行 2k 節(jié)點集群一樣流暢。

那么,KubeCon + CloudNativeCon 的性能論壇都有哪些精彩演講呢?

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

內(nèi)容更新請參閱選擇:KC+CNC - 性能?! ?/p>

機器學習 + 數(shù)據(jù)  

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

毫無諱言,人工智能相關的技術需要分布式的計算環(huán)境,基于 Kubernetes 的相關內(nèi)容也在不斷的不工程師們所挖掘和探討,比如 Kubeflow 就是基于此形式下的一次很好的嘗試,Kubeflow 提供了在 Kubernetes下做 TensorFlow 的相關計算,而 TensorFlow 則也是炙手可熱的開源項目,我們就來介紹三個相關的議題:

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Google 的 Richard Liu 和思科的 Johnu George 將向我們介紹關于 Kubeflow 的最佳實踐:在機器學習中,超參數(shù)調(diào)優(yōu)是指為訓練模型找到最優(yōu)約束的過程。選擇最優(yōu)超參數(shù)可以大幅提高算法的性能,但是該過程既耗時又昂貴。有鑒于此,發(fā)起了 Katib 開源項目,在 Katib - Kubeflow 平臺中推出了超參數(shù)調(diào)優(yōu)服務。Katib 以自定義資源的形式提供了一套豐富的管理 API。我們將演示如何在筆記本環(huán)境中訓練模型、配置超參數(shù)調(diào)優(yōu)研究,以及如何在 UI 儀表板中比較實驗結果。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

Lei Xue – Momenta技術負責人  

自動駕駛汽車需要硬件加速機器學習來解決跟蹤和分類等關鍵問題。Momenta 在本地和公共云中訓練 ML 模型,每個模型有著不同的 GPU 和網(wǎng)絡接口(Infiniband,RoCE)。在本次演講中,來自 Momenta 的 Lei Xue 和 Google Fei Xue 將討論如何使用 Kubernetes 構建多云ML 平臺,特別是如何在不同環(huán)境中管理訓練數(shù)據(jù);如何處理多用戶和群組調(diào)度;以及如何支持異構硬件。

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

深度學習任務既是網(wǎng)絡密集型又是 GPU 密集型,因此對編排進行適當優(yōu)化非常重要。易發(fā)的不平衡會導致閑置計算容量,這對于 GPU 節(jié)點來說成本太高昂了(與 CPU 相比)。通過分享的經(jīng)驗,希望可提供有用的洞察,幫助從機器學習任務中獲得更好的經(jīng)濟效益。來自螞蟻金服的 Yuan Tang 和 MobileIron 的 Yong Tang 將帶來將分享他們的一線經(jīng)驗,并比較兩個開源 Kubernetes 運算符:tf - operator 和 mpi - operator。這兩個運算符都為 TensorFlow 管理訓練任務,但有著不同的分配策略,這就造成了 CPU、GPU 和網(wǎng)絡利用率方面的不同性能結果。解決這些問題的實踐就是這次要和大家分享的。

那么,KubeCon + CloudNativeCon 的機器學習 + 數(shù)據(jù)論壇都有哪些精彩演講呢?

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

內(nèi)容更新請參閱 https://kccncosschn19chi.sched.com 選擇:KC+CNC - 機器學習 + 數(shù)據(jù)。

總結

300+ 的演講者分享,任誰也無法照顧到所有,我們會盡最大努力幫助你梳理,根據(jù)你的興趣來找到對應的分享嘉賓,讓你有所成長、有所收獲。

在即將迎來的 Kubernetes 五周年之際,知名媒體《財富》發(fā)文總結了 Kubernetes 帶給開源社區(qū)的五大業(yè)績,確實是實至名歸:

1.Kubernetes 獲得了開源社區(qū)的青睞;

2.Kubernetes 開創(chuàng)了新的市場和生態(tài);

3.Kubernetes 贏得了企業(yè)級市場;

4.Kubernetes 正在成為現(xiàn)代基礎設施的骨干;

5.Kubernetes 創(chuàng)建了數(shù)萬個工作崗位。

再回到我們文章開頭的部分,有人如此下結論說,一個開源項目的成熟和壯大,不僅僅是很多巨頭參與進來,而是圍繞此產(chǎn)生的利基市場的創(chuàng)業(yè)公司開始豐富起來了,從可觀察性、安全/身份/策略、性能、機器學習和數(shù)據(jù)這幾大塊來說,可以明顯的證明這個強相關性。期待作為觀眾的你不要錯過這樣的機會。圍繞 Kubernetes 的生態(tài)尚處于早期,從跨域鴻溝的理論即市場生命周期來講,尚處于早期采用者階段,加入這個生態(tài)是有很多機會存在的,值得去奮斗并把握!

KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手

出乎意料的是,本次大會的售票異?;鸨鲇跁龅陌踩紤],參加大會的人數(shù)是被嚴格限制的,會務組將根據(jù)注冊的人數(shù)提前關閉超過限額的售票通道,所以千萬不要等到通道被關閉后再追悔莫及,且現(xiàn)在的票價還有優(yōu)惠?! ?/p>

標準票價優(yōu)惠只到6月6日,欲購從速:  

標準注冊:2000人民幣(晚注冊2400,即時可省400!)

貴賓注冊:5000人民幣(晚注冊6000,即時可省1000!)

個人或學術注冊:500人民幣(需要發(fā)送電子郵件至events@cncf.io申請批準。晚注冊600,即時可省100!)

請!注!意!6月7日下周五就要實行晚注冊票價了,切勿猶豫不決,抓住最后標準票的機會。

2019年 6月24日~26日,請大家抓住機會,我們在上海世博中心不見不散!

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2019-05-30
KubeCon + CloudNativeCon帶你深入Kubernetes: 從可觀察性、性能、安全身份策略、機器學習數(shù)據(jù)入手
引言“我們應該忘記小的效率,在大約97%的時間里:過早的優(yōu)化是萬惡之源。

長按掃碼 閱讀全文