亞馬遜云科技(Amazon Web Services, AWS)宣布其無服務(wù)器大數(shù)據(jù)處理服務(wù)Amazon EMR Serverless正式在中國區(qū)域(由西云數(shù)據(jù)運(yùn)營的寧夏區(qū)域和由光環(huán)新網(wǎng)運(yùn)營的北京區(qū)域)上線。這一重要舉措標(biāo)志著中國地區(qū)的企業(yè)用戶現(xiàn)在能夠以更簡單、更高效、更具成本效益的方式運(yùn)行大規(guī)模數(shù)據(jù)處理與分析工作負(fù)載,無需預(yù)先配置、管理和擴(kuò)展底層基礎(chǔ)設(shè)施。
Amazon EMR(Elastic MapReduce)是業(yè)界廣泛使用的大數(shù)據(jù)處理服務(wù),支持包括Apache Spark、Apache Hive、Presto等在內(nèi)的流行開源框架,用于大規(guī)模數(shù)據(jù)處理、交互式分析和機(jī)器學(xué)習(xí)任務(wù)。而此次上線的EMR Serverless是其無服務(wù)器版本,旨在進(jìn)一步降低大數(shù)據(jù)分析的門檻與運(yùn)維復(fù)雜性。
核心優(yōu)勢:簡化運(yùn)維與提升敏捷性
對于傳統(tǒng)的大數(shù)據(jù)集群,企業(yè)需要投入大量精力進(jìn)行集群的規(guī)劃、配置、容量預(yù)估、擴(kuò)縮容管理以及運(yùn)行狀態(tài)監(jiān)控,這不僅消耗了寶貴的技術(shù)資源,也影響了數(shù)據(jù)分析的敏捷性。Amazon EMR Serverless從根本上改變了這一模式:
- 無需管理基礎(chǔ)設(shè)施:用戶完全無需預(yù)置、配置或管理服務(wù)器、虛擬機(jī)或集群。只需提交Spark、Hive或Presto作業(yè),服務(wù)會(huì)自動(dòng)配置所需的計(jì)算和內(nèi)存資源,并在作業(yè)完成后立即釋放資源。
- 自動(dòng)彈性伸縮:服務(wù)會(huì)根據(jù)作業(yè)負(fù)載的變化,在幾秒鐘內(nèi)自動(dòng)、精細(xì)地?cái)U(kuò)縮計(jì)算資源,確保作業(yè)始終擁有合適的資源量,同時(shí)避免了資源閑置帶來的浪費(fèi)。
- 按使用量付費(fèi):用戶僅需為作業(yè)實(shí)際使用的vCPU、內(nèi)存和存儲(chǔ)資源付費(fèi),精確到秒,實(shí)現(xiàn)了真正的“用多少付多少”的成本模型,尤其適合間歇性、可變或不可預(yù)測的工作負(fù)載。
- 開源框架兼容性:完全兼容Apache Spark、Hive和Presto的開源版本,用戶現(xiàn)有的代碼、應(yīng)用和庫無需修改即可遷移運(yùn)行,保護(hù)了既有技術(shù)投資。
在中國區(qū)域的應(yīng)用場景
隨著中國企業(yè)數(shù)字化轉(zhuǎn)型的深入,數(shù)據(jù)驅(qū)動(dòng)的決策變得至關(guān)重要。Amazon EMR Serverless在中國區(qū)域的上線,將為眾多行業(yè)場景提供強(qiáng)大支持:
- 數(shù)據(jù)湖分析與ETL:企業(yè)可以輕松地對存儲(chǔ)在Amazon S3數(shù)據(jù)湖中的海量數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和聚合,為商業(yè)智能報(bào)表和數(shù)據(jù)分析準(zhǔn)備高質(zhì)量的數(shù)據(jù)集。
- 交互式數(shù)據(jù)分析:數(shù)據(jù)分析師和業(yè)務(wù)人員可以通過熟悉的SQL工具(對接Hive或Presto)直接對數(shù)PB級別的數(shù)據(jù)執(zhí)行即席查詢,快速獲取業(yè)務(wù)洞察。
- 流批一體處理:結(jié)合Apache Spark Structured Streaming,可以構(gòu)建同時(shí)處理實(shí)時(shí)流數(shù)據(jù)和歷史批數(shù)據(jù)的統(tǒng)一管道,用于實(shí)時(shí)監(jiān)控、實(shí)時(shí)報(bào)表和實(shí)時(shí)推薦等場景。
- 機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué):為大規(guī)模的特征工程、模型訓(xùn)練和數(shù)據(jù)預(yù)處理提供彈性的計(jì)算平臺,加速AI/ML項(xiàng)目的迭代周期。
降低門檻,加速創(chuàng)新
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理表示:“Amazon EMR Serverless在中國區(qū)域的推出,是我們持續(xù)將全球領(lǐng)先的云服務(wù)引入中國,賦能本地客戶創(chuàng)新的又一例證。它讓各種規(guī)模的企業(yè),特別是那些缺乏專職大數(shù)據(jù)運(yùn)維團(tuán)隊(duì)的企業(yè),能夠更專注于從數(shù)據(jù)中提取價(jià)值,而非管理基礎(chǔ)設(shè)施的復(fù)雜性,從而更快地將數(shù)據(jù)分析成果轉(zhuǎn)化為業(yè)務(wù)競爭力。”
對于已在使用Amazon EMR的中國用戶,可以無縫地將現(xiàn)有作業(yè)遷移至Serverless模式,享受更簡化的運(yùn)維體驗(yàn)和更優(yōu)化的成本結(jié)構(gòu)。對于尚未開始大數(shù)據(jù)之旅的企業(yè),現(xiàn)在可以以極低的初始成本和運(yùn)維負(fù)擔(dān)啟動(dòng)項(xiàng)目,快速驗(yàn)證想法并擴(kuò)展業(yè)務(wù)。
Amazon EMR Serverless在中國區(qū)域的正式可用,為中國企業(yè)提供了一個(gè)現(xiàn)代化、高效且經(jīng)濟(jì)的大數(shù)據(jù)處理解決方案,有望進(jìn)一步推動(dòng)各行業(yè)數(shù)據(jù)分析和智能應(yīng)用的普及與深化。