外貿領航
首頁展會信息 > 字節跳動火山引擎上市「火山引擎是不是重點業務」

字節跳動火山引擎上市「火山引擎是不是重點業務」

來源:互聯網 2024-07-16 18:04:02

7月20日的火山引擎原動力大會上,火山引擎發布全新Slogan“云上增長新動力”,并推出以云為底座的一系列產品解決方案,包括企業上云和智能營銷通用方案,以及覆蓋金融、汽車、消費、文娛、醫療、通信傳媒六大行業的云上增長方案。

火山引擎機器學習系統負責人項亮在大會上正式發布并介紹了機器學習與推薦平臺多云部署解決方案。項亮介紹,抖音集團旗下不同業務的不同推薦系統,都是基于一個統一的訓練平臺提交,由統一的訓練系統訓練。現在,這種模式由火山引擎對外開放,為企業提供開放的AI基建,幫助企業更專注于業務。

抖音、頭條、西瓜等業務使用了推薦、廣告、搜索、創作和VR等技術。這些技術都比較重地應用到了AI。從系統的角度看,AI是一個定義的比較純粹的問題。因此,如何讓AI技術在不同業務中得到充分的復用,就變得很重要。

以推薦為例,抖音、頭條、番茄等業務的不同推薦系統的訓練任務,都基于一個統一的訓練平臺提交,由統一的訓練系統訓練。主要的區別只在于特征的定義、網絡結構的定義和訓練超參的定義。這樣的好處是讓知識的共享變得容易,比如,在抖音有效果的方法可以很容易地推到其他業務。不同工作的對比也很容易,因為在工程上是打平的,唯一的差異就來自算法層面。

此次,火山引擎正式發布機器學習與推薦平臺多云部署解決方案,也是秉承上述理念。火山引擎希望,向外部企業開放AI基建,可以讓企業解放勞動生產力,更加專注于業務創新。

關注開發者體驗,打造0碎片、高彈性的機器學習平臺

火山引擎機器學習平臺具備0碎片和高彈性的特點。作為資源調度平臺,機器學習長期以來最大的痛點就是碎片和彈性。火山引擎的0碎片能力很大程度上是基于字節跳動體系比較充分的內外復用。此外,火山引擎也在計算/通信/網絡上對平臺進行了優化:在計算上,提供手工優化算子和編譯能力;在通信上,開源了BytePS的分布式訓練庫和veGiantModel模型并行化的庫;在存儲方面,火山引擎提供TOS對象存儲和vePFS分布式文件系統。

同時,火山引擎機器學習平臺非常關注開發者體驗。傳統公司往往是給研發每人幾塊GPU卡,在開發者不工作時,這些卡處于閑置狀態,這也是企業GPU利用率低的一個重要原因。對此,火山引擎提供了開發機模塊。這一在線開發機模塊對齊了之前物理開發機的體驗。開、關機環境都能保留。同時很好地集成了容器,方便不同環境的開發切換;火山引擎機器學習平臺在監控、實驗tracking等方面也提供了不錯的工具,開發完成后,可以一鍵提交任務到集群進行job化訓練。

據英偉達中國區工程及解決方案總經理賴俊杰介紹,火山引擎和英偉達在過去幾年里已開展了深入合作,從NVIDIA A100 到 H100,火山引擎一直保持第一時間迭代更新實例產品,使彈性計算實例與機器學習平臺一直保持著最具競爭力的算力與性能。

雙方此前與輕舟智航合作推出自動駕駛工具鏈輕舟矩陣,以仿真為核心,可打通從研發到測試運營的全流程,實現自動駕駛技術研發的高效迭代。依托火山引擎AI開發平臺,輕舟矩陣上的自動駕駛模型訓練GPU利用率可提升30%。

“隨著AI模型規模不斷增大,對于算力的需求也以指數級別快速提升。” 賴俊杰說,“火山引擎基于H100的全新一代彈性計算HPC實例和機器學習平臺,將為企業客戶提供更好的AI算力性能。”

深度開放的推薦平臺,支持企業沉淀推薦能力

在智能推薦平臺方面,火山引擎可以實現:只需一個平臺,就能幫助企業實現從數據接入到推薦結果輸出,這一完整的端到端推薦服務的搭建;在特征工程/模型開發模塊,火山引擎既能通過簡單的配置提供入門級的功能,同時也提供了低代碼的開發能力,讓工程師可以結合自己的經驗深度參與到效果的優化中;與此同時,模型支持實時訓練,用戶的行為和偏好能很快體現在推薦結果中。此外,火山引擎智能推薦平臺還支持深度的行業定制。目前,火山引擎已在電商、內容、視頻等多個領域服務了很多客戶,并將積累的行業經驗,沉淀成行業模板,可以為不同領域的企業提供更專業的推薦服務;對企業而言,更為重要的一點是,火山引擎智能推薦平臺支持靈活的黑白盒功能,可以讓企業沉淀自身的推薦能力。

行業內對推薦系統的普遍認知是非常復雜,涉及的功能模塊非常多:首先要對數據進行處理,以保證數據質量;處理后的數據進入到特征工程環節,對特征進行抽取——特征和樣本會應用到模型的訓練中;在線服務會對召回/排序/規則進行編排,還需要做大量的AB實驗來驗證推薦的效果,最后才能驗證推薦是否有效。

在火山引擎推薦系統上,企業不需要跨多個系統,可以直接在成熟的推薦平臺上完成一整套推薦系統的搭建。

當前,很多企業都想要沉淀研發能力,希望系統不要太黑盒。火山引擎特征工程模塊兼具黑白盒功能:黑盒是讓平臺直接管理中間的過程,企業可以直接使用;白盒的功能可以滿足工程師做深度開發的需求。與火山引擎機器學習平臺一樣,火山引擎推薦平臺也提供很多數據抽取和特征處理的算子,實現高效靈活的特征自定義。

在模型開發方面,平臺也兼具黑白盒功能預置模型,提供10 種模型結構,企業只需要設定好優化目標,就可以訓練使用。自定義模型則是通過低代碼的方式實現模型的開發,平臺內置多種代碼示例,提供了代碼對比、效果對比、訓練日志等多種工具,方便工程師更快上手。

無論是預置模型還是自定義模型,底層都是基于一套字節跳動自研的training和serving的方案-monolith,可實現萬億級參數的模型訓練,以全方位的容錯機制保證穩定性,支持流式訓練和實時模型調參等特點,保證模型訓練的性能和效果。

項亮指出,不同行業具有不同的業務特點,關注的業務目標也不同,比如電商更關注商品的點擊率、轉化率和成交金額;新聞資訊行業則對實時性要求比較高,希望提升內容點擊率和用戶的停留時長;廣告更關注每千次點擊轉化率。不同行業還會有新用戶、新內容的冷啟動這類的問題,火山引擎推薦平臺結合行業特點,沉淀成行業模版,可以讓不同行業的企業快速地接入使用。

OPPO數智工程系統總裁劉海鋒介紹,火山引擎助力OPPO構建了全球領先的推薦系統混合云,在保障用戶體驗的前提下,幫助OPPO在多個應用分發、信息流、聯盟等服務場景中提升商業化價值。據了解,OPPO數智技術框架包括計算、網絡、中間件和數據庫的混合云基礎設施層;面向海量跨系統數據進行存儲與處理的云原生數據湖層;包括端側推理、模型壓縮、大規模訓練、AutoML的端云一體機器學習系統;包括語音、NLP、知識圖譜、CV、推薦搜索等基礎能力的AI能力層;跨終端、多場景落地的業務應用層;以及為企業提供安全可信的AI安全能力層。

火山引擎也通過對OPPO的推薦算法進行專屬云底座升級,重點提升了模型的響應速度和離線推薦工作能力為OPPO提供了更加彈性的敏捷資源、更加穩定的工程質量、更加高效的運維服務,為商業化業務價值提升創造了更加堅實的基礎。

最后,項亮表示,因為數據隱私等原因,很多客戶希望平臺能支持多種部署方案。此次,火山引擎發布的機器學習與推薦平臺多云部署解決方案,能夠支持公有云部署,私有云部署,VPC部署和專屬AZ部署。

字節跳動副總裁楊震原認為,技術和業務是一個互構的關系,技術和業務互相塑造、共同成長。他表示:“火山引擎沉淀了字節內部業務的技術實踐,希望也能夠幫助外部客戶提升業務價值”。

— 完 —

量子位 QbitAI

關注我們,第一時間獲知前沿科技動態

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,多謝。

CopyRight ? 外貿領航 2023 All Rights Reserved.