曼孚科技完成數千萬(wàn)元B輪融資,以數據構建面向未來(lái)的AI基礎設施
2023-10-09 11:13:19    看點(diǎn)時(shí)報

近日,AI基礎架構與數據智能平臺服務(wù)商曼孚科技宣布,已于2023年9月完成數千萬(wàn)元B輪融資,本輪投資方為安樸資本。所融資金將主要用于A(yíng)I基礎設施搭建、大模型標注平臺閉環(huán)更迭以及數據標注市場(chǎng)拓展等。

曼孚科技商業(yè)化始于2019年,是一家數據驅動(dòng)的AI基礎設施平臺企業(yè),致力于從數據中獲取洞見(jiàn)與價(jià)值,并以更精簡(jiǎn)方式構建人工智能應用,實(shí)現AI的輕量化與普惠化。

旗下主要產(chǎn)品服務(wù)包括:面向數據生命周期管理的數據智能平臺、AI數據中臺、AutoLabeling平臺、AutoML平臺以及基礎數據服務(wù)(數據標注、數據采集、數據清洗)等。

憑借從戰略到技術(shù)落地的一站式數據解決方案,目前已與數百家企業(yè)達成深度合作,業(yè)務(wù)場(chǎng)景涵蓋自動(dòng)駕駛數據標注、AI數據生命周期管理等。用戶(hù)包括主機廠(chǎng)、造車(chē)新勢力、一線(xiàn)科技公司、主流算法公司以及世界頂級Tier1廠(chǎng)商等,2023年營(yíng)收額預估將實(shí)現3倍以上持續性增長(cháng)。

數據定義模型

AI產(chǎn)業(yè)歷經(jīng)多年發(fā)展,已逐漸步入技術(shù)與商業(yè)的交叉點(diǎn)。

算法模型從關(guān)注增量的建模改進(jìn),轉變?yōu)閺娬{性能的迭代與優(yōu)化,以契合商業(yè)應用場(chǎng)景對模型質(zhì)量更為苛刻的要求。

結構化數據已成為AI算法模型開(kāi)發(fā)與迭代的基礎。AI強大“理解力”的造就,離不開(kāi)結構化數據源源不斷的輸入,和對數據更為精細化的運用。

AI行業(yè)正圍繞以數據為中心進(jìn)行整合,誰(shuí)擁有數據,誰(shuí)就擁有模型的定義權。

在細分場(chǎng)景,自動(dòng)駕駛城市NOA熱潮興起。技術(shù)范式全面革新下,自動(dòng)駕駛感知算法向BEV+Transformer架構升級,端到端算法解決方案成為主流,推動(dòng)自動(dòng)駕駛感知算法從輕量的CNN二維感知,到基于Transformer四維感知的升維,也催生了數據需求的指數型增加。

自動(dòng)駕駛在A(yíng)I大模型的助力下迎來(lái)臨界點(diǎn)。但量變到質(zhì)變的前置條件是大規模數據的支持——Transformer大模型質(zhì)變需要數億公里標注數據的投喂,并覆蓋不斷出現的Corner Case,這對數據量產(chǎn)規模以及自動(dòng)化水平提出了更高的要求。

自動(dòng)駕駛的終極目標是完成對駕駛員的取代,但在此之前,數據標注員需要率先被神經(jīng)網(wǎng)絡(luò )所取代。

AI驅動(dòng)的數據智能平臺

隨著(zhù)BEV+Transformer技術(shù)路線(xiàn)成為新一代自動(dòng)駕駛感知能力的核心架構,數據閉環(huán)能力取代算法范式,成為決定商業(yè)量產(chǎn)從1到N的勝負關(guān)鍵。

而數據閉環(huán)的每一步推進(jìn)都是成本與效率的博弈,低成本AI數據量產(chǎn)能力又成為助推數據飛輪的關(guān)鍵。

作為行業(yè)領(lǐng)先的AI基礎架構與數據智能平臺服務(wù)商,曼孚科技以產(chǎn)品技術(shù)為核心驅動(dòng)力,通過(guò)構建AI+RPA驅動(dòng)的數據平臺沉淀數據Know-How能力,在業(yè)內率先實(shí)現AI數據低成本、無(wú)上限、規?;慨a(chǎn)。

曼孚科技數據平臺核心產(chǎn)品體系由MindFlow SEED數據服務(wù)平臺與MindFlow AutoLabeling自動(dòng)標注平臺構成,歷經(jīng)多代版本更迭,現已在3D、4D點(diǎn)云數據處理領(lǐng)域,建立起6-12個(gè)月的技術(shù)壁壘。

具體應用場(chǎng)景上,平臺支持自動(dòng)駕駛等場(chǎng)景下2D、3D、4D全類(lèi)別標注,如2/3D融合、點(diǎn)云分割、點(diǎn)云時(shí)序疊幀、BEV標注等。

針對4D點(diǎn)云標注場(chǎng)景下大規模點(diǎn)云適配渲染問(wèn)題,曼孚科技自研地圖分片與LOD大規模點(diǎn)云渲染技術(shù),4D點(diǎn)云車(chē)道線(xiàn)與4D點(diǎn)云分割場(chǎng)景均可實(shí)現低配置單幀數億級點(diǎn)云平穩運行。

4D點(diǎn)云分割標注場(chǎng)景

作為自動(dòng)化AI數據平臺,RPA與AI能力的建設是曼孚科技構建技術(shù)壁壘的核心。

RPA能力主要體現在流程自動(dòng)化以及調度分發(fā)自動(dòng)化等多個(gè)方面。而AI能力則已深入數據流轉各環(huán)節,具體體現在:

1)覆蓋數據預處理、算法推斷至結果精修完整算法鏈路,已商用靜態(tài)道路自適應分割、動(dòng)態(tài)障礙物AI預處理、AI交互式標注等數十種AI算法標注模型;

2)采用Backbone+多Head算法架構,快速適配不同場(chǎng)景,大幅降低多任務(wù)模型研發(fā)成本;

3)基于A(yíng)utoML以及自有數據集構建AI標注模型,自我驅動(dòng)完成算法迭代;

4)運用遷移學(xué)習、知識蒸餾等方式,基于小批量數據+底層通用大模型快速產(chǎn)出算法模型。

RPA與AI能力的強耦合,賦予曼孚科技以更低人力支出與邊際成本,提供更具標準化數據解決方案的能力。綜合人效平均提升80%,數據生產(chǎn)成本平均降低50%,并實(shí)現AI數據低成本、無(wú)上限、規?;慨a(chǎn)。

基于大模型的AI自動(dòng)標注體系

作為引領(lǐng)人工智能新一輪躍遷式發(fā)展的全新底座,大模型正走深向實(shí),賦能千行百業(yè)。

海量參數帶來(lái)的容量?jì)?yōu)勢,賦予大模型更強的性能與泛化能力,為數據預處理、數據標注等傳統依賴(lài)人力的環(huán)節,提供了全新的技術(shù)解決范式。

目前,曼孚科技已完成自動(dòng)駕駛數據標注視覺(jué)大模型研發(fā)。通過(guò)引入駕駛數據建立RLHF,并基于深度學(xué)習與計算機視覺(jué)構建大模型,可實(shí)現復雜駕駛場(chǎng)景下,數據的高效處理與全自動(dòng)化標注。

曼孚科技數據標注大模型的主要技術(shù)特點(diǎn)如下:

1)基于弱監督與半監督學(xué)習,通過(guò)少量人工標注數據與大量無(wú)標注數據,實(shí)現對場(chǎng)景物體的高效檢測、分割與識別;

2)基于BEV多視角融合與三維重建,借助多攝像頭、激光雷達等來(lái)源數據,自動(dòng)生成場(chǎng)景物體三維信息;

3)運用遷移學(xué)習方式,對不同場(chǎng)景與不同模態(tài)下的數據,進(jìn)行統一表示與學(xué)習,提升模型泛化能力與適應性;

4)運用主動(dòng)學(xué)習與交互式學(xué)習方式,通過(guò)與人工標注過(guò)程進(jìn)行反饋,不斷優(yōu)化迭代模型性能。

上述大模型技術(shù)加持下,典型自動(dòng)駕駛數據標注場(chǎng)景平均效率可提升4-5倍以上,引領(lǐng)曼孚科技率先步入自動(dòng)化數據標注時(shí)代。

數據驅動(dòng)的AI基礎設施

算法更新迭代的全生命周期內,從設計、訓練、評測到仿真等環(huán)節均需要海量數據不斷輸入作為支撐,其中數據標簽是整個(gè)流程的基礎與起點(diǎn)。

如果說(shuō)互聯(lián)網(wǎng)時(shí)代是對信息流量的搬運,那么人工智能尤其是大模型時(shí)代,則是對海量數據的搬運與精細化運用。

在信息流量的基礎上,誕生了諸多影響深遠的商業(yè)模式。AI時(shí)代,任何人也均可使用數據作為“鏟子”去探索商業(yè)“金礦”。是否擁有質(zhì)量更高、數量更多的“鏟子”,是決定“淘金人”能否真正掌握主動(dòng)權,淘到金子的關(guān)鍵。

AI大淘金時(shí)代,曼孚科技希望扮演起為“淘金人”服務(wù)的角色,以數據為驅動(dòng)力向AI上下游延伸,打造起通用AI基礎設施。用戶(hù)可以以更精簡(jiǎn)方式構建AI應用并管理全生命周期,同時(shí)也可以更加靈活調整模型構建流程中的每個(gè)組件,以得到更契合的需求與分析結果。

在上述愿景指引下,曼孚科技目前已在自動(dòng)駕駛場(chǎng)景構建起AI數據閉環(huán)平臺,涵蓋DaaS數據標注平臺、數據管理平臺、AutoLabeling平臺以及AutoML平臺等,提供從數據準備到模型應用的端到端解決方案,并延伸至其他AI應用場(chǎng)景。

其中,數據管理平臺集數據存儲、處理、導入導出于一體,通過(guò)SDK打通數據采集平臺、數據標注平臺、模型訓練平臺與生產(chǎn)運營(yíng)系統等外部平臺,借助AI與大數據技術(shù)加強智能標簽、分析報表、場(chǎng)景挖掘與自然語(yǔ)言搜索等功能體驗,提高數據使用與管理效率。

而AutoML平臺則是面向自動(dòng)駕駛等通用視覺(jué)場(chǎng)景的自動(dòng)訓練平臺,提供算法模型自動(dòng)訓練與快速迭代功能??勺詣?dòng)優(yōu)化模型結構、參數與超參數,提升性能與泛化能力,實(shí)現零代碼一鍵訓練,無(wú)人值守。

曼孚科技AI基礎設施架構

曼孚科技AI基礎設施解決方案全面覆蓋數據層至算法層,既可提供DaaS服務(wù),也可提供MaaS服務(wù)。無(wú)論用戶(hù)規模大小、是否具備AI研發(fā)能力,只要存在A(yíng)I需求,即可使用曼孚科技提供的基礎設施,輕松創(chuàng )建專(zhuān)屬AI產(chǎn)品,實(shí)現從數據到商業(yè)價(jià)值的轉變。

AI For Everyone

獨立自研的數據閉環(huán)平臺、AI數據量產(chǎn)能力以及對客戶(hù)業(yè)務(wù)需求的敏銳洞察,讓曼孚科技在不斷變化的市場(chǎng)中實(shí)現業(yè)務(wù)超預期增長(cháng),數據驅動(dòng)的AI基礎設施在自動(dòng)駕駛等行業(yè)驗證了應用價(jià)值與商業(yè)潛力。

下階段,曼孚科技將繼續深耕數據行業(yè),不斷完善AI基礎設施建設。正如AWS之于云計算,Snowflake之于數據分析一樣,曼孚科技希望在A(yíng)I行業(yè)能以數據構建起通用基礎設施,幫助用戶(hù)以更精簡(jiǎn)方式訓練與部署人工智能應用。無(wú)論是初創(chuàng )企業(yè)、成熟公司亦或是個(gè)人,均可通過(guò)簡(jiǎn)單點(diǎn)擊或幾行代碼享受AI帶來(lái)的便利,實(shí)現真正的AI民主化與普惠化。

互聯(lián)網(wǎng)時(shí)代,谷歌憑借搜索引擎掌控了互聯(lián)網(wǎng)流量入口,微軟憑借操作系統掌控了PC生態(tài)鏈的上游,目前尚未出現挑戰谷歌、微軟等萬(wàn)億體量的科技新貴,但AI正讓一切變得可能。

關(guān)鍵詞: