提起賽博,通常會想到“賽博朋克”。
其實,賽博朋克(英文:Cyberpunk)是“賽博”與“朋克”的結(jié)合詞。在英語中,賽博這個詞脫胎于Cybernetics(中文:自動控制論),起源于希臘語 kubernetes,意思是導(dǎo)航員、駕駛員。
而在科幻小說的范疇中,“賽博”廣義上涵蓋了這些主題:機器人、自動化、計算機、智能等等。如果進一步縮窄“賽博”的范圍,我們可以發(fā)現(xiàn)這個詞最常用于指代“人工智能的創(chuàng)建”。
在現(xiàn)實生活中,AI的本質(zhì)就是生產(chǎn)力。而易道博識創(chuàng)立的初心,就是借助人工智能,來簡化復(fù)雜枯燥的工作。
我們在“賽博”這個詞上,傾注了許多我們美好的期許:我們希望并且相信,科技充當?shù)慕巧粌H是一個簡單的技術(shù)提供者,我們希望不僅能授人以魚,還能授人以漁,我們希望能讓用戶擁有一個可以自主可控、成本可控的、可現(xiàn)場應(yīng)用的平臺產(chǎn)品。
我們知道,開發(fā)一項人工智能模型并上線應(yīng)用大致需經(jīng)歷從業(yè)務(wù)理解、數(shù)據(jù)采標及處理、模型訓(xùn)練與測試到運維監(jiān)控等一系列流程。?
過程中,不僅需要大量的AI算力、高質(zhì)量數(shù)據(jù)源,還需要AI應(yīng)用算法研發(fā)及AI技術(shù)人員的支持,但大部分中小企業(yè)用戶并不具備在“算力、數(shù)據(jù)、算法”三維度從0到1部署的能力,而財力雄厚的大型企業(yè)亦需高性價比的AI開發(fā)部署方案。
智能化轉(zhuǎn)型趨勢下,企業(yè)部署AI項目的需求正經(jīng)歷著變化,對數(shù)據(jù)質(zhì)量、模型生產(chǎn)周期、模型自學(xué)習(xí)水平、模型部署方式、人力成本及資金投入、投資回報率等的要求都逐步走高。
假如,每次開發(fā)模型都需要算法工程師單獨完成從生產(chǎn)到上線的全流程招建,就會導(dǎo)取很多時間的耗損與AI模型開發(fā)成本的浪費。所以集標注、訓(xùn)練、推理于一體的賽博(CyberBot)深度學(xué)習(xí)平臺應(yīng)運而生。
數(shù)據(jù)閉環(huán),自成有機整體
賽博學(xué)習(xí)平臺是易道博識基于深度學(xué)習(xí)自主研發(fā)的一站式機器學(xué)習(xí)訓(xùn)練平臺。賽博平臺集數(shù)據(jù)管理、數(shù)據(jù)標注、模型訓(xùn)練和模型應(yīng)用于一身,提供及時、現(xiàn)場化的數(shù)據(jù)驅(qū)動模型應(yīng)用解決方案。
賽博平臺充分利用現(xiàn)有的經(jīng)過長期迭代的基礎(chǔ)模型能力,包括圖像、OCR和NLP等,在少量樣本的驅(qū)動下,利用遷移學(xué)習(xí)和小樣本學(xué)習(xí)等技術(shù),高效完成增量模型的訓(xùn)練,生成最優(yōu)的模型文件,并通過推理平臺實現(xiàn)模型的快速部署與生產(chǎn)應(yīng)用。
產(chǎn)品組成上,賽博平臺由管理中心CyberCenter、數(shù)據(jù)標注平臺 CyberData、深度學(xué)習(xí)訓(xùn)練平臺 CyberLearning和深度學(xué)習(xí)推理平臺 CyberServing幾個子平臺組成,各子平臺依次承擔(dān)平臺管理、數(shù)據(jù)管理與標注、模型訓(xùn)練和模型服務(wù)的功能,各個子平臺之間相互獨立又有效配合,形成一個有機整體,從而有效支撐數(shù)據(jù)驅(qū)動模型應(yīng)用的整體功能。
賽博平臺設(shè)計中充分考慮并兼顧了企業(yè)應(yīng)用的綜合性復(fù)雜場景以及C端客戶相對單一的場景。通過對各種應(yīng)用場景的深入研究與有效融合,以及先進的架構(gòu)設(shè)計和技術(shù)選型,平臺最大化兼顧了專業(yè)性與易用性,從而在滿足各種應(yīng)用場景需求的前提下,提供最佳的用戶操作體驗。
值得一提的是,賽博平臺打造了數(shù)據(jù)驅(qū)動模型應(yīng)用的閉環(huán)。推理平臺支持對于自身所產(chǎn)生的生產(chǎn)數(shù)據(jù)根據(jù)不同的條件進行自動采集的功能,采集后的數(shù)據(jù)可以方便地導(dǎo)入標注平臺,形成數(shù)據(jù)集,并支持進一步的數(shù)據(jù)處理與標注。標注完成的數(shù)據(jù)集可以用于模型的訓(xùn)練調(diào)優(yōu),從而得到性能更佳的模型,用于更新推理平臺生產(chǎn)模型,從而形成一個完整的數(shù)據(jù)閉環(huán)。
數(shù)據(jù)標注平臺 CyberData
數(shù)據(jù)平臺主要功能包括數(shù)據(jù)管理、數(shù)據(jù)處理、樣本擴充、數(shù)據(jù)標注與采集。數(shù)據(jù)平臺內(nèi)置exLabeler標注客戶端,提供強大專業(yè)的CV、OCR、結(jié)構(gòu)化和NLP任務(wù)標注功能。同時,數(shù)據(jù)平臺還支持單人和團隊標注模式。
用戶可以通過exLabeler客戶端完成樣本的標注。exLabeler支持CV、OCR、結(jié)構(gòu)化和NLP等領(lǐng)域算法的標注。標注完成的數(shù)據(jù)集可以直接用于模型訓(xùn)練,或進一步做后處理(如圖像處理、樣本擴充等),然后再用于模型訓(xùn)練。
深度學(xué)習(xí)訓(xùn)練平臺 CyberLearning
訓(xùn)練平臺通過自身對于訓(xùn)練資源池的集中管理與分配,以及與管理平臺的無縫對接,可以方便地實現(xiàn)訓(xùn)練基礎(chǔ)設(shè)施的管理,從而減輕用戶的管理維護工作。同時,利用自動超參搜索等技術(shù),訓(xùn)練平臺可以自動搜索到最佳性能的模型。
通過分布式訓(xùn)練與多框架支持,訓(xùn)練平臺可以最大化利用計算資源,加速模型訓(xùn)練。同時,利用自動超參搜索等技術(shù),訓(xùn)練平臺可以自動搜索到最佳性能的模型。最后,對于訓(xùn)練所得的最優(yōu)模型,訓(xùn)練平臺支持一鍵部署到推理平臺,實現(xiàn)模型的快速應(yīng)用。
深度學(xué)習(xí)推理平臺 CyberServing
推理平臺主要完成各種識別功能的部署。業(yè)務(wù)系統(tǒng)通過調(diào)用推理平臺提供的RESTful API提交圖像并獲得識別結(jié)果。整體上講,推理平臺產(chǎn)品需求可分解為模型管理、API過程定義、識別數(shù)據(jù)查看,接口統(tǒng)計和其它非功能項等部分。其中模型管理和API管理模塊屬于基礎(chǔ)核心模塊。
推理平臺對同一模型不同版本的管理,并支持在模型服務(wù)中同時加載和運行多個版本的模型。推理平臺還支持一個API綁定多個模型服務(wù)。模型升級時,用戶可以選擇先在部分服務(wù)中激活新版本的模型,完成測試驗證后再升級其他服務(wù)。