智能讀寫(xiě)機(jī)器人供應(yīng)商「世通亨奇」已于2018年完成500萬(wàn)元人民幣天使輪融資,投資方為中科院創(chuàng)投。本輪融資主要用于產(chǎn)品研發(fā)和市場(chǎng)拓展。
「世通亨奇」由中科院空天信息研究院孵化,核心技術(shù)包括函數(shù)計(jì)算、知識(shí)圖譜、本體推理、多文檔摘要等,目標(biāo)是對(duì)互聯(lián)網(wǎng)公開(kāi)信息進(jìn)行智能重構(gòu),對(duì)海量、雜亂無(wú)章的數(shù)據(jù)進(jìn)行有序組織和提純。
該公司創(chuàng)始人兼CEO黃宇告訴36氪,目前很多大數(shù)據(jù)公司都只是對(duì)特定機(jī)構(gòu)的內(nèi)部數(shù)據(jù)進(jìn)行挖掘和應(yīng)用,而對(duì)互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)涉獵較少。而互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)往往呈現(xiàn)出海量化、碎片化、無(wú)規(guī)則、不同層次分布、數(shù)據(jù)源不確定的特點(diǎn),導(dǎo)致大家在搜索引擎和信息推送軟件的幫助下,也仍然不能找到自己想要的信息。
針對(duì)這個(gè)痛點(diǎn),世通亨奇研發(fā)了智能讀寫(xiě)機(jī)器人,從全球新聞媒體、社交網(wǎng)站、政府網(wǎng)站和各類(lèi)專(zhuān)業(yè)數(shù)據(jù)庫(kù)采集信息,利用深度學(xué)習(xí)和自然語(yǔ)言理解來(lái)自動(dòng)分析大型數(shù)據(jù)集,并自動(dòng)生成與人類(lèi)分析師相當(dāng)?shù)膱?bào)告,幫助信息從業(yè)者解決“閱讀”和“寫(xiě)作”這兩個(gè)最耗時(shí)耗力的環(huán)節(jié)。
圍繞這個(gè)思路,該公司研發(fā)了Plat-X產(chǎn)品體系,囊括了四個(gè)產(chǎn)品:黑曜、堇青、琥珀和機(jī)器人工廠。
Plat-X黑曜是該公司所有產(chǎn)品的基礎(chǔ)架構(gòu),也可作為獨(dú)立產(chǎn)品出售。該產(chǎn)品是向開(kāi)發(fā)者和企業(yè)提供全托管、無(wú)服務(wù)器的函數(shù)計(jì)算架構(gòu),具有AI云服務(wù)市場(chǎng)、資源彈性伸縮、開(kāi)箱即用、多語(yǔ)言支撐等能力,可以節(jié)省大量人力資源,因?yàn)殚_(kāi)發(fā)者只需要關(guān)注自己的業(yè)務(wù)邏輯代碼,不需要關(guān)注服務(wù)器配置、系統(tǒng)部署和分布式改造,即可實(shí)現(xiàn)一鍵部署、多云混合部署和私有裸金屬部署等能力。
Plat-X堇青是數(shù)據(jù)采集產(chǎn)品,可按照用戶(hù)的語(yǔ)義需求、自動(dòng)感知數(shù)據(jù)源,并對(duì)不同類(lèi)型和格式的數(shù)據(jù)進(jìn)行智能統(tǒng)一結(jié)構(gòu)化提取、語(yǔ)義相似度分析和主題聚合。同時(shí),該產(chǎn)品可以提供面向全球分布的安全采集網(wǎng)絡(luò)。
PlatX琥珀是基于動(dòng)態(tài)本體技術(shù),提供全平臺(tái)的數(shù)據(jù)抽象建模能力。黃宇表示,動(dòng)態(tài)本體是知識(shí)圖譜的升級(jí),在建立數(shù)據(jù)之間聯(lián)系的同時(shí)增加二階邏輯表達(dá),從而實(shí)現(xiàn)圖譜的動(dòng)態(tài)更新與推理能力。動(dòng)態(tài)本體是以“4W+E”為核心建立世間萬(wàn)物的聯(lián)系,進(jìn)行多源數(shù)據(jù)的融合、推理和驗(yàn)真。這里的“4W+E”指的是“when”、“where”、“who”、“what”和“event”。
Plat-X機(jī)器人工廠產(chǎn)品主要是通過(guò)組裝前三款產(chǎn)品的功能部件、搭建信息生產(chǎn)線(xiàn)。該生產(chǎn)線(xiàn)的流程是:數(shù)據(jù)采集和聚合->關(guān)鍵要素提取->動(dòng)態(tài)本體鏈接->關(guān)系構(gòu)建與推理->要點(diǎn)提煉->報(bào)告生成。
黃宇表示,Plat-X產(chǎn)品體系現(xiàn)階段以非結(jié)構(gòu)化文本為處理主體,下階段會(huì)進(jìn)行多語(yǔ)種提煉和報(bào)告生成,未來(lái)會(huì)延伸至處理圖像和視頻信息等多媒體信息。
目前,世通亨奇的讀寫(xiě)機(jī)器人主要用于軍工領(lǐng)域。黃宇稱(chēng),目前軍工方向的市場(chǎng)規(guī)模已達(dá)千億元人民幣,年復(fù)合增長(zhǎng)率會(huì)超過(guò)15%。此外,他們也正在把智能讀寫(xiě)機(jī)器人應(yīng)用于金融二級(jí)市場(chǎng)、企業(yè)營(yíng)銷(xiāo)、新聞自媒體等領(lǐng)域。
黃宇表示,他們的情報(bào)讀寫(xiě)機(jī)器人今年預(yù)計(jì)收入3000萬(wàn),并將取得多項(xiàng)國(guó)家重要資質(zhì)。此外,他們正在與中科院相關(guān)單位合作成立聯(lián)合實(shí)驗(yàn)室,建立常態(tài)化人才培養(yǎng)機(jī)制。
該公司目前正在尋求Pre-A輪融資。
世通亨奇團(tuán)隊(duì)有30人,總部在北京。黃宇是中科院電子所博士、碩士生導(dǎo)師、國(guó)家科技進(jìn)步一等獎(jiǎng)獲得者,師從國(guó)內(nèi)信息領(lǐng)域院士,在NLP、圖像理解和人工智能產(chǎn)品系統(tǒng)架構(gòu)設(shè)計(jì)方面有11年研究經(jīng)驗(yàn)。團(tuán)隊(duì)核心成員來(lái)自IBM、微軟、騰訊研究院、帝國(guó)理工、北大等,具有多年技術(shù)研發(fā)和企業(yè)服務(wù)經(jīng)驗(yàn)。