近年來,人工智能成為全球數(shù)字技術(shù)創(chuàng)新最活躍的前沿領(lǐng)域之一,是數(shù)字經(jīng)濟(jì)的新賽道和國際競爭的新熱點(diǎn)。同時(shí),社會公眾對于人工智能疑慮未消,在踩下油門的同時(shí)如何控制好速度與方向,從而構(gòu)建安全、可信的人工智能產(chǎn)業(yè)生態(tài),探索基于可信數(shù)據(jù)的AIGC(生成式人工智能),成為人工智能未來突破的一個(gè)重要方向。
今年5月20日,江蘇發(fā)展大會期間,企查查現(xiàn)場路演發(fā)布的全球首款商查大模型“知彼阿爾法”則是對可信數(shù)據(jù)人工智能的一次有益探索。據(jù)介紹,這款大模型是基于企查查在商業(yè)查詢領(lǐng)域近十年可信數(shù)據(jù)積累后進(jìn)行大規(guī)模預(yù)訓(xùn)練的成果,后續(xù)將上線的創(chuàng)新產(chǎn)品通過大模型+企業(yè)信用數(shù)據(jù)庫共同構(gòu)建,用AI技術(shù)賦能企信大數(shù)據(jù)創(chuàng)新,打造安全、可信的人工智能產(chǎn)品,為用戶提供更加便捷、精準(zhǔn)的商業(yè)信息查詢服務(wù)。
(圖:企查查商查大模型“知彼阿爾法”)
業(yè)內(nèi)首款商查大模型為何會是企查查?
企查查創(chuàng)始人陳德強(qiáng)表示,企查查擁有覆蓋全球近5億家企業(yè)的企信數(shù)據(jù)庫。商業(yè)信息查詢服務(wù)最核心的資源就是相關(guān)的數(shù)據(jù)資源,比如工商信息、訴訟信息等。并且,數(shù)據(jù)覆蓋面要足夠廣泛,不僅要有中國的全量數(shù)據(jù),還要有全球其他國家的數(shù)據(jù)。此外,在企業(yè)標(biāo)訊、企業(yè)盡調(diào)等專業(yè)性很強(qiáng)的領(lǐng)域,還需要建立專門的數(shù)據(jù)庫。要將AIGC技術(shù)引入商業(yè)信息查詢服務(wù)領(lǐng)域,最關(guān)鍵的動作就是用企信數(shù)據(jù)集來訓(xùn)練相關(guān)模型。數(shù)據(jù)量越大、數(shù)據(jù)質(zhì)量越高,最終訓(xùn)練出來的模型才越精準(zhǔn)。相對于當(dāng)前其他大語言模型主要用公開的互聯(lián)網(wǎng)數(shù)據(jù)集,工商、司法等專業(yè)數(shù)據(jù)的獲取難度更大。可以說,企查查所覆蓋的5億家企業(yè)征信數(shù)據(jù)資源是企查查商查服務(wù)最核心壁壘,匯集了目前國內(nèi)市場中的80個(gè)產(chǎn)業(yè)鏈,8000個(gè)行業(yè),及海量的市場實(shí)時(shí)工商信息、風(fēng)險(xiǎn)公示、知識產(chǎn)權(quán)、征信報(bào)告、股權(quán)關(guān)系等300+維度的企信數(shù)據(jù)。這些數(shù)據(jù),不僅為企查查構(gòu)建了較高的競爭壁壘,也為其訓(xùn)練知彼阿爾法商查大模型,奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
據(jù)了解,企查查的AI算法模型國內(nèi)領(lǐng)先,在今年5月獲得”中國智能科學(xué)技術(shù)最高獎(jiǎng)”吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)。在算法層面,企查查有著深厚的AI技術(shù)積累,多年來,企查查通過運(yùn)用深度學(xué)習(xí)、自然語言處理(NLP)等AI技術(shù),現(xiàn)已實(shí)現(xiàn)在海量全球多語言文本中進(jìn)行自動化、智能化的數(shù)據(jù)分析與文本挖掘,并能進(jìn)一步實(shí)現(xiàn)深層次語義分析,為用戶提供更精準(zhǔn)的語義檢索服務(wù)。在預(yù)訓(xùn)練模型領(lǐng)域籍由豐富的數(shù)據(jù)資源,企查查已經(jīng)有較強(qiáng)的技術(shù)積累,本次企查查發(fā)布的知彼阿爾法商查大模型實(shí)現(xiàn)了完全自主知識產(chǎn)權(quán)。
豐富多樣的產(chǎn)品服務(wù)與應(yīng)用場景。用戶直接面對的是產(chǎn)品,而不是技術(shù)。因此,要想將AIGC底層的大模型技術(shù)應(yīng)用于商查服務(wù),就必須要將技術(shù)封裝成便于用戶使用的產(chǎn)品。而且,針對不同的用戶需求,要構(gòu)建針對性的產(chǎn)品,進(jìn)而形成相對完備的產(chǎn)品矩陣。以產(chǎn)品矩陣的方式,來為商查用戶提供一站式服務(wù)。在產(chǎn)品層面,企查查針對不同用戶群體,構(gòu)建了完善的產(chǎn)品矩陣,具體來看:對于企業(yè)用戶而言,企查查通過定制化服務(wù)提供精準(zhǔn)拓客、企業(yè)評級、盡職調(diào)查、風(fēng)險(xiǎn)控制、司法調(diào)查、輿情監(jiān)控、供應(yīng)鏈管理等場景的解決方案,輔助企業(yè)用戶完善企業(yè)畫像、信息交叉核驗(yàn)、尋找合作伙伴;對于個(gè)人用戶而言,企查查通過云平臺綜合多維度數(shù)據(jù)提供投融資、求職招聘、風(fēng)險(xiǎn)判定等場景的解決方案,為個(gè)人用戶透視企業(yè)股權(quán)架構(gòu),規(guī)避企業(yè)識別過程中的信用風(fēng)險(xiǎn);對于公共部門用戶而言,企查查數(shù)據(jù)既是央行官方征信渠道的重要補(bǔ)充,也是地方政府政策制定、社會信用體系建設(shè)、招商引資、篩選政策扶持對象、進(jìn)行企業(yè)信用監(jiān)管重要參考。
為什么要打造商查版ChatGPT?
伴隨著數(shù)據(jù)量的積累以及產(chǎn)品功能的增加,商查領(lǐng)域出現(xiàn)諸多問題和需求痛點(diǎn),主要表現(xiàn)在兩個(gè)方面:
用戶還停留在關(guān)鍵詞搜索階段,平臺還不能很好理解用戶復(fù)雜的業(yè)務(wù)需求。目前大部分商查平臺本質(zhì)上就是企業(yè)信用信息領(lǐng)域的搜索引擎,用戶通過關(guān)鍵詞,在企信數(shù)據(jù)庫里搜索對應(yīng)的企業(yè)或者風(fēng)險(xiǎn)信息,很難表述出用戶復(fù)雜、結(jié)構(gòu)化的需求。比如:某學(xué)校食堂招標(biāo)過程中希望了解供應(yīng)商的食品安全風(fēng)險(xiǎn),用此前的商查產(chǎn)品一般是先輸入?yún)⑴c投標(biāo)的公司名稱,然后跳轉(zhuǎn)到到對應(yīng)公司的主頁面,再通過查找該公司“經(jīng)營風(fēng)險(xiǎn)”中行政處罰或“經(jīng)營信息”中的“食品安全”內(nèi)容,才能確定該公司是否存在食品安全風(fēng)險(xiǎn),步驟繁多,且對新用戶并不友好。如果用戶還想知道該企業(yè)法人經(jīng)營的其他餐飲公司是否有過重大安全事件?本次投標(biāo)是否有關(guān)聯(lián)企業(yè)陪標(biāo)?類似這些更深入的需求,簡單的檢索信息就很難快速滿足用戶。即使能實(shí)現(xiàn)需求,也需要用戶本身具備相關(guān)的專業(yè)知識,并能熟練掌握商查平臺各項(xiàng)搜索功能,經(jīng)過多步相對繁瑣的操作,最終才能得到關(guān)于該企業(yè)更深入、完善的信息。但這對于絕大多數(shù)新用戶而言,使用門檻過高,不利于在更廣泛的范圍內(nèi)打通信息通路。
此外,搜索引擎模式,商查平臺反饋給用戶的是大量基礎(chǔ)數(shù)據(jù),而不是直接的答案。如果是大型集團(tuán)公司,則可能有成千上萬的基礎(chǔ)企信數(shù)據(jù),如此巨大的瀏覽量對于用戶而言是一個(gè)不小的負(fù)擔(dān)。這樣的商業(yè)信息查詢服務(wù),還停留在工具階段,不能稱之為強(qiáng)大的商業(yè)助手。同時(shí),企查查擁有查企業(yè)、查老板、查風(fēng)險(xiǎn)、查招標(biāo)、信用大數(shù)據(jù)、風(fēng)險(xiǎn)大數(shù)據(jù)等數(shù)百類產(chǎn)品服務(wù),用戶很難系統(tǒng)學(xué)習(xí)掌握,基于知彼阿爾法大模型,企查查后續(xù)將上線的對話產(chǎn)品,則可以跳過繁瑣的檢索步驟,用對話的方式充分釋放企查查各項(xiàng)產(chǎn)品能力,為用戶提供「有整體性的、易于理解的、具備高價(jià)值的」商業(yè)信息服務(wù)。
而用戶如果使用ChatGPT等大語言模型搜索高價(jià)值的企信數(shù)據(jù)時(shí),會發(fā)現(xiàn)明顯的問題:由于缺乏專業(yè)的數(shù)據(jù)庫支持,通過ChatGPT搜索的企業(yè)工商、信用數(shù)據(jù)皆來源于公開的互聯(lián)網(wǎng)數(shù)據(jù),無法保證數(shù)據(jù)的準(zhǔn)確性,與此同時(shí),一些高質(zhì)量、商業(yè)化的企信數(shù)據(jù)庫并不對其開放。缺乏專業(yè)數(shù)據(jù)庫的支持,ChatGPT等大語言模型在商查領(lǐng)域的分析都是“無米之炊”,甚至出現(xiàn)“無中生有”的狀況。而知彼阿爾法商查大模型則是基于企查查全量可信數(shù)據(jù)進(jìn)行的深度訓(xùn)練,可為用戶提供專業(yè)的企信數(shù)據(jù),及多樣化的分析結(jié)果。
AIGC+企業(yè)信用數(shù)據(jù)庫,商查服務(wù)方式再進(jìn)化
隨著人工智能步入“AIGC時(shí)代”,陳德強(qiáng)認(rèn)為,這將徹底改變數(shù)據(jù)的查詢和使用模式。“行業(yè)數(shù)據(jù)規(guī)模達(dá)到了一定量級后,數(shù)據(jù)查詢方式發(fā)生了變化,AIGC+企業(yè)信用數(shù)據(jù)庫,可以把數(shù)據(jù)完全利用起來。”據(jù)介紹,企查查目前發(fā)布的知彼阿爾法商查大模型是全球首款商業(yè)查詢大模型,該模型基于企查查覆蓋的全球企業(yè)信用數(shù)據(jù)進(jìn)行訓(xùn)練,相較于傳統(tǒng)商查平臺,后續(xù)基于知彼阿爾法商查大模型構(gòu)建的產(chǎn)品實(shí)現(xiàn)了以下三個(gè)方面的變革:
人機(jī)交互方面實(shí)現(xiàn)運(yùn)用自然語言對話,即能完成復(fù)雜的查詢步驟。用戶要查詢某項(xiàng)商業(yè)數(shù)據(jù),不再局限于關(guān)鍵詞搜索,而是可以用一段自然語言的描述,來提出自己的需求,降低用戶門檻。例如,當(dāng)用戶想要對某公司進(jìn)行淺度盡調(diào)時(shí),可以提出“某公司行業(yè)地位怎么樣?有哪些競爭對手?”知彼阿爾法大模型會從用戶的描述中理解其需求,并將需求“解構(gòu)”成對應(yīng)的指令。這種方式,當(dāng)用戶在了解一家企業(yè)時(shí),面對的知彼阿爾法大模型就像是一個(gè)專業(yè)的商業(yè)調(diào)查助手,而不是一個(gè)沒有智慧的工具。
技術(shù)方面針對用戶所提需求實(shí)現(xiàn)了秒級響應(yīng)。知彼阿爾法大模型能夠根據(jù)用戶語義,調(diào)取企查查企信數(shù)據(jù),然后再把“整理、歸納”后的結(jié)果呈現(xiàn)給用戶。這種情況下,用戶得到的不再是一堆零散信息,而是一個(gè)完整的答案。為提升響應(yīng)速度,知彼阿爾法大模型已全量接入企查查超算平臺,秒級時(shí)間就能完成查詢、瀏覽、總結(jié)、結(jié)構(gòu)化輸出等繁冗步驟。
新增“多輪對話”功能,讓商查平臺具備了邏輯思考能力。知彼阿爾法大模型“多輪對話”功能,是該模型優(yōu)于以往企查查對話式AI的一大亮點(diǎn)。借助這一能力,知彼阿爾法大模型可以引導(dǎo)用戶通過多輪對話的方式,一步步進(jìn)行更深入的分析。在多輪對話中,用戶可以在已經(jīng)得到的結(jié)果基礎(chǔ)上,提出新的指令,從而問出更深入的問題。這種方式,讓知彼阿爾法大模型不僅成為用戶的助手,還可以是“引路人”,循序漸進(jìn)的引導(dǎo)用戶自己去尋求答案。
來源:中國網(wǎng) | 撰稿:辛文 | 責(zé)編:俞舒珺 審核:張淵
新聞投稿:184042016@qq.com 新聞熱線:135 8189 2583