9999精品视频,一区二区色,91福利在线免费播放,人妻在线综合综合网,人妻丰满精品一区,九九九精品九九九精品,久久精品店,国产午夜久久,五月天人妻超碰

  • +1

知識圖譜的應(yīng)用場景與技術(shù)挑戰(zhàn)

2022-11-18 11:59
來源:澎湃新聞·澎湃號·湃客
聽全文
字號

互聯(lián)網(wǎng)信息的爆炸式增長,具有大規(guī)模、多元化、組織結(jié)構(gòu)松散等特點(diǎn),如何有效獲取信息和知識面臨巨大挑戰(zhàn)。

近年來興起的“知識圖譜”,漸漸成為一種新穎的管理海量信息的方式,受到各大互聯(lián)網(wǎng)公司青睞,并在不知不覺中被廣泛應(yīng)用于搜索、電商、社交等各個領(lǐng)域。

除此之外,該技術(shù)還被各大金融機(jī)構(gòu)以及人工智能公司關(guān)注,開始在金融反欺詐、安防等新的領(lǐng)域進(jìn)行嘗試應(yīng)用。

但是,知識圖譜技術(shù)依然不夠成熟,從第三方獲取技術(shù)服務(wù)費(fèi)等商業(yè)化依然處于探索階段。

一、知識圖譜基本概念

關(guān)于知識圖譜定義,復(fù)旦大學(xué)教授肖仰華在其著作《知識圖譜》中這么解釋:“作為一種知識表示形式,知識圖譜是一種大規(guī)模語義網(wǎng)絡(luò),包括實體、概念及其之間的各種語義關(guān)系?!比缦聢D,柏拉圖就是一個實體,他是一個哲學(xué)家(概念)。

冰鑒科技知識圖譜業(yè)務(wù)負(fù)責(zé)人認(rèn)為:“知識圖譜核心價值在于如何沉淀知識。圖譜開始建立的時候,都是關(guān)系圖譜,通過大量的模型,借助于圖譜模型的高度解釋性的優(yōu)勢,構(gòu)建和形成很多隱性關(guān)系和實體標(biāo)簽,最后建設(shè)成為知識圖譜。在關(guān)系圖譜到知識圖譜的建設(shè)過程中,業(yè)務(wù)專家高度參與,利用知識圖譜的探索式數(shù)據(jù)分析能力,自助構(gòu)建高度解釋性的業(yè)務(wù)知識模型,形成知識沉淀的迭代和高度分享。

知識圖譜是典型的大數(shù)據(jù)時代產(chǎn)物,具有規(guī)模巨大、質(zhì)量精良、結(jié)構(gòu)友好等優(yōu)點(diǎn)。

2017年,我國科學(xué)目錄調(diào)整時,首次出現(xiàn)了知識圖譜學(xué)科,教育部對知識圖譜這一學(xué)科的定位是“大規(guī)模知識工程”。

二、知識圖譜發(fā)展與應(yīng)用

知識圖譜早期主要用于搜索結(jié)果優(yōu)化,隨著電商、互聯(lián)網(wǎng)金融等興起,應(yīng)用領(lǐng)域不斷增加,包括智能推薦、智能客服、金融風(fēng)控、安全與安防等都在積極探索。

1、搜索優(yōu)化

知識圖譜的誕生最早可以追溯到2010年前后,主要是為了解決搜索引擎用戶體驗問題。搜索領(lǐng)域主要面臨兩方面問題:

一方面,搜索需求和搜索結(jié)果往往難以匹配,經(jīng)常有“搜”非所問的情況;另一方面,搜索結(jié)果編排無序,顯示雜亂。

2010年,微軟開始構(gòu)建MicrosoftSatori知識圖譜來增強(qiáng)Bing搜索能力;2012年5月,Google公司為了支撐其語義搜索推出KnowledgeGraph,目前已成為全球最大的知識圖譜。2012年11月22日,搜狗知立方上線,成為國內(nèi)首個搜索引擎“中文知識圖譜”。差不多同一時間,百度知識圖譜被立項。2013 年,F(xiàn)acebook發(fā)布OpenGraph應(yīng)用于社交網(wǎng)絡(luò)智能搜索。早期各大搜索平臺主要依賴“關(guān)鍵字搜索”技術(shù),返回給用戶包含關(guān)鍵字的網(wǎng)頁列表,用戶需要進(jìn)一步瀏覽這些網(wǎng)頁并且過濾掉大量無用信息才能找到真正想要的結(jié)果,用戶更希望能夠“直接得到答案”。利用知識圖譜技術(shù)可以直接給出用戶想要的搜索結(jié)果,而不再是各類鏈接。如下圖,搜索“上海有多少人?”360搜索直接展示出國家統(tǒng)計局的數(shù)據(jù),用戶直接將鼠標(biāo)移動到相應(yīng)年份,可以快速查看各年數(shù)據(jù)。

隨后,知識圖譜引入到電商搜索領(lǐng)域。2015年,阿里巴巴開始構(gòu)建電商領(lǐng)域知識圖譜——認(rèn)知圖譜;2016年Amazon也緊隨其后開始構(gòu)建知識圖譜。2018年5月,美團(tuán)點(diǎn)評NLP中心開始構(gòu)建大規(guī)模的餐飲娛樂知識圖譜——美團(tuán)大腦。在搜索領(lǐng)域,知識圖譜能夠?qū)⒂脩羲峤坏牟樵冊~理解成實體或者概念,通過實體或者概念匹配為用戶返回其可能關(guān)心的全部網(wǎng)頁內(nèi)容。搜索引擎中知識圖譜的搜索過程如下:知識圖譜用文本和知識融合的閱讀理解模型,使搜索結(jié)果更理解客戶需求。對于電商平臺來說,交易量和客戶活躍度也是其核心競爭力,而客戶一般都是通過搜索獲得想要的商品,越精準(zhǔn)的搜索結(jié)果,客戶使用越多。因此,百度、搜狗、阿里巴巴、美團(tuán)、騰訊等不斷摸索,紛紛嘗試構(gòu)建自己的知識圖譜平臺。

2、智能推薦

除了優(yōu)化搜索結(jié)果,知識圖譜還可以幫助電商以及社交平臺解決一些智能推薦問題。例如,當(dāng)前一些中小平臺在智能推薦方面最大的問題是“買了啥,推薦啥”或者“推薦的商品與客戶無關(guān)聯(lián)”。推薦商品缺乏新穎性,導(dǎo)致轉(zhuǎn)化效果一般。知識圖譜可以幫助電商平臺跳出這種簡單的推薦邏輯,使得推薦結(jié)果更加智能化,促進(jìn)用戶購買。

備注:左圖展示了實體鏈接如何應(yīng)用于智能問答問題推薦,問題通過SLU處理之后會得到其意圖和主實體,然后借助實體推薦得到相關(guān)的實體,相關(guān)實體被用來構(gòu)建相關(guān)的問題,比如說”武漢大學(xué)周邊好吃的?“,識別到其主實體為”武漢大學(xué)“、核心意圖為”美食“,以此推薦實體相關(guān)的問題,比如說”華中科技大學(xué)周邊有什么好吃的?“,”清華大學(xué)周邊有什么好吃的?“,”武漢科技大學(xué)周邊有什么好吃的?“。同時實現(xiàn)了推薦意圖相關(guān)的問題,比如說”武漢大學(xué)周邊有什么好玩的?“,”武漢大學(xué)周邊有什么景點(diǎn)?“,”武漢大學(xué)周邊有什么酒店?“等等。

右圖展示了實體推薦在圖譜自動化構(gòu)建平臺上的應(yīng)用,當(dāng)用戶搜索一個實體的時候,平臺會為其推薦相關(guān)的實體。

3、金融風(fēng)控

近些年,消費(fèi)金融和小微企業(yè)貸興起后,銀行以及其他持牌金融公司、助貸機(jī)構(gòu)、人工智能公司等開始將知識圖譜應(yīng)用于風(fēng)險控制,特別是識別團(tuán)伙欺詐。

知識圖譜的推理能力和可解釋性,在金融場景中具有天然的優(yōu)勢。艾瑞咨詢年初發(fā)布的《2020年中國面向人工智能“新基建”的知識圖譜行業(yè)研究報告》指出,隨著近些年金融數(shù)據(jù)的爆發(fā)式增長,傳統(tǒng)風(fēng)控系統(tǒng)逐漸力有不逮,而應(yīng)用機(jī)器學(xué)習(xí)算法和知識圖譜的智能風(fēng)控系統(tǒng)在風(fēng)險識別能力和大規(guī)模運(yùn)算方面具有突出優(yōu)勢,逐漸成為金融領(lǐng)域風(fēng)控反欺詐的主要手段。

在金融領(lǐng)域,知識圖譜可以應(yīng)用于小微企業(yè)信貸、消費(fèi)信貸、信用卡申請等反欺詐業(yè)務(wù),還可以用來識別會計造假。

基本原理簡單理解是:“物以類聚,人以群分?!?/strong>如“同一個WiFi下多個企業(yè)借款客戶”,或者“同一個設(shè)備注冊多個企業(yè)賬號申請借款”,都可能與欺詐相關(guān)。因此,信貸欺詐的識別問題可以轉(zhuǎn)化為客戶知識圖譜挖掘或社交網(wǎng)絡(luò)分析問題。即把企業(yè)工商信息、新聞動態(tài)、股東關(guān)系、股權(quán)變更、司法訴訟等等整合到反欺詐知識圖譜里,經(jīng)過分析和預(yù)測,挖掘識別欺詐案件,如利用殼公司貸款等。據(jù)冰鑒科技知識圖譜負(fù)責(zé)人介紹,目前冰鑒正在與銀行合作,構(gòu)建不同條件下,不同場景的知識圖譜模型,給知識圖譜的實體關(guān)系打上標(biāo)簽或者挖掘新的關(guān)系,以便更好的應(yīng)用于金融風(fēng)控。

 

圖7:圖特征整體框架設(shè)計

資料來源:冰鑒科技研究院

再從常見的擔(dān)保業(yè)務(wù)來看,擔(dān)保網(wǎng)絡(luò)可簡化為規(guī)模較小、相對獨(dú)立的擔(dān)保群。擔(dān)保群間擔(dān)保關(guān)聯(lián)稀疏;擔(dān)保群內(nèi)部聯(lián)系緊密,擔(dān)保圈風(fēng)險一般只發(fā)生在群內(nèi)部,找到風(fēng)險最大的擔(dān)保群,然后就可以找到風(fēng)險最大的擔(dān)保企業(yè)。

在金融領(lǐng)域,除了冰鑒科技外,建設(shè)銀行、招商銀行、光大銀行、南京銀行等商業(yè)銀行,360數(shù)科、萬象智聯(lián)等均在積極嘗試?yán)迷摷夹g(shù)進(jìn)行風(fēng)險控制。

4、智慧城市

公安機(jī)關(guān)在偵查案件時,經(jīng)??吹睫k案民警用圖譜梳理案件及人物關(guān)系。在電視劇《人民的名義》中,警方利用知識圖譜分析,可以很快看清“山水集團(tuán)”背后的利益鏈條。

除此之外,知識圖譜從大數(shù)據(jù)中深度挖掘關(guān)聯(lián)關(guān)系,可準(zhǔn)實時分析多至千億級海量關(guān)系數(shù)據(jù),轉(zhuǎn)化為關(guān)系圖譜數(shù)據(jù),支撐公安機(jī)關(guān)展開情報研判分析、犯罪團(tuán)伙跟蹤以及重大事情預(yù)警等。

5、其他領(lǐng)域

除了以上應(yīng)用領(lǐng)域外,智慧醫(yī)療、智能客服(智能問答)等領(lǐng)域也在積極利用知識圖譜技術(shù),使結(jié)果更加準(zhǔn)確,使機(jī)器人客服更加智能。

三、知識圖譜的技術(shù)與應(yīng)用挑戰(zhàn)

 

2018年10月,知識圖譜首次進(jìn)入國際知名咨詢公司Gartener的技術(shù)成熟度曲線,目前正處于技術(shù)成熟曲線的上升階段,特別是學(xué)習(xí)和推理技術(shù)亟待突破,預(yù)計進(jìn)入成熟期還需要5-10年。知識融合和知識推理是知識圖譜的關(guān)鍵技術(shù),但目前都面臨很多挑戰(zhàn),主要包括:

1、當(dāng)知識圖譜不能準(zhǔn)確將具有同義異名的實體對齊或?qū)⑼惲x的實體消歧就會導(dǎo)致知識圖譜中出現(xiàn)知識冗余或缺失;

2、如何模仿人腦機(jī)制實現(xiàn)小樣本或零樣本學(xué)習(xí)知識推理;

3、知識圖譜中知識的有效性往往受到時間空間等動態(tài)因素約束,如何合理利用知識的動態(tài)約束信息完成動態(tài)推理也是知識推理的一大挑戰(zhàn);

4、在自然語言處理仍然不能有效完成抽取任務(wù)的現(xiàn)實下,能否充分利用各類資源,能否有效利用已經(jīng)積累的業(yè)務(wù)知識,能否充分利用人力因素進(jìn)行驗證或者標(biāo)注,均對知識圖譜落地的效果產(chǎn)生顯著影響。

比如搜索“蘋果”,淘寶出現(xiàn)的全是蘋果手機(jī),而京東既有蘋果手機(jī),也有蘋果(水果)。這說明兩家公司對同一客戶需求判斷出現(xiàn)了語義分歧,前者認(rèn)為客戶只需要蘋果手機(jī),后者認(rèn)為客戶還可能想吃蘋果。但是,出現(xiàn)這樣的結(jié)果卻很難判斷誰好誰壞,不同用戶體驗是不一樣的。

此外,電商、金融、安防等等領(lǐng)域都可以搭建知識圖譜平臺,但是如何更好的與這些應(yīng)用場景結(jié)合,在不同公司不同行業(yè)之間低成本遷移、商業(yè)化落地,面臨重大挑戰(zhàn)。

四、知識圖譜商業(yè)化探索

 

目前來看,電商領(lǐng)域(淘寶、美團(tuán)等)、通用搜索平臺(百度、搜狗搜索)都是自建知識圖譜平臺,且已經(jīng)有效提高了客戶體驗,增加了用戶粘性。

但知識圖譜在第三方的商業(yè)化依然處于探索階段。

據(jù)冰鑒科技研究院了解,智能客服已經(jīng)在很多行業(yè)開始商業(yè)化應(yīng)用,而其核心技術(shù)就是知識圖譜,極大地減少企業(yè)的客服成本。在電商領(lǐng)域,未來很可能會將相關(guān)知識圖譜技術(shù)對外輸出,特別是一些垂直領(lǐng)域的電商平臺。在金融領(lǐng)域,第三方人工智能公司為銀行等金融機(jī)構(gòu)搭建知識圖譜平臺獲取技術(shù)服務(wù)費(fèi)是其主要的商業(yè)化的方法之一。如建設(shè)銀行,在2019年6月對外發(fā)布人工智能運(yùn)維知識圖譜產(chǎn)品供應(yīng)商征集公告。

從短期來看,在大多數(shù)細(xì)分領(lǐng)域,知識圖譜平臺商業(yè)化還比較困難,一方面缺少有效付費(fèi)用戶,另一方面公開數(shù)據(jù)有限、相關(guān)知識抽取困難,知識圖譜平臺難以搭建;從長期來看,據(jù)艾瑞咨詢推算,知識圖譜核心產(chǎn)品的市場規(guī)模預(yù)計2024年將突破200億元,年復(fù)合增長率達(dá)到20.4%。

 

    本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2026 上海東方報業(yè)有限公司

            临沂市| 仪征市| 皮山县| 乌兰察布市| 榕江县| 南阳市| 平山县| 朝阳区| 湘西| 德州市| 湟中县| 钦州市| 阿尔山市| 攀枝花市| 舒城县| 康乐县| 集贤县| 新田县| 新乐市| 高邮市| 柘城县| 镇巴县| 玉田县| 武宣县| 兴隆县| 嘉荫县| 丰城市| 龙门县| 宁南县| 丰台区| 曲周县| 辽阳县| 黑龙江省| 美姑县| 攀枝花市| 上犹县| 罗平县| 麻栗坡县| 格尔木市| 乌鲁木齐市| 靖州|