近日,中國電子學會正式公布“2021中國電子學會科學技術獎”名單。浙江大學、達摩院、阿里云共同完成的“超大規模高性能圖神經網絡計算平臺及其應用”榮獲科技進步一等獎。據悉,該獎被認為是國內電子信息技術發展風向標。
圖神經網絡讓人工智能更接近“人腦”
早在2020年,達摩院發布的《達摩院2020十大科技趨勢》中就曾提到“人工智能已經在‘聽、說、看’等感知智能領域已經達到或超越了人類水準,但在需要外部知識、邏輯推理或者領域遷移的認知智能領域還處于初級階段?!?而大規模圖神經網絡(GNNs)被業內公認為是一種推動認知智能發展的有效推理方法。
為讓人工智能的運作更加接近于人腦,圖神經網絡計算將深度學習算法和圖計算算法相融合,以達到更優的認知與問題處理等能力。這種基于圖的深度學習不僅能夠挖掘現有圖數據背后的豐富價值,還有助于將關系數據自然地建模為圖,極大地擴展了基于圖的深度學習模型的適用性。
簡單理解,在電子商務場景中,如果把整個社會看作一張龐大的關系網絡圖,那么每一個用戶、每一樣產品、每一次購買行為都是這張圖中呈現的元素。圖神經網絡計算通常被用來對這些元素之間錯綜復雜的交互關系進行學習分析,從而更為精準地與用戶互動。比如,在手機淘寶上,圖神經網絡基于對各項商品類型的學習建立了龐大的知識網絡,具備了一定生活常識,如能理解“生日”與“蛋糕”的關系,從而更好地理解用戶的商品搜索等需求。
多項關鍵技術難點實現突破
相相較于我們印象中簡單的文本和圖像,各種業務場景中需要處理的圖規模非常大,包含百億級別的點和千億級別的邊。這樣規模的計算已經遠遠超過原來的圖像和自然語言的處理。同時,圖本身是動態變化的,像常見的購物類APP上每天都會上架或者下架非常多商品,所以每一天的圖的結構都是不同的。此外,圖的非規整性、異構性等特點都給深度學習帶來了更高級別的挑戰。
經過數年快速演進,圖神經網絡的研究已經取得突飛猛進的進展。以此次獲獎的“超大規模高性能圖神經網絡計算平臺”為例,它突破了超大規模圖表示、圖存儲、圖算子以及圖加速等多個技術難點,是一個自主可控、開源開放、分布式高性能云上圖神經網絡學習平臺。
評審委員會評論稱:“該項目研制難度大、創新性強,整體技術處于國際先進水平,其中在跨模態隨機游走圖內嵌向量表達、超大規模圖自適應分區和綜合存儲、異構計算架構下圖神經網絡學習加速等方面達到國際領先水平?!?/p>
該平臺的領先性可以通過實際案例來體現。Criteo研究員Sergey Ivanov總結的2021年最有影響力的圖神經網絡應用中,有一個案例提到,UberEats公司(國外知名送餐軟件公司)此前通過GraphSage(歸納式圖神經算法)梳理食品和餐館關系。在較小規模數據中該技術適用良好,但一些工業場景面臨的可能是數億邊規模的圖,這種技術不再適用。而阿里巴巴大規模圖神經網絡平臺(AliGraph),支持高效的分布式圖形存儲,僅需5分鐘即可構建具有400M節點的圖,優化的采樣運算符以及大量內部圖神經網絡。目前該平臺已用于UberEats公司個性化搜索等業務。
應用場景廣泛,但仍存挑戰
目前來看,圖神經網絡已經在社交網絡、知識圖譜、推薦領域、生命科學、反作弊、線上支付等場景中得到了廣泛應用。尤其是谷歌、亞馬遜、微軟、阿里巴巴等一眾科技巨頭的涌入,在一定程度上加快了圖神經網絡計算技術的研發、應用進程,但不可否認的是挑戰依然存在。
阿里巴巴達摩院人工智能科學家楊紅霞在接受《中國電子報》記者采訪時指出:“雖然圖神經網絡有著非常廣闊的前景,但目前圖神經網絡的核心假設尚不明確、可擴展性有待提高,需要涌現圖神經網絡的”殺手級“應用。尤其‘端云協同’是未來AI產業服務的重要形態,給各種業務算法帶來了新的機遇,如何將圖神經網絡與端云協同結合,提高其可擴展性和在更加復雜環境中應用(例如智慧城市、XR互聯網等)是尚待解決的重要課題?!?/p>
她表示,未來,浙大與阿里團隊將繼續探索人工智能前沿技術,增進AI認知推理能力。雙方將基于達摩院大模型M6、圖神經網絡平臺Aligraph,探索端云協同框架下大小模型共同進化的下一代智能體系。
(文章來源:中國電子報)