91精品一二三,日韩欧美中文综合精品,欧美日韩在线观看视频一区,9视频在线观看18,久悠悠AV,91网站在线视频,男人的天堂亚洲易欲AV,久久狠狠地插女人,一区二区三区亚洲精品

新聞發(fā)布
立即打印
媒體聯(lián)絡(luò)
田園
用友集團(tuán) +86 1521 0340 959 tianyuanh@yonyou.com
從混沌數(shù)據(jù)到邏輯框架:LOM本體大模型如何自主構(gòu)建本體?
2026年4月17日

   

yonyou


企業(yè)擁有海量數(shù)據(jù),但數(shù)據(jù)不等于知識。ERP中的表、文檔中的規(guī)則、流程中的約束——都藏在“人腦”和“文本”中,無法被機器直接理解。沒有可計算的知識,AI只能靠概率“猜測”,無法用邏輯“保證”。



 


LOM本體大模型的核心能力之一,是自主構(gòu)建企業(yè)業(yè)務(wù)的邏輯框架——從混沌數(shù)據(jù)中提煉出實體、關(guān)系、約束,形式化為可計算的本體。本文基于用友AI Lab全新發(fā)布的LOM本體大模型論文《Unifying Ontology Construction and Semantic Alignment for Deterministic Enterprise Reasoning at Scale》,深度解讀這一能力,揭示LOM本體大模型如何為企業(yè)AI規(guī)?;於ǖ谝粔K基石。


01

企業(yè)AI規(guī)?;目玻?/strong>

數(shù)據(jù)不等于知識


 


過去十年,企業(yè)完成了大規(guī)模的數(shù)字化遷移。ERP、CRM、SCM、HRM——各類業(yè)務(wù)系統(tǒng)積累了海量數(shù)據(jù)。然而,當(dāng)企業(yè)試圖用AI處理這些數(shù)據(jù)時,一個根本問題浮出水面:數(shù)據(jù)不等于知識。


一個典型的ERP系統(tǒng)可能包含數(shù)百張表、數(shù)千個字段。字段名如“INV01”“CUST_TYPE”只是標(biāo)識符,其業(yè)務(wù)含義需要人工解讀;同一概念在不同系統(tǒng)中使用不同名稱;業(yè)務(wù)規(guī)則藏在操作手冊里,寫在審批流程中,甚至存在業(yè)務(wù)專家的腦子里。


這種“數(shù)據(jù)豐富、知識貧乏”的困境,構(gòu)成了企業(yè)AI規(guī)?;瘧?yīng)用的第一道坎。沒有可計算的知識框架,AI只能基于統(tǒng)計相關(guān)性進(jìn)行“猜測”——這恰恰是概率模型的本質(zhì)局限。


論文開篇即點明這一困境:“企業(yè)積累了海量數(shù)據(jù),但其中大部分仍然混亂且實際上處于休眠狀態(tài)?!比绾螁拘堰@些沉睡的數(shù)據(jù)?答案在于自主構(gòu)建。


02

 本體:

讓機器理解業(yè)務(wù)的“邏輯框架”


在人工智能領(lǐng)域,“本體”是一個基礎(chǔ)概念。簡單來說,本體是對一個領(lǐng)域的概念化——它定義了:


實體:業(yè)務(wù)中有哪些事物(供應(yīng)商、物料、倉庫、訂單)

關(guān)系:這些事物之間如何關(guān)聯(lián)(供應(yīng)商提供物料、物料存入倉庫)

約束:這些關(guān)系必須遵守什么規(guī)則(物料必須在保質(zhì)期內(nèi)、供應(yīng)商必須通過資質(zhì)審核)


我們可以把本體理解為企業(yè)的“業(yè)務(wù)物理定律”。正如牛頓定律描述了宇宙中物體的運動規(guī)律,本體描述了企業(yè)業(yè)務(wù)的運行邏輯。有了這套“定律”,機器就不再是盲目地“猜”,而是有章可循地“推”。


論文將這一思想總結(jié)為:通過自主構(gòu)建本體,LOM本體大模型“創(chuàng)造了一個確定性的環(huán)境,其中邏輯不僅僅是概率性的,而是結(jié)構(gòu)性的、具有約束力的”。


03

自主構(gòu)建:

LOM如何從混沌數(shù)據(jù)中“提煉”邏輯框架


 


LOM本體大模型的自主構(gòu)建能力,體現(xiàn)在它能夠從

兩類原始數(shù)據(jù)中自動抽取知識:


從結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)隱式關(guān)系


企業(yè)數(shù)據(jù)庫中的表常常缺少明確的外鍵定義。

LOM本體大模型采用迭代框架,按外鍵約束順序遍歷表結(jié)構(gòu),結(jié)合RAG模塊獲取語義上下文,合成增量本體片段。經(jīng)過驗證與優(yōu)化,最終將所有表、列及關(guān)系映射為邏輯自洽的全局本體。




從非結(jié)構(gòu)化文本中抽取實體與關(guān)系


企業(yè)的知識不僅存在于數(shù)據(jù)庫中,更大量沉淀在文檔里——操作手冊、合同條款、政策文件、會議紀(jì)要。


LOM本體大模型采用LLM驅(qū)動的抽取管道:將文檔分塊處理,在低溫度設(shè)置下執(zhí)行實體-關(guān)系抽取,識別出業(yè)務(wù)實體及其屬性,以及實體之間的關(guān)聯(lián)類型(如“隸屬于”“關(guān)聯(lián)于”“屬于”)。


抽取出的實體往往存在指代不一的問題——同一家供應(yīng)商可能被稱為“XX科技”“XX科技有限公司”“XX科技股份”。LOM本體大模型通過多層次匹配機制解決這一難題:


表面匹配(編輯距離、子串包含)

領(lǐng)域歸一化(標(biāo)準(zhǔn)化縮寫與全稱)

  深度語義匹配(向量嵌入相似度)


最終,同一實體被合并為規(guī)范節(jié)點,形成文本層本體。


跨源融合:統(tǒng)一的企業(yè)知識圖譜


結(jié)構(gòu)化本體與文本本體通過系統(tǒng)性流程深度融合:概念對齊識別等價類與屬性,沖突解決處理命名與層次矛盾,層次集成建立跨本體關(guān)系,最后通過驗證確保邏輯一致性。


融合后的企業(yè)本體是一個統(tǒng)一的異構(gòu)圖,既包含關(guān)系數(shù)據(jù)庫的嚴(yán)謹(jǐn)結(jié)構(gòu),又承載非結(jié)構(gòu)化文檔的豐富語義。論文指出,這一過程“將原始數(shù)據(jù)中固有的概率噪聲坍縮為確定性的結(jié)構(gòu)表示”。


04

動態(tài)演化:

邏輯框架不是靜態(tài)的,而是“活”的


企業(yè)的業(yè)務(wù)不是一成不變的。新供應(yīng)商入庫,新政策發(fā)布,新約束生效——邏輯框架必須隨之演化。


傳統(tǒng)方法每次更新都需要重新構(gòu)建,成本高昂且滯后嚴(yán)重。LOM本體大模型則通過動態(tài)更新機制,支持本體的實時演化。論文將這一機制描述為“讓圖結(jié)構(gòu)響應(yīng)實時數(shù)據(jù)流入而動態(tài)適應(yīng)”。


具體而言,LOM本體大模型將企業(yè)環(huán)境概念化為一個稀疏圖,節(jié)點代表實體,邊代表關(guān)系。當(dāng)新數(shù)據(jù)流入,模型通過鏈接預(yù)測判斷是否需要更新圖狀態(tài)——是否存在新節(jié)點?新關(guān)系?舊關(guān)系是否失效?然后遞歸更新圖結(jié)構(gòu),保持與業(yè)務(wù)現(xiàn)實同步。


論文用公式描述了這一過程:G??? = Update(G?, ΔD?; θ_align)。這意味著,LOM的邏輯框架不是靜態(tài)的“知識庫”,而是動態(tài)的“生命體”,持續(xù)與業(yè)務(wù)現(xiàn)實同頻共振。


05

邏輯框架如何服務(wù)于確定性推理


有了這個自主構(gòu)建的邏輯框架,LOM本體大模型的推理不再是概率性的“猜測”,而是確定性的“推導(dǎo)”。


在傳統(tǒng)的GraphRAG范式中,圖被用作檢索索引,幫助LLM定位相關(guān)文本,但最終推理仍由LLM的概率引擎完成。LOM本體大模型則完全不同——它將本體作為邏輯定律,在本體上直接執(zhí)行確定的圖算法(如最短路徑、最小生成樹)或邏輯規(guī)則推理。


這正是7D邏輯自治的核心:結(jié)論不是“猜”出來的,而是由邏輯框架嚴(yán)格推導(dǎo)出來的。


這一轉(zhuǎn)變對企業(yè)決策具有根本意義。當(dāng)AI建議“更換供應(yīng)商A”時,企業(yè)需要知道:這是基于什么規(guī)則?推導(dǎo)路徑是什么?是否可驗證、可追溯?LOM本體大模型的邏輯框架提供了所有這些答案。


論文的實驗數(shù)據(jù)驗證了這一路徑的有效性:在鏈接預(yù)測任務(wù)(本體構(gòu)建的核心)上,LOM-4B達(dá)到88.8%準(zhǔn)確率。這證明LOM能夠從真實企業(yè)的噪聲數(shù)據(jù)中,準(zhǔn)確地構(gòu)建出可計算的邏輯框架。


從混沌數(shù)據(jù)到邏輯框架,LOM本體大模型的本體自主構(gòu)建能力完成了企業(yè)AI規(guī)?;年P(guān)鍵一躍。它解決了“數(shù)據(jù)不等于知識”的根本困境,將企業(yè)散落的隱性知識轉(zhuǎn)化為可計算的邏輯體系。


這個自主構(gòu)建并持續(xù)演化的邏輯框架,正是后續(xù)語義對齊和確定性推理賴以實現(xiàn)的基石。沒有它,AI只能“猜”;有了它,AI才能“推”。讓AI獲得“理解”業(yè)務(wù)世界邏輯的能力,是超越概率猜測、實現(xiàn)企業(yè)級確定性智能的必經(jīng)之路。


LOM本體大模型論文地址,免費下載:

https://chinaxiv.org/abs/202603.00072


 


掃描上方二維碼

獲取本體大模型資料

更有機會參加企業(yè)AI訓(xùn)練營


   

德钦县| 华蓥市| 景泰县| 天祝| 临汾市| 老河口市| 木兰县| 响水县| 博湖县| 夏邑县| 余姚市| 保山市| 虞城县| 涿州市| 东乡县| 铜梁县| 库尔勒市| 岢岚县| 民和| 铁力市| 百色市| 米脂县| 临洮县| 昂仁县| 正宁县| 江达县| 峨眉山市| 延津县| 连城县| 佛教| 泸州市| 庄河市| 舒城县| 临西县| 新昌县| 和硕县| 宝兴县| 文山县| 盐津县| 昂仁县| 固始县| ·