自选
我的自选
查看全部
市值 价格 24h%
  • 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

知识图谱:大语言模型与区块链协议的共通力量

2025-12-05 00:49:14
收藏

知识图谱的基本概念

知识图谱是大型语言模型使用的最小信息单元,这种结构对人类和机器都具有明确意义。它如同自然语言中的句子,通过有意义的方式组织数据,揭示单词等数据单元之间的关联。当前部分区块链协议正运用知识图谱来整理事实并将其记录在链上,通过连接这些图谱构建出语境网络,使获取链上记录信息的准确内容变得简单高效。

知识图谱的呈现形式

面对庞大的事实网络时,知识图谱是机器的解译工具。它将世界映射为实体与关系交织的网络,不同于电子表格的表格约束,它通过带标签的连接线将现实事物(人物、地点、概念)相互关联。知识图谱中的所有信息都以三元组形式存储:(主体)-【关系】→(客体)。例如:(中本聪)-【撰写】→(比特币白皮书),或(比特币白皮书)-【标题为】→(《比特币:一种点对点电子现金系统》)。

三元组也能描述人物关系:(哈尔·芬尼)-【首次交易发送至】→(中本聪);项目与概念关系:(以太坊)-【引入】→(智能合约),(维塔利克·布特林)-【提出】→(ERC-20代币标准),(Uniswap)-【构建于】→(以太坊)。甚至能捕捉更宏观的概念:(Web3)-【致力于】→(去中心化),(Chainlink)-【提供】→(去中心化预言机)。

每个三元组记录一个精确事实,当数千个三元组相互连接,就形成了展现实体关联的图谱网络。现实中的知名知识图谱包括谷歌知识图谱、维基数据、微软Satori、亚马逊产品图谱、Facebook社交图谱等。企业也会构建专属图谱,如优步的司机-乘客-城市网络,爱彼迎的房源-房东-租客网络。

语言模型如何运用知识图谱

知识图谱具备机器可读特性,人工智能可沿链接逐步解答复杂问题。例如询问“哪些二层项目由以太坊核心贡献者创立?”时,AI会沿路径追溯:以太坊→核心贡献者→人物→创立→Arbitrum/Optimism等。这相当于为AI配备了推理地图与指南针。

这些图谱还具有动态性。实时数据流(链上指标、区块链事件、更新代币信息)能持续刷新图谱,使AI模型无需重新训练即可保持准确性。当模型生成答案时,可通过图谱核验每个事实,避免虚构或错误。当然,现有模型尚未完全准确,但正在持续改进。

热点案例浅析

以12月4日热点Fusaka为例,若想了解其详情,可向语言模型提问。模型将依托如下知识图谱三元组进行解答:(Fusaka)-【升级自】→(以太坊),(Fusaka)-【激活于】→(2025-12-03)。

每个三元组以明确方式记录事实,例如(Fusaka)-【引入】→(PeerDAS),(PeerDAS)-【降低带宽需求对于】→(验证者)。图谱还能展示实施关系:(Fusaka)-【实现】→(EIP-7918),(EIP-7918)-【确保】→(稳定ETH销毁)。三元组串联后可描述宏观结构:(Fusaka)-【支持扩容对于】→(二层网络),(二层网络)-【Fusaka后目标TPS】→(10万+)。甚至能捕捉未来规划:(Fusaka)-【预备用于】→(BPO硬分叉)。

这仅是语言模型能力的冰山一角。它们会根据指令将知识转化为完整文本,输出风格因需求而异——无论是个人所需的简明解释,还是记者急需的权威性长篇报道。本质上,无论指令形式如何,底层知识图谱始终如一。

知识图谱的准确性挑战

要发挥实用价值,知识图谱必须绝对准确且来源可追溯。这正是语言模型的痛点——当关键信息缺失时,它们倾向于虚构内容。多数模型在多数情况下皆如此,无法依赖AI以知识图谱形式维护真相。这个AI遗留的漏洞,正由部分区块链协议尝试填补。

区块链协议与知识图谱的结合

通常区块链协议本身不“思考”或运行知识图谱,仅将原始数据写入区块。但新兴协议将知识图谱嵌入链内,把结构化事实作为协议组成部分,将实体与关系视作一等数据。

The Graph协议如同区块链界的谷歌,其索引对象并非网站,而是将以太坊、Solana、Polygon等数十条链上活动编织成动态行为图谱。这些相互连接的记录构成共享知识图谱,最终增强web3生态的可信度。

Geobrowser作为构建于The Graph之上的web3浏览器与知识图谱应用,致力于将区块链数据(及其他公开数据)转化为可浏览、可验证、去中心化的知识地图。它以空间为单位组织内容,供用户收集事实、链接数据、共建共享图谱。最重要的是,它将区块链数据转化为用户友好的共享知识库,使web3真正实现意义存储与传递,而非单纯数据堆砌。

OriginTrail则运营跨链知识图谱,存储连接现实数据与链上证明的“知识资产”,覆盖Polkadot、以太坊等多链网络,主要应用于供应链、产品溯源及AI就绪数据集领域。其他类似系统也遵循相同理念,将结构化事实存于链上,使应用无需中介即可查询。

区块链提供信任根基,知识图谱赋予结构框架,二者共同构筑起服务于AI、去中心化应用及现实系统的新数据层。

个人见解

笔者初识知识图谱源于多年前参与的开创性语言模型训练项目。当时的核心任务是将三元组集合转化为意义连贯的段落,这正是知识图谱的雏形。此后虽涉足多种语言任务,这段经历仍是最重要的工作基石。

随着兴趣转向web3领域,笔者长期关注去中心化网络的潜力。这不仅是将控制权归还用户的途径,更是重塑知识结构与获取方式的革命。想象一个所有事实、连接与洞察都融入鲜活网络的互联网生态:信息不再散落于封闭孤岛,而是相互链接、可追溯、透明化的存在。这样的系统不仅存储数据,更将其组织成人类可直接运用的知识。

知识图谱是实现这一愿景的蓝图,它能揭示关联关系、上下文脉络与来源背景。在去中心化网络中,知识图谱将让我们追踪思想演变路径,审视论断背后源流,理解信息碎片间的内在联系——这正是令人期待的未来图景。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻