无信任，AI难成规模；信任始于数据层_新闻

免责声明：内容不构成买卖依据，投资有风险，入市需谨慎！

无信任，AI难成规模；信任始于数据层

2025-05-31 20:08:00

AI依赖数据运行，但数据正变得愈发不可靠、不道德且暗藏法律风险

生成式AI的发展不仅正在加速，更在吞噬前进道路上的一切。据报道，OpenAI在2024年仅维持模型运行就面临预计70亿美元的账单，而其年收入仅为20亿美元。与此同时，OpenAI和Anthropic的机器人程序正在对网站造成严重破坏，并引发大规模数据使用的警报。

但问题远比成本更为深刻。AI建立在数据管道之上，而这些管道却存在不透明、过时和法律合规性问题。"数据衰减"问题真实存在——基于未经验证、合成或"陈旧"数据训练的模型会随时间推移而变得不准确，最终导致决策失误。

合成数据仅是权宜之计，网络爬取则随时可能引发诉讼

合成数据在某些应用场景中确有前景，但并非没有缺陷。它难以复现真实场景的细微差异和深度。以医疗领域为例，基于合成数据集训练的AI模型在边缘案例中表现欠佳，可能危及患者安全。而在谷歌Gemini模型等高调失败案例中，偏见和扭曲输出不仅未被纠正，反而被强化。

网络爬取不仅带来公关危机，更是结构性困局。从《纽约时报》到Getty Images，诉讼案件不断累积，而欧盟AI法案等新规要求严格的数据溯源标准。特斯拉2022年臭名昭著的"幽灵刹车"问题（部分源于劣质训练数据）证明，未经核查的数据源将带来严重后果。

区块链不仅是代币技术，更是解决AI数据危机缺失的基础设施

区块链能为AI数据层提供三项关键特性：可追溯性（溯源）、不可篡改性和可验证性。这三者协同作用，帮助AI摆脱法律纠纷、伦理挑战和数据质量危机。

可追溯性确保每个数据集都有可验证的来源；不可篡改性保证记录不被操纵；智能合约则能自动化支付流程和执行授权。2023年，某基金会就为7000名肯尼亚农民实施了基于区块链的参数化保险解决方案，通过智能合约和天气数据预言机自动触发赔付。

无法审计数据，就无法审计AI模型

建立在不可见劳动和不可验证数据源上的"负责任AI"只是空谈。Anthropic的诉讼案件揭示了数据管理不善的真实财务风险。调查显示，用户越来越不信任基于个人或不明确数据训练的AI模型。

麦肯锡研究表明，高完整性的数据集能显著减少幻觉现象并提高各种应用场景的准确度。若要让AI在金融、医疗或法律领域做出关键决策，训练基础必须坚如磐石。

代币化占据头条，但区块链能重构整个数据价值链

我们正站在经济和社会变革的边缘。企业斥巨资收集数据，却对其来源和风险知之甚少。我们需要建立在授权、补偿和可验证性基础上的新型数据经济。

这种新模式包含三个关键要素：授权收集、公平补偿和可问责的AI。通过完整的数据溯源，组织既能满足合规要求，又可减少偏见并创建更准确的模型。《福布斯》预测到2027年数据溯源将发展成百亿美元产业——原因显而易见：这是AI实现伦理规模化的唯一途径。

下一场AI竞赛的决胜关键将是数据质量而非算力

算力和模型规模永远重要，但真正的突破不会来自更大的模型，而是更好的基础。如果将数据比作新石油，我们就必须停止泄漏、爬取和浪费行为，转而追踪其来源、评估其价值并投资于其完整性。

哈佛研究表明，AI模型再训练造成的能源浪费可能相当于小国家的排放量。从一开始就可验证的区块链安全数据，将使AI更精简、更快速、更环保。

我们可以构建这样的未来：AI创新者不仅比拼速度和规模，更竞争透明与公平。区块链让我们打造不仅强大而且真正合乎伦理的AI。行动时机就在当下——在下一次诉讼、偏见丑闻或幻觉事件替我们做出选择之前。

免责声明：

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证，网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用，不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责，与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容，并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文