• 全部
  • 产业
  • Web 3.0
  • DAO
  • DeFi
  • 符文
  • 空投再质押
  • 以太坊
  • Meme
  • 比特币L2
  • 以太坊L2
  • 研报
  • 头条
  • 投资

免责声明:内容不构成买卖依据,投资有风险,入市需谨慎!

这款AI将“人类全部烹饪智慧”压缩至2兆字节

2026-05-29 00:07:02
收藏

将人类烹饪智慧压缩进2兆字节

陈约瑟宣称已将全人类的烹饪知识压缩至2兆字节,这是个大胆的断言,但经得起验证。

这位伦敦食品人工智能初创企业KAIKAKU.AI的联合创始人兼首席执行官,本周与研究学者雅库布·拉齐科夫斯基在arXiv平台联合发表论文,正式推出名为"Epicure"的三款AI模型。该系列模型基于从7种语言的11个数据集中提取的414万份食谱训练而成,最终构建出涵盖1790种食材的坐标图谱——每种食材由300个数字特征描述,其数据总量恰好能轻松容纳于常规邮件附件限制之内。

非传统食谱存储模式

若将其设想为储存炒菜教程的2兆优盘,那便误解了其本质。这2兆空间存储的实为坐标对照表,而非具体食谱文本。

我们可以将其理解为美食地图。每种食材根据其在全球数百万真实菜肴中的表现获得精准坐标定位。其数学原理清晰明了:1790种食材×300个特征值×4字节≈2.05兆字节。这些数字编码记录了食材间的共现关系、风味化合物关联性及所属烹饪传统。当模型从食谱中习得这些知识后,原始食谱数据便可剥离——所有智慧已浓缩于坐标体系之中。

烹饪领域的语义映射

这本质上与2013年word2vec在语言领域的突破异曲同工。正如谷歌研究者当年展示的语义算术运算,Epicure在食物领域实现了相似突破。以牛肉为例,将其指向美国方向,模型会关联出面包、生菜与啤酒;转向东南亚方向时,模型则脱离汉堡烧烤的思维定式,开始联想酱油、姜与芝麻油的组合。

这种转换通过论文所述的SLERP旋转导向算子实现。选定基础食材(如鸡肉)后,通过数学旋转指向特定菜系方向:旋转30度时呈现德墨风味特征,旋转至60度时,鸡肉与牛肉在墨西哥风味体系中交汇,显现玉米饼、莎莎酱、蒙特雷奶酪与波布拉诺辣椒的共性特征。旋转角度成为"保持原食材特性"与"探索新风味领域"之间的调节旋钮。

三重模型架构

Epicure包含三个版本,适用场景取决于具体需求:Cooc模型基于食谱共现关系训练,关注实际菜肴中的食材搭配规律;Chem模型依托风味化学数据库FlavorDB,分析食材间香气化合物的共享关系;Core模型则融合前两者的优势。

若询问Cooc模型与巧克力的搭配,可能得到可可粉、香草、杏仁等甜品柜常客;而Chem模型则会基于风味化学推荐太妃糖、软糖、甘纳许等具有相似化合物组成的食材。同一食材因问题维度不同,将产生差异化答案——寻求替代品的厨师与探索风味协同的主厨,各自获得符合需求的参考方案。

专业模型的精准优势

与通用型AI不同,Epicure不具备常识认知、语言生成能力,更不会虚构未知食材。其知识严格限定于1790种已学习食材,虽广度有限却赢在可靠性。相比那些被误导就可能推荐有毒食材的食谱聊天机器人,这种精准性显得尤为重要。

此前该领域的前沿成果是2021年发布的FlavorGraph模型,其仅结合化学数据与英语食谱数据集Recipe1M+。Epicure不仅引入规模扩大四倍的多语言语料库,更通过词汇清洗提升了运算效率。

现实应用场景

其实用价值显而易见:主厨可查询地中海食材在东亚风味中的对应物;食品研发人员能寻找与添加剂同处风味区域的天然替代品;食谱应用程序可在用户缺少某种食材时提供连贯的替换方案。最后一个场景恰是专业化小型模型悄然超越通用大型模型的优势所在。

目前Epicure作为研究成果已开放访问,训练模型可通过相关平台获取,完整的训练代码暂未公布。

免责声明:

本网站、超链接、相关应用程序、论坛、博客等媒体账户以及其他平台和用户发布的所有内容均来源于第三方平台及平台用户。百亿财经对于网站及其内容不作任何类型的保证,网站所有区块链相关数据以及其他内容资料仅供用户学习及研究之用,不构成任何投资、法律等其他领域的建议和依据。百亿财经用户以及其他第三方平台在本网站发布的任何内容均由其个人负责,与百亿财经无关。百亿财经不对任何因使用本网站信息而导致的任何损失负责。您需谨慎使用相关数据及内容,并自行承担所带来的一切风险。强烈建议您独自对内容进行研究、审查、分析和验证。

展开阅读全文
更多新闻
自选
我的自选
查看全部
市值 价格 24h%