将人类烹饪智慧压缩进2兆字节
陈约瑟宣称已将全人类的烹饪知识压缩至2兆字节,这是个大胆的断言,但经得起验证。
这位伦敦食品人工智能初创企业KAIKAKU.AI的联合创始人兼首席执行官,本周与研究学者雅库布·拉齐科夫斯基在arXiv平台联合发表论文,正式推出名为"Epicure"的三款AI模型。该系列模型基于从7种语言的11个数据集中提取的414万份食谱训练而成,最终构建出涵盖1790种食材的坐标图谱——每种食材由300个数字特征描述,其数据总量恰好能轻松容纳于常规邮件附件限制之内。
非传统食谱存储模式
若将其设想为储存炒菜教程的2兆优盘,那便误解了其本质。这2兆空间存储的实为坐标对照表,而非具体食谱文本。
我们可以将其理解为美食地图。每种食材根据其在全球数百万真实菜肴中的表现获得精准坐标定位。其数学原理清晰明了:1790种食材×300个特征值×4字节≈2.05兆字节。这些数字编码记录了食材间的共现关系、风味化合物关联性及所属烹饪传统。当模型从食谱中习得这些知识后,原始食谱数据便可剥离——所有智慧已浓缩于坐标体系之中。
烹饪领域的语义映射
这本质上与2013年word2vec在语言领域的突破异曲同工。正如谷歌研究者当年展示的语义算术运算,Epicure在食物领域实现了相似突破。以牛肉为例,将其指向美国方向,模型会关联出面包、生菜与啤酒;转向东南亚方向时,模型则脱离汉堡烧烤的思维定式,开始联想酱油、姜与芝麻油的组合。
这种转换通过论文所述的SLERP旋转导向算子实现。选定基础食材(如鸡肉)后,通过数学旋转指向特定菜系方向:旋转30度时呈现德墨风味特征,旋转至60度时,鸡肉与牛肉在墨西哥风味体系中交汇,显现玉米饼、莎莎酱、蒙特雷奶酪与波布拉诺辣椒的共性特征。旋转角度成为"保持原食材特性"与"探索新风味领域"之间的调节旋钮。
三重模型架构
Epicure包含三个版本,适用场景取决于具体需求:Cooc模型基于食谱共现关系训练,关注实际菜肴中的食材搭配规律;Chem模型依托风味化学数据库FlavorDB,分析食材间香气化合物的共享关系;Core模型则融合前两者的优势。
若询问Cooc模型与巧克力的搭配,可能得到可可粉、香草、杏仁等甜品柜常客;而Chem模型则会基于风味化学推荐太妃糖、软糖、甘纳许等具有相似化合物组成的食材。同一食材因问题维度不同,将产生差异化答案——寻求替代品的厨师与探索风味协同的主厨,各自获得符合需求的参考方案。
专业模型的精准优势
与通用型AI不同,Epicure不具备常识认知、语言生成能力,更不会虚构未知食材。其知识严格限定于1790种已学习食材,虽广度有限却赢在可靠性。相比那些被误导就可能推荐有毒食材的食谱聊天机器人,这种精准性显得尤为重要。
此前该领域的前沿成果是2021年发布的FlavorGraph模型,其仅结合化学数据与英语食谱数据集Recipe1M+。Epicure不仅引入规模扩大四倍的多语言语料库,更通过词汇清洗提升了运算效率。
现实应用场景
其实用价值显而易见:主厨可查询地中海食材在东亚风味中的对应物;食品研发人员能寻找与添加剂同处风味区域的天然替代品;食谱应用程序可在用户缺少某种食材时提供连贯的替换方案。最后一个场景恰是专业化小型模型悄然超越通用大型模型的优势所在。
目前Epicure作为研究成果已开放访问,训练模型可通过相关平台获取,完整的训练代码暂未公布。

交易所
交易所排行榜
24小时成交排行榜
人气排行榜
交易所比特币余额
交易所资产透明度证明
去中心化交易所
资金费率
资金费率热力图
爆仓数据
清算最大痛点
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
ETF追踪
索拉纳ETF
瑞波币ETF
香港ETF
比特币持币公司
加密资产反转
以太坊储备
HyperLiquid钱包分析
Hyperliquid鲸鱼监控
大额转账
链上异动
比特币回报率
稳定币市值
期权分析
新闻
文章
财经日历
专题
钱包
合约计算器
账号安全
资讯收藏
自选币种
我的关注