2025年12月,Anthropic给69名员工各自分配一个由Claude驱动的Agent,在Slack上搭建的私密市场中,进行真实二手商品交易,最终在无人干预的情况下 完成186笔交易,总成交额超4000美元 (约合人民币27240元)。
Anthropic让69名员工把买卖大权交给Claude,结果发现强模型智能体在交易中能比弱模型多赚70%,Opus用户在谈笑间就完成了对Haiku用户的收割。哪怕你写出花一样的提示词教智能体砍价,在绝对的模型代差面前只有被降维打击的份。
Discover how project finance funds large-scale projects through a non-recourse or limited-recourse structure, relying on ...
该实验名为" Project Deal ...
在CyberGym漏洞复现基准测试中,Mythos Preview得分83.1%,Anthropic此前最强公开模型Opus 4.6为66.6%。该公司说,随着AI能力以当前速度推进,此类攻击性能力将不可避免地向更广泛行为者扩散,其中不排除无意愿负责任部署的行为者,届时对经济、公共安全和国家安全的潜在冲击将是严峻的。 Project ...
苹果表示,已联系6款应用开发者,告知其存在需整改问题,否则将面临下架风险。公司同时称,Tech Transparency Project提及的其他应用并未违反其指南。苹果还补充道,公司已主动拒绝多款应用上架,并下架了其他违规应用。 “如果一款应用以通用图像生成器面目出现,即便实际可被滥用,也可能通过审核,”同时担任国际研究组织App Studies ...
Anthropic于2026年4月24日低调发布名为“Project Deal”的内部实验研究,展示了AI代理在真实市场环境中的自主谈判与交易能力。该实验在基于Slack的办公室内市场进行,由Claude模型代表69名员工执行买卖职能。实验结果显示,在涉及真实资金往来的环境下,Claude代理在逾500件上架商品中成功促成186笔交易,总成交额突破4000美元。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果