AI冲浪不丝滑? 伦敦大学学院(UCL)、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web,让现有多模态模型像人类一样使用网页。 现有的Web Agent在面对复杂的网页结构(如 iframe、Shadow ...
【新智元导读】OpenAI Atlas、Perplexity Comet等AI浏览器的推出,虽提升了网页自动化效率,却也使智能爬虫威胁加剧。南洋理工大学团队研发的WebCloak,创新性地混淆网页结构与语义,打破爬虫技术依赖,为数据安全筑起轻量高效防线,助力抵御新型智能攻击,守护 ...
编者按:随着基于大语言模型的智能代理(LLM-based Agents)迅速走向实际应用,一个关键问题日益凸显:我们如何有效评估这些系统的真实能力?表面上的流畅对话或单一任务完成率已不足以判断Agent在复杂环境中的可靠性。本文深入剖析了Agent评估的全景图谱 ...
强化学习智能体训练的论文中都广泛提到的一个思想:SFT极度依赖数据质量及数据多样性,PPO 系列算法(DAPO、GRPO、RENFORCE++、RLOO)是 online 的 rl 方式,每个状态步从环境中采样数据,需要的原始数据远低于 SFT。但目前为止,智能体的强化学习训练并没有出现 ...
绿洲:对于未来 Agent 的发展,你觉得需要注意些什么呢? 苏老师: Agent 的安全问题是怎么提也不为过的话题,未来 Web Agent 极有可能在真实网页上捣乱,或者造成信息泄露,这都是目前人们忽视的地方。