作为一个每天需要处理海量信息的自媒体从业者,我最近有一种深深的疲惫感。
回头来看,美团大模型站到台前时间并不算长但节奏清晰,首次亮相在 2025 年 9 月,此后保持了每月一更的开源节奏,不断扩容自己的能力库:从强调响应速度的 LongCat-Flash-Chat 到专注逻辑的 Thinking ...
在日常生活中,我们常通过语言描述寻找特定物体:“穿蓝衬衫的人”“桌子左边的杯子”。如何让 AI 精准理解这类指令并定位目标,一直是计算机视觉的核心挑战。现有方法常被两大问题困扰: 决策过程不透明 (“黑箱” 预测)和 拒识能力不足 (对不存在 ...
随着多模态大语言模型(MLLM)的飞速发展,“Thinking with Images” 范式已在图像理解和推理任务上取得了革命性突破 —— 模型不再是被动接收视觉信息,而是学会了主动定位与思考。 然而,当面对包含复杂时序依赖与动态叙事的视频推理任务时,这一能力尚未 ...
人民网 on MSN
META THINKER《人机共生·未来之城》中国巡展在京启幕
据了解,展览将持续至2月9日,作为上海METATHINKER人机共生艺术博览会(福布斯人机共生科技智能先锋榜)全球首发环节的三大主题内容之一,《人机共生未来之城》凭借八大沉浸式主题场景,搭配每日多场互动表演,为观众呈现一场可感知、可互动、可共鸣的科技 ...
Forbes contributors publish independent expert analyses and insights. Dr. Lance B. Eliot is a world-renowned AI scientist and consultant. In today’s column, I identify how you can use generative AI ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果