更令人惊喜的是,研究团队还创造了一个名为"PBench"的全新测试平台,专门用来评估这类模型在复杂情况下的表现。这就像为运动员设计了一套更全面的体能测试,不仅测试基本能力,还要考验在各种复杂环境下的应变能力。
技术创新研究院的工作涵盖AI安全、评估和部署框架以及大规模研究项目。这一努力的旗舰成果是Falcon,阿联酋自主研发的大语言模型,于2023年首次由技术创新研究院推出。Falcon因其性能以及作为开源模型发布而迅速获得国际关注,这反映了阿布扎比相信开 ...
阿布扎比技术创新研究院推出多模态AI模型Falcon Perception,具备视觉识别、阅读和解释物理世界的能力。该模型拥有约6亿参数,相比其他数十亿参数的模型更加紧凑高效。它采用统一的变换器架构,能够端到端集成视觉和语言特征,在制造业缺陷检测、机器人自然语言指令执行、企业文档处理等领域具有广泛应用前景,标志着阿联酋在全球AI竞争中的重要进展。