新闻与深度文章
如何评测一个大语言模型?
编者按:大型语言模型(Large language models, LLMs)因其在学术界和工业界展现出前所未有的性能而备受青睐。随着 LLMs 在研究和实际应用中被广泛使用,对其进行有效评测变得愈发重要。近期已有多篇论文围绕大模型的评测进行研究,但尚未有文章对评测的方法、数据、挑战等进行完整的梳理。日前,微软亚洲研究院的研究员们参与完成了介绍大模型评测领域的第一篇综述文章《A Survey on…
编者按:现实世界中,许多问题和任务都是由多个参与者交互进行的,所以要想使用人工智能技术解决真实世界的问题,就需要更好地模拟这种复杂的环境,而这正是多智能体强化学习(MARL)的强项。早在2020年,微软亚洲研究院基于多智能体强化学习,推出了面向多行业横截面上的多智能体资源调度平台 MARO。 随着研究的深入,研究员们发现互动式的学习环境和测试平台对多智能体强化学习的发展至关重要。为此,近期微软亚洲…
作者:量子位 作为全新的神经网络架构,RetNet 同时实现了良好的扩展结果、并行训练、低成本部署和高效推理。这些特性将使 RetNet 有可能成为继 Transformer 之后大语言模型基础网络架构的有力继承者。 ——韦福如,微软亚洲研究院全球研究合伙人 以下内容经授权转载自公众号“量子位”,原文标题《Transformer后继有模!MSRA提出全新大模型基础架构:推理速度8倍提升,内存占用减…
尽管如今的 AI 模型已经具备了理解自然语言的能力,但科研人员并没有停止对模型的不断改善和理论探索。自然语言处理(NLP)领域的技术始终在快速变化和发展当中,酝酿着新的潮流和突破。 NLP 领域的顶级学术会议国际计算语言学年会 (Annual Meeting of the Association for Computational Linguistics,简称 ACL) 是关心 NLP 领域的研究…
编者按:编译器在传统计算科学中一直是一个重要的研究课题。在人工智能技术快速发展和广泛应用的今天,人工智能模型需要部署在多样化的计算机硬件架构上。同时,训练和部署大型人工智能模型时又对硬件性能有着更高的要求,有时还需根据硬件定制化代码。这些都对人工智能时代的编译器提出了新的更高的要求。 为了适应迅速发展的人工智能模型和加速硬件的需求,微软亚洲研究院以设计和构建具有高度灵活性、高效性、可扩展的 AI…
作者:科学智能中心 编者按:近年来,深度学习技术在分子微观结构预测中取得了巨大的进展。然而,分子的宏观属性和功能往往取决于分子结构在平衡态下的分布,仅了解分子的微观结构还远远不够。在传统的统计力学中,分子动力学模拟或增强采样等是获得平衡分布中采样的常用方法,但这些方法昂贵又耗时。 针对这个长期且艰巨的挑战,微软研究院发布了可用于预测分子结构平衡分布的深度学习框架 Distributional Gr…
编者按:2020年,微软亚洲研究院开源了金融 AI 通用技术平台 Qlib。Qlib 以金融 AI 研究者和金融行业 IT 从业者为用户,针对金融场景研发了一个适应人工智能算法的高性能基础设施和数据、模型管理平台。一经开源,Qlib 便掀起了一阵热潮,相关开源项目在 GitHub 上已收获了11.4k颗星。作为一个通用技术平台,Qlib 不仅大大降低了行业从业者使用 AI 算法的技术门槛,还为金融…
国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称 ACL)是自然语言处理(NLP)领域的顶级国际会议,ACL 2023 将于2023年7月9-14日在加拿大多伦多举行。随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个需要攻坚的问题。微软亚洲研究院也在不断推进负责任的人工智能的探索发现与…
自第一期问答上线以来,树洞又收到了许多来自四面八方的在计算机领域科研、学习中听不到的“呐喊”。 筛选、归类过树洞收到的内容后,我们为提问的你咨询了微软亚洲研究院在相关领域最适合的解答者。 站在人生的十字路口,难免需要直面选择时附加的焦虑、疑惑与自我怀疑。 如何克服申请博士前不敢开口套瓷的心理障碍?心仪的领域专业知识门槛太高,觉得自己不配怎么办?科研小白如何读提升读论文的效率?对很多研究领域都感兴趣…