Nouvelles et reportages
BizGenEval:为商业视觉内容生成建立一把真正有用的“标尺”
近年来,图像生成模型的飞速发展令人瞩目。从早期的通用图像生成,到如今逐步迈向更具实用价值的视觉内容创作,这一领域正经历从“好看”到“好用”的关键跃迁。然而,在繁荣表象之下,一个核心挑战正日益凸显:现有主流评测基准仍以自然图像为主,缺乏面向商业设计场景的系统性评估,无法有效衡量模型在结构化和多重约束下的表现。 与通用图像相比,商业视觉文档往往包含高密度文本、复杂版式结构以及多种视觉元素的协同布局,其…
语音识别技术在近年来取得了飞速发展,但在面对真实的复杂场景时,许多系统依然显得有些力不从心:漫长的会议、多人混杂的交谈、极具专业性的行业术语,或是中英夹杂的日常对话…… 传统的语音识别系统往往需要将长音频切分成一个个短小的片段,分别识别后再费力地“拼凑”起来。这种“化整为零”的方法不仅容易丢失上下文,还常常在谁说了什么、什么时候说的等问题上张冠李戴。 近日,微软亚洲研究院发布了一款通用的语音识别模…
《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,内容聚焦 AI 前沿技术、科研趋势与社会影响。第一季主要围绕当今智能发展的核心议题,探索前沿趋势。 在第六期节目中,我们邀请到微软亚洲研究院首席研究员李东胜博士,一同探讨 AI 与大脑的深层关联。以人脑为灵感而诞生的神经网络,究竟与大脑是单纯的模仿与被模仿关系,还是存在更深度的联结?AI 该如何向历经亿万年进化的人脑学习高效的…
别让AI在部署后停滞:OEL重塑大模型进化之路
大模型部署之后能力还可以持续提升吗? 如果去问AI开发者这个问题,在过去,答案大多是否定的。传统的大模型在出厂那一刻,其智力水平就几乎定型了。即便在实际应用中遇到了未见过的新问题,或者被用户反馈指出错误,模型也很难像人类一样,在下一次尝试时立刻吸取教训。这正是当前大语言模型面临的尴尬现状。 在现有的主流范式下,AI模型性能的提升高度依赖于离线训练,要么是昂贵的人工标注,要么是预先构建的模拟环境。一…
微软亚洲研究院携手 CCF,共促科研创新生态
近日,2025 CCF 颁奖典礼在北京举行。大会以“责任 · 创新 · 奉献”为主题,集中表彰了在计算技术研究、学术服务与科研生态建设方面作出积极贡献的个人与团队。作为大会的协办方之一,微软亚洲研究院参与了多项重要环节,与学术界同仁共同见证了这一年度科研盛会。 在本届大会的个人奖项中,微软研究院学术合作总监马歆女士荣获 CCF 年度志愿者(服务类)奖。在过去十余年中,马歆积极促进微软亚洲研究院与C…
《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,内容聚焦 AI 前沿技术、科研趋势与社会影响。第一季主要围绕当今智能发展的核心议题,探索前沿趋势。 在第五期节目中,我们邀请到微软亚洲研究院副院长谢幸博士,共同探讨 AI 与社会的深层关联。随着 AI 从单纯的工具逐步演进为人类的“伙伴”,一系列关乎技术走向与社会共生的关键问题也浮出水面:AI的价值观究竟源自何处?如何构建可信…
微小而伟大:十年,如何用技术打破偏见的高墙?
编者按:十年,可以是一段青春,也可以是一场变革的开端。微软亚洲研究院高级研究员、本文作者矣晓沅作为清华大学改革开放以来首位重度残障学生,2015年起投身于多元与包容事业中,从校园社团到微软亚洲研究院,从无障碍倡导到AI技术赋能,一步步将信念转化为行动。十年间,他以自身经历为线索,诠释了何为“微小而伟大的事”。世界仍有偏见的高墙,但总有人愿做那束微光——因为真正的包容,始于理解,成于行动。 这一切始…
真理与传承——跨越时空的科研对话
居里夫人(玛丽亚·居里 )发现镭、钋元素并开创了放射性研究的理论,罗莎琳·富兰克林帮助识别并阐明了DNA的结构,吴健雄用β衰变实验证明了在弱相互作用中的宇称不守恒,屠呦呦从中国草药青蒿中提取出能抗击疟疾的青蒿素…… 她们身处不同时代,但抱有同样不屈不挠、积极勇敢的科研精神,不畏惧外界的流言蜚语,也不为内心的怀疑打败。没有人同行,就化为先驱,毅然踏出第一个脚印;不被人理解,就埋首书本、潜心钻研,以脚…
AAAI 上新 | 从金融模拟到类人推理,聚焦大模型的能力边界
编者按:欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉。 本周,第 40 届AAAI人工智能会议(AAAI 2026)在新加坡举行。微软亚洲研究院有多篇论文入选,内容涵盖了多模态生成、复杂逻辑推理、类人特质对齐及垂直行业模拟等多个前沿领域。 本期内容速览 1. Di…