Human language technologies

Researching software and systems that bridge the linguistic divide between people and machines to make communicating with computers as natural as speaking with family and friends.

Lydia Nishimwe's MSR Africa, Nairobi seminar

Making Sentence Embeddings Robust to User-Generated Content | Video

Microsoft Research Forum | Episode 3 | Daniela Massiceti

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

Project GraphRAG | LLM-Derived Knowledge Graphs

Microsoft Research Forum | Episode 3 | panel discussion

PARIKSHA: A Scalable, Democratic, Transparent Evaluation Platform for Assessing Indic Large Language Models

Current selections

Sort by: Most recent

Clear selections

Search within these results

Content Types

People

Jianfeng Gao (195)

Jinyu Li (181)

Furu Wei (108)

Chin-Yew Lin (104)

Yifan Gong (92)

Kalika Bali (72)

Michel Galley (70)

Sunayana Sitaram (56)

Sarangarajan Parthasarathy (50)

Shujie Liu (50)

Chris Quirk (44)

Lei Cui (44)

Xiaodong Liu (41)

Dan Bohus (40)

Xiaofei Wang (39)

Shuohang Wang (32)

Weizhu Chen (30)

Sudha Rao (28)

Li Dong (28)

Lijuan Wang (26)

Nan Yang (26)

Qianhui Wu (26)

Dongdong Zhang (25)

Dongmei Zhang (24)

Yang Liu (24)

Ivan Tashev (22)

Liang Wang (22)

Sujay Kumar Jauhar (20)

Eric Horvitz (19)

Shaohan Huang (19)

Yu Shi (18)

Yeyun Gong (17)

Hao Cheng (17)

Yuqing Yang (17)

Michael Xu (17)

Weijia Xu (17)

Hoifung Poon (16)

Michael Levit (16)

Hannes Schulz (16)

Ben Van Durme (16)

Jorge J. G. Leandro (16)

Ryen W. White (15)

Yao Qian (15)

Xingdi Yuan (15)

Tanuja Ganu (15)

Linjun Shou (寿林钧) (15)

Hsiao-Wuen Hon (14)

Nebojsa Jojic (14)

Shi Han (14)

Xing Xie (14)

Yan Huang (14)

Budhaditya Deb (14)

Tengchao Lv (14)

Millicent Ochieng (14)

Lars Liden (13)

Manik Varma (13)

Hanna Wallach (13)

Advait Sarkar (13)

Fangzhao Wu (12)

Xia Song (12)

Dongsheng Li (12)

Robert Sim (11)

Hamed Khanpour (11)

Xiubo Geng (11)

Yaobo Liang (10)

Shikhar Sharma (10)

Linjie Li (10)

Cha Zhang (9)

Jacki O'Neill (9)

Nick Craswell (9)

Bo-June (Paul) Hsu (9)

Qiang Huo (9)

Yi Mao (9)

Young Jin Kim (9)

Rangan Majumder (9)

Manthan Thakker (9)

Sam Thomson (9)

Amit Sharma (8)

Ahmed Tawfik (8)

Paul Smolensky (8)

Alessandro Sordoni (8)

Sheng Zhang (8)

Barun Patra (8)

Corby Rosset (8)

Harsh Jhamtani (8)

Adam Fourney (7)

Dinei Florencio (7)

Qingwei Lin 林庆维 (7)

Sean Rintel (7)

Guoxin Wang (7)

Tristan Naumann (7)

Robert Gmyr (7)

Danqing Huang (7)

Kevin Larson (7)

Xingxing Zhang (7)

Akiko I. Eriguchi (7)

Dasha Metropolitansky (7)

Maximiliana Behnke (7)

Scott Counts (6)

Ed Cutrell (6)

Hannes Gamper (6)

Marc-Alexandre Côté (6)

Swadheen Shukla (6)

Longqi Yang (6)

Sheng Zhao (6)

Zinan Lin (6)

Ece Kamar (5)

Jonathan Larson (5)

Henrique S. Malvar (5)

Pallavi Choudhury (5)

Sriram Rajamani (5)

Sumit Gulwani (5)

Swami Manohar (5)

Solon Barocas (5)

Adam Atkinson (5)

Mahmoud Adada (5)

Oscar Koller (5)

Mohit Jain (5)

Bahar Sarrafzadeh (5)

Kevin Lin (5)

Dongdong Chen (5)

Peidong Wang (5)

Xiaoyuan Yi (5)

Jennifer Neville (5)

Noel Codella (5)

Manish Gupta (4)

John Langford (4)

Navin Goyal (4)

Sumit Basu (4)

Jaime Teevan (4)

Marcin Junczys-Dowmunt (4)

Akshay Nambi (4)

Cliff Wong (4)

Mengting Wan (4)

Sunit Sivasankaran (4)

Mohamed Ahmed (4)

Sara Abdali (4)

Reshmi Ghosh (4)

Patrick Xia (4)

Baolin Peng (4)

Ambrosio Blanco (3)

Anton Schwaighofer (3)

Darren Edge (3)

Emre Kiciman (3)

Fan Yang (3)

Jennifer Wortman Vaughan (3)

Jianlong Fu (3)

Jack W. Stokes (3)

Katja Hofmann (3)

Kate Crawford (3)

Lei Ji (3)

Lidong Zhou (3)

Mark Encarnación (3)

Nirupama Chandrasekaran (3)

Silviu Cucerzan (3)

Vishal Chowdhary (3)

Ben Zorn (3)

Anja Thieme (3)

Paul Thomas (3)

Harsha Simhadri (3)

Sean Andrist (3)

Mihaela Vorvoreanu (3)

Qi Chen (3)

Haoyu Dong (3)

Dimitra Emmanouilidou (3)

Naoto Usuyama (3)

Kenichi Kumatani (3)

Zeqi Lin (3)

Jingwen Lu (3)

Amir Kantor (3)

Jack Williams (3)

Chad Atalla (3)

Andrea Tupini (3)

Huseyin Inan (3)

Najeeb G. Abdulhamid (3)

Victor Ruehle (3)

Saravan Rajmohan (3)

Jue Zhang (3)

Menglin Xia (3)

Xuchao Zhang (3)

Yuancheng Tu (3)

Lev Tankelevitch (3)

Chen Liang (3)

Pei Zhou (3)

Achraf Chalabi (2)

Amit Deshpande (2)

Ashley Feniello (2)

Jonathan M. Carlson (2)

Chetan Bansal (2)

Chris White (2)

Christopher Bishop (2)

Christophe Poulain (2)

David Johnston (2)

Doug Burger (2)

Bin Li (2)

Madan Musuvathi (2)

Matthai Philipose (2)

Michel Pahud (2)

Venkat Padmanabhan (2)

Peter Lee (2)

Richard Banks (2)

Rick Rogahn (2)

Shuo Chen (2)

Suresh Parthasarathy (2)

Yan Xia (2)

Yeye He (2)

Yue Dong (2)

Iris Shen (2)

Chinmay Singh (2)

Pat Sweeney (2)

Vibhav Vineet (2)

Bo Qiao (2)

Esha Ghosh (2)

Tobias Schnabel (2)

Denae Ford (2)

Pu Zhao (2)

Bei Liu (2)

P. Anandan (2)

Brent Hecht (2)

Vu Le (2)

Xenofon Foukas (2)

Juan M. Lavista Ferres (2)

Aaron L Halfaker (2)

Ida Momennejad (2)

Ashley J. Llorens (2)

Ran Jia (2)

Dean Carignan (2)

Yu Wang (2)

Sameer Segal (2)

Liang Du (2)

Eyal Kolman (2)

Robert Osazuwa Ness (2)

Alex Lu (2)

Serena Hillman (2)

Jiahang Xu (2)

Chung-Ching Lin (2)

Andres Codas (2)

Rujia Wang (2)

Shweti Mahajan (2)

Christian Poelitz (2)

Ade Famoti (2)

Kavyansh Chourasia (2)

Steven Truitt (2)

Ha Trinh (2)

Joshua Bradley (2)

Yupan Huang (2)

Flora Liu (2)

Guanghui Qin (2)

Ashish Sharma (2)

Philippe Laban (2)

Emily Sheng (2)

Jean Garcia-Gathright (2)

Gaurav Verma (2)

Vineeth N Balasubramanian (2)

Sheshera Mysore (2)

Debarati Das (2)

Payod Panda (2)

Pranjal A. Chitale (2)

Andrew Blake (1)

Andreas Bode (1)

Ajay Manchepalli (1)

A.J. Brush (1)

Akshay Krishnamurthy (1)

Alvin Chen (1)

Andrzej Pastusiak (1)

Ann Paradiso (1)

Anoop Gupta (1)

Abigail Sellen (1)

Aviv Hurvitz (1)

Andrew D. Wilson (1)

Victor Bahl (1)

Baining Guo (1)

Josh Benaloh (1)

Christian Borgs (1)

Bozidar Radunovic (1)

Christian Bird (1)

Cecily Morrison (1)

Arnd Christian König (1)

Chris Sienkiewicz (1)

Chong Luo (1)

Christian Paquin (1)

Dan Marshall (1)

David Sweeney (1)

Dong Chen (1)

Gopal Srinivasa (1)

Haidong Zhang (1)

David Heckerman (1)

Íñigo Goiri (1)

Jaron Lanier (1)

Jennifer Chayes (1)

Jonathan "Peli" de Halleux (1)

John Tang (1)

Rui Ding (1)

Kori Inkpen (1)

Laurent Bussard (1)

Lev Nachmanson (1)

Lily Sun (1)

Melissa Chase (1)

Michel Naim Gerguis (1)

Martin Grayson (1)

Neel Joshi (1)

Neeraj Kayal (1)

Nikunj Raghuvanshi (1)

Nikhil Swamy (1)

Peng Cheng (1)

Piali Choudhury (1)

Ravishankar Krishnaswamy (1)

Ramachandran Ramjee (1)

Ranveer Chandra (1)

Rick Rashid (1)

Ricardo Bianchini (1)

Santiago Zanella-Béguelin (1)

Sasa Junuzovic (1)

Shamsi Iqbal (1)

Shuvendu Lahiri (1)

Siân Lindley (1)

Siddhartha Sen (1)

Sarah Bird (1)

Srinath Setty (1)

Scott Saponas (1)

Suman Nath (1)

Surajit Chaudhuri (1)

Suresh Thummalapenta (1)

Tarleton Gillespie (1)

Xin Ma (1)

Yang Liu (1)

Yan Lu (1)

Sergey Yekhanin (1)

Yuan-Jyue Chen (1)

Zhitao Hou (1)

Shital Shah (1)

Bichlien Nguyen (1)

Ramakrishna Bairi (1)

Ankit Garg (1)

Li Zhao (1)

Arun Iyer (1)

Camilla Longden (1)

Darrin Eide (1)

Bryan Tower (1)

Qi Dai (1)

Jacob Alber (1)

Jinglu Wang (1)

Rahee Ghosh Peshawaria (1)

Nagarajan Natarajan (1)

Raluca Stevenson (1)

Sitaram Lanka (1)

Nipun Kwatra (1)

Sebastian Braun (1)

Sonu Mehta (1)

Yun Wang (1)

Xian Zhang (1)

Qianxi Zhang (1)

Xiaowu Hu (1)

Zhirong Wu (1)

Zhixiong Niu (1)

Dave Bignell (1)

Eduardo Salinas (1)

Stephanie Hyland (1)

Jianxun Lian (1)

Carmen Badea (1)

Lukas Wutschitz (1)

Radames Cruz Moreno (1)

Ran Gilad-Bachrach (1)

Nathan Myhrvold (1)

Bamdev Mishra (1)

Kieran McDonald (1)

Danny Simmons (1)

Shruthi Bannur (1)

Carolyn Buractaon (1)

Yu Kang (1)

Arjun Radhakrishna (1)

Yiwen Zhu (1)

Ammar Ahmad Awan (1)

Vishak Gopal (1)

Rohit Pillai (1)

Daniel Coelho de Castro (1)

James Weinstein (1)

Sangeetha Shekar (1)

Felipe Oviedo (1)

Anna Pavlenko (1)

Joyce Cahoon (1)

Brian Kroth (1)

Jidong Long (龙继东) (1)

Alec Berntson (1)

Kunho Kim (1)

Rui Wang (1)

Stojan Trajanovski (1)

Amanda K. Hall (1)

Samuel Chege Maina (1)

Xiyang Dai (1)

Esha Choukse (1)

Daniel Madrigal (1)

Mirian Hipolito Garcia (1)

Jason (Zengzhong) Li (1)

Ross Cutler (1)

Jesús Camacho-Rodríguez (1)

Sara Malvar (1)

Leonardo Nunes (1)

Robin Abraham (1)

Jake Smith (1)

Jayashree Mohan (1)

Daniel Jones (1)

Maximilian Ilse (1)

Tommy Guy (1)

Yashoteja Prabhu (1)

Arnaud Flutre (1)

A J (HE/HIM) (1)

Chenglong Wang (1)

Michal Sroka (1)

Alejandro Gutierrez Munoz (1)

Luna K. Qiu (1)

Allie Giddings (1)

Jeevana Priya Inala (1)

Yansen Wang (1)

Darren Tanner (1)

Harsha Nori (1)

Fernando Pérez-García (1)

Krishna Doss Mohan (1)

Harkirat Behl (1)

Xiaoyu Liu (1)

Harshita Sharma (1)

James Devine (1)

Caihua Shan (1)

Yuge Zhang (1)

Xinyang Jiang (1)

Xiao Liu (1)

Morris Sharp (1)

Bonnie Kruft (1)

Jing Yao (1)

Xi (Ada) Wang (1)

Chris Parnin (1)

Judith Amores (1)

Si Qin (1)

Tara Safavi (1)

Nan Chen (1)

Mukul Singh (1)

Chandan Singh (1)

Hosein Hasanbeig (1)

Bruno Silva (1)

Dan Vann (1)

Dongqi Han (1)

Yifei Shen (1)

Matheus Pereira (1)

Saksham Singhal (1)

Sergio Valcarcel Macua (1)

Wen-wai Yim (1)

Chaojie Zhang (1)

Ursula Hardy (1)

Sami Khairy (1)

Stephen Schneider (1)

Liqun Li (1)

Baotong Lu (1)

Newman Cheng (1)

Kenza Bouzid (1)

Andrzej Banburski-Fahey (1)

Seth Spielman (1)

Vidhisha Balachandran (1)

Matthew Vogel (1)

Darya Moldavskaya (1)

Minseon Kim (1)

Sihao Chen (1)

Agathe Balayn (1)

Lucas Caccia (1)

Nick Pangakis (1)

Jessica Young (1)

Vyshak Jain (1)

Ogbemi Ekwejunor-Etchie (1)

Hamna . (1)

Reuben Tan (1)

Lingjiao Chen (1)

Zhengyan Shi (1)

Alex Dow (1)

Cassiano Becker (1)

Katy Smith (1)

Anant Khandelwal (1)

Wenhui Wang (1)

Zhiliang Peng (1)

Yaoyao Chang (1)

Hao Chen (1)

Waqas Zamir (1)

Wassim Hamidouche (1)

Taketomo Isazawa (1)

Renyi Qu (1)

Hannah Cha (1)

Hannah Washington (1)

Agrima Seth (1)

Lorenzo Jaime Flores (1)

Published Date

Video

Advances in Natural Language Generation for Indian Languages

July 12, 2024 | Dr. Raj Dabre

Much of recent progress for natural language generation (NLG) has been in the context of English and, in general, high resource languages, however, Indian languages have yet to see similar paradigm shifts despite their speaking…

59:38

Project

MInference: Million-Tokens Prompt Inference for Long-context LLMs

Million-Tokens Prompt Inference for Long-context LLMs MInference 1.0 leverages the dynamic sparse nature of LLMs’ attention, which exhibits some static patterns, to speed up the pre-filling for long-context LLMs. It first determines offline which sparse pattern…

Publication

VisEval: A Benchmark for Data Visualization in the Era of Large Language Models

Nan Chen, Yuge Zhang, Jiahang Xu, Kan Ren, Yuqing Yang

IEEE Transactions on Visualization and Computer Graphics | July 2024, Vol PP

Best paper

VIS2024

Github

Publication

Can LLMs be Fooled? Investigating Vulnerabilities in LLMs

Sara Abdali, Jia He, CJ Barberan, Richard Anarfi

July 2024

Project

EmoCtrl-TTS

Controlling Time-Varying Emotional States of Flow-Matching-Based Zero-Shot Text-to-Speech EmoCtrl-TTS is an emotion-controllable zero-shot TTS that can generate highly emotional speech with non-verbal vocalizations such as laughter and crying for any speaker. EmoCtrl-TTS is purely a…

Microsoft Research Blog

Research Focus: Week of June 24, 2024

June 26, 2024 | Xenofon Foukas, Bozidar Radunovic, Francis Y. Yan, Lev Tankelevitch, Sean Rintel, Sudha Rao, Chris Brockett, Bill Dolan, Shruthi Bannur, Kenza Bouzid, Daniel Coelho de Castro, Anton Schwaighofer, Sam Bond-Taylor, Max Ilse, Fernando Pérez-García, Valentina Salvatelli, Harshita Sharma, Julia Gong, Anja Thieme, Matthew Lungren, Javier Alvarez-Valle, Stephanie Hyland, Payod Panda

In this issue: RENC makes 5G vRAN servers more energy efficient; CoExplorer uses AI to keep video meetings on track; Automatic bug detection in LLM-powered text-based games; MAIRA-2: Grounded radiology report generation.

Project

E2 TTS

Embarrassingly Easy Fully Non-Autoregressive Zero-Shot TTS E2 TTS (Embarrassingly Easy TTS) is a fully non-autoregressive zero-shot text-to-speech (TTS) system capable of generating the voice of any speaker. Despite its extremely simple model architecture and training…

Publication

From RAGs to rich parameters: Probing how language models utilize external knowledge over parametric information for factual queries

Hitesh Wadhwa, Rahul Seetharaman, Somyaa Aggarwal, Reshmi Ghosh, Samyadeep Basu, Soundararajan Srinivasan, Wenlong Zhao, Shreyas Chaudhari, Ehsan Aghazadeh, Reshmi Ghosh

ArXiv | June 2024, Vol abs/2406.12824

Video

Making Sentence Embeddings Robust to User-Generated Content

June 4, 2024 | Lydia Nishimwe

This seminar was hosted by Microsoft Research Africa, Nairobi together with the Microsoft AI for Good team in May 2024. User-generated content (UGC), e.g. social media posts written in “Internet language”, presents a lot of…

01:02:50

Video

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

June 4, 2024 | Daniela Massiceti

Daniela Massiceti delves into the transformative potential of multimodal models such as CLIP for assistive technologies. Specifically focusing on the blind/low-vision community, the talk explores the current distance from realizing this potential and the advancements…

06:41

Human language technologies

Highlights