Human language technologies

Researching software and systems that bridge the linguistic divide between people and machines to make communicating with computers as natural as speaking with family and friends.

Lydia Nishimwe's MSR Africa, Nairobi seminar

Making Sentence Embeddings Robust to User-Generated Content | Video

Microsoft Research Forum | Episode 3 | Daniela Massiceti

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

Project GraphRAG | LLM-Derived Knowledge Graphs

Microsoft Research Forum | Episode 3 | panel discussion

PARIKSHA: A Scalable, Democratic, Transparent Evaluation Platform for Assessing Indic Large Language Models

Current selections

Sort by: Most recent

Clear selections

Search within these results

Content Types

People

Jianfeng Gao (195)

Jinyu Li (181)

Furu Wei (108)

Chin-Yew Lin (104)

Yifan Gong (92)

Kalika Bali (71)

Michel Galley (70)

Sunayana Sitaram (56)

Sarangarajan Parthasarathy (50)

Shujie Liu (50)

Chris Quirk (44)

Lei Cui (44)

Xiaodong Liu (41)

Dan Bohus (40)

Xiaofei Wang (39)

Shuohang Wang (32)

Weizhu Chen (30)

Sudha Rao (28)

Li Dong (28)

Lijuan Wang (26)

Nan Yang (26)

Qianhui Wu (26)

Dongdong Zhang (25)

Dongmei Zhang (24)

Yang Liu (24)

Ivan Tashev (22)

Liang Wang (22)

Sujay Kumar Jauhar (20)

Eric Horvitz (19)

Shaohan Huang (19)

Yu Shi (18)

Yeyun Gong (17)

Hao Cheng (17)

Yuqing Yang (17)

Michael Xu (17)

Weijia Xu (17)

Hoifung Poon (16)

Michael Levit (16)

Hannes Schulz (16)

Ben Van Durme (16)

Jorge J. G. Leandro (16)

Ryen W. White (15)

Yao Qian (15)

Xingdi Yuan (15)

Tanuja Ganu (15)

Linjun Shou (寿林钧) (15)

Hsiao-Wuen Hon (14)

Nebojsa Jojic (14)

Shi Han (14)

Xing Xie (14)

Yan Huang (14)

Budhaditya Deb (14)

Tengchao Lv (14)

Millicent Ochieng (14)

Lars Liden (13)

Manik Varma (13)

Hanna Wallach (13)

Advait Sarkar (13)

Fangzhao Wu (12)

Xia Song (12)

Dongsheng Li (12)

Robert Sim (11)

Hamed Khanpour (11)

Xiubo Geng (11)

Yaobo Liang (10)

Shikhar Sharma (10)

Linjie Li (10)

Cha Zhang (9)

Jacki O'Neill (9)

Nick Craswell (9)

Bo-June (Paul) Hsu (9)

Qiang Huo (9)

Yi Mao (9)

Young Jin Kim (9)

Rangan Majumder (9)

Manthan Thakker (9)

Sam Thomson (9)

Amit Sharma (8)

Ahmed Tawfik (8)

Paul Smolensky (8)

Alessandro Sordoni (8)

Sheng Zhang (8)

Barun Patra (8)

Corby Rosset (8)

Harsh Jhamtani (8)

Adam Fourney (7)

Dinei Florencio (7)

Qingwei Lin 林庆维 (7)

Sean Rintel (7)

Guoxin Wang (7)

Tristan Naumann (7)

Robert Gmyr (7)

Danqing Huang (7)

Kevin Larson (7)

Xingxing Zhang (7)

Akiko I. Eriguchi (7)

Dasha Metropolitansky (7)

Maximiliana Behnke (7)

Scott Counts (6)

Ed Cutrell (6)

Hannes Gamper (6)

Marc-Alexandre Côté (6)

Swadheen Shukla (6)

Longqi Yang (6)

Sheng Zhao (6)

Zinan Lin (6)

Ece Kamar (5)

Jonathan Larson (5)

Henrique S. Malvar (5)

Pallavi Choudhury (5)

Sriram Rajamani (5)

Sumit Gulwani (5)

Swami Manohar (5)

Solon Barocas (5)

Adam Atkinson (5)

Mahmoud Adada (5)

Oscar Koller (5)

Mohit Jain (5)

Bahar Sarrafzadeh (5)

Kevin Lin (5)

Dongdong Chen (5)

Peidong Wang (5)

Xiaoyuan Yi (5)

Jennifer Neville (5)

Noel Codella (5)

Manish Gupta (4)

John Langford (4)

Navin Goyal (4)

Sumit Basu (4)

Jaime Teevan (4)

Marcin Junczys-Dowmunt (4)

Akshay Nambi (4)

Cliff Wong (4)

Mengting Wan (4)

Sunit Sivasankaran (4)

Mohamed Ahmed (4)

Sara Abdali (4)

Reshmi Ghosh (4)

Patrick Xia (4)

Baolin Peng (4)

Ambrosio Blanco (3)

Anton Schwaighofer (3)

Darren Edge (3)

Emre Kiciman (3)

Fan Yang (3)

Jennifer Wortman Vaughan (3)

Jianlong Fu (3)

Jack W. Stokes (3)

Katja Hofmann (3)

Kate Crawford (3)

Lei Ji (3)

Lidong Zhou (3)

Mark Encarnación (3)

Nirupama Chandrasekaran (3)

Silviu Cucerzan (3)

Vishal Chowdhary (3)

Ben Zorn (3)

Anja Thieme (3)

Paul Thomas (3)

Harsha Simhadri (3)

Sean Andrist (3)

Mihaela Vorvoreanu (3)

Qi Chen (3)

Haoyu Dong (3)

Dimitra Emmanouilidou (3)

Naoto Usuyama (3)

Kenichi Kumatani (3)

Zeqi Lin (3)

Rui Wang (3)

Jingwen Lu (3)

Amir Kantor (3)

Jack Williams (3)

Chad Atalla (3)

Andrea Tupini (3)

Huseyin Inan (3)

Najeeb G. Abdulhamid (3)

Victor Ruehle (3)

Saravan Rajmohan (3)

Jue Zhang (3)

Menglin Xia (3)

Xuchao Zhang (3)

Yuancheng Tu (3)

Lev Tankelevitch (3)

Chen Liang (3)

Pei Zhou (3)

Achraf Chalabi (2)

Amit Deshpande (2)

Ashley Feniello (2)

Jonathan M. Carlson (2)

Chetan Bansal (2)

Chris White (2)

Christopher Bishop (2)

Christophe Poulain (2)

David Johnston (2)

Doug Burger (2)

Bin Li (2)

Madan Musuvathi (2)

Matthai Philipose (2)

Michel Pahud (2)

Venkat Padmanabhan (2)

Peter Lee (2)

Richard Banks (2)

Rick Rogahn (2)

Shuo Chen (2)

Suresh Parthasarathy (2)

Yan Xia (2)

Yeye He (2)

Yue Dong (2)

Iris Shen (2)

Chinmay Singh (2)

Pat Sweeney (2)

Vibhav Vineet (2)

Bo Qiao (2)

Esha Ghosh (2)

Tobias Schnabel (2)

Pu Zhao (2)

Bei Liu (2)

P. Anandan (2)

Brent Hecht (2)

Vu Le (2)

Xenofon Foukas (2)

Juan M. Lavista Ferres (2)

Aaron L Halfaker (2)

Ida Momennejad (2)

Ashley J. Llorens (2)

Ran Jia (2)

Dean Carignan (2)

Yu Wang (2)

Liang Du (2)

Eyal Kolman (2)

Robert Osazuwa Ness (2)

Alex Lu (2)

Serena Hillman (2)

Jiahang Xu (2)

Chung-Ching Lin (2)

Andres Codas (2)

Rujia Wang (2)

Shweti Mahajan (2)

Christian Poelitz (2)

Ade Famoti (2)

Kavyansh Chourasia (2)

Steven Truitt (2)

Ha Trinh (2)

Joshua Bradley (2)

Yupan Huang (2)

Flora Liu (2)

Guanghui Qin (2)

Ashish Sharma (2)

Philippe Laban (2)

Emily Sheng (2)

Jean Garcia-Gathright (2)

Gaurav Verma (2)

Vineeth N Balasubramanian (2)

Sheshera Mysore (2)

Debarati Das (2)

Payod Panda (2)

Pranjal A. Chitale (2)

Andrew Blake (1)

Andreas Bode (1)

Ajay Manchepalli (1)

A.J. Brush (1)

Akshay Krishnamurthy (1)

Alvin Chen (1)

Andrzej Pastusiak (1)

Anne Loomis Thompson (1)

Ann Paradiso (1)

Anoop Gupta (1)

Abigail Sellen (1)

Aviv Hurvitz (1)

Andrew D. Wilson (1)

Victor Bahl (1)

Baining Guo (1)

Josh Benaloh (1)

Christian Borgs (1)

Bozidar Radunovic (1)

Christian Bird (1)

Cecily Morrison (1)

Arnd Christian König (1)

Chris Sienkiewicz (1)

Chong Luo (1)

Christian Paquin (1)

David Sweeney (1)

Dong Chen (1)

Gopal Srinivasa (1)

Haidong Zhang (1)

David Heckerman (1)

Íñigo Goiri (1)

Jaron Lanier (1)

Jennifer Chayes (1)

Jonathan "Peli" de Halleux (1)

John Tang (1)

Rui Ding (1)

Kori Inkpen (1)

Laurent Bussard (1)

Lev Nachmanson (1)

Lily Sun (1)

Melissa Chase (1)

Michel Naim Gerguis (1)

Martin Grayson (1)

Neel Joshi (1)

Neeraj Kayal (1)

Nikunj Raghuvanshi (1)

Nikhil Swamy (1)

Peng Cheng (1)

Piali Choudhury (1)

Ravishankar Krishnaswamy (1)

Ramachandran Ramjee (1)

Ranveer Chandra (1)

Rick Rashid (1)

Ricardo Bianchini (1)

Santiago Zanella-Béguelin (1)

Sasa Junuzovic (1)

Shamsi Iqbal (1)

Shuvendu Lahiri (1)

Siân Lindley (1)

Siddhartha Sen (1)

Sarah Bird (1)

Srinath Setty (1)

Scott Saponas (1)

Suman Nath (1)

Surajit Chaudhuri (1)

Suresh Thummalapenta (1)

Tarleton Gillespie (1)

Xin Ma (1)

Yang Liu (1)

Yan Lu (1)

Sergey Yekhanin (1)

Yuan-Jyue Chen (1)

Zhitao Hou (1)

Shital Shah (1)

Bichlien Nguyen (1)

Ramakrishna Bairi (1)

Ankit Garg (1)

Li Zhao (1)

Arun Iyer (1)

Camilla Longden (1)

Darrin Eide (1)

Bryan Tower (1)

Qi Dai (1)

Jacob Alber (1)

Jinglu Wang (1)

Rahee Ghosh Peshawaria (1)

Nagarajan Natarajan (1)

Raluca Stevenson (1)

Sitaram Lanka (1)

Nipun Kwatra (1)

Sebastian Braun (1)

Sonu Mehta (1)

Yun Wang (1)

Xian Zhang (1)

Qianxi Zhang (1)

Xiaowu Hu (1)

Zhirong Wu (1)

Zhixiong Niu (1)

Dave Bignell (1)

Eduardo Salinas (1)

Stephanie Hyland (1)

Jianxun Lian (1)

Carmen Badea (1)

Denae Ford (1)

Lukas Wutschitz (1)

Radames Cruz Moreno (1)

Ran Gilad-Bachrach (1)

Nathan Myhrvold (1)

Bamdev Mishra (1)

Kieran McDonald (1)

Danny Simmons (1)

Shruthi Bannur (1)

Carolyn Buractaon (1)

Yu Kang (1)

Arjun Radhakrishna (1)

Yiwen Zhu (1)

Ammar Ahmad Awan (1)

Vishak Gopal (1)

Rohit Pillai (1)

Daniel Coelho de Castro (1)

James Weinstein (1)

Sangeetha Shekar (1)

Felipe Oviedo (1)

Anna Pavlenko (1)

Joyce Cahoon (1)

Brian Kroth (1)

Jidong Long (龙继东) (1)

Alec Berntson (1)

Kunho Kim (1)

Rui Wang (1)

Stojan Trajanovski (1)

Amanda K. Hall (1)

Samuel Chege Maina (1)

Xiyang Dai (1)

Esha Choukse (1)

Daniel Madrigal (1)

Mirian Hipolito Garcia (1)

Jason (Zengzhong) Li (1)

Ross Cutler (1)

Jesús Camacho-Rodríguez (1)

Sara Malvar (1)

Leonardo Nunes (1)

Robin Abraham (1)

Sameer Segal (1)

Jake Smith (1)

Jayashree Mohan (1)

Daniel Jones (1)

Maximilian Ilse (1)

Tommy Guy (1)

Yashoteja Prabhu (1)

Arnaud Flutre (1)

A J (HE/HIM) (1)

Chenglong Wang (1)

Michal Sroka (1)

Alejandro Gutierrez Munoz (1)

Luna K. Qiu (1)

Allie Giddings (1)

Jeevana Priya Inala (1)

Yansen Wang (1)

Darren Tanner (1)

Harsha Nori (1)

Fernando Pérez-García (1)

Krishna Doss Mohan (1)

Harkirat Behl (1)

Xiaoyu Liu (1)

Harshita Sharma (1)

James Devine (1)

Caihua Shan (1)

Yuge Zhang (1)

Xinyang Jiang (1)

Xiao Liu (1)

Morris Sharp (1)

Bonnie Kruft (1)

Jing Yao (1)

Xi (Ada) Wang (1)

Chris Parnin (1)

Judith Amores (1)

Si Qin (1)

Tara Safavi (1)

Nan Chen (1)

Mukul Singh (1)

Chandan Singh (1)

Hosein Hasanbeig (1)

Bruno Silva (1)

Dan Vann (1)

Dongqi Han (1)

Yifei Shen (1)

Matheus Pereira (1)

Saksham Singhal (1)

Sergio Valcarcel Macua (1)

Wen-wai Yim (1)

Chaojie Zhang (1)

Ursula Hardy (1)

Sami Khairy (1)

Stephen Schneider (1)

Liqun Li (1)

Baotong Lu (1)

Newman Cheng (1)

Kenza Bouzid (1)

Andrzej Banburski-Fahey (1)

Seth Spielman (1)

Vidhisha Balachandran (1)

Matthew Vogel (1)

Darya Moldavskaya (1)

Minseon Kim (1)

Sihao Chen (1)

Agathe Balayn (1)

Lucas Caccia (1)

Nick Pangakis (1)

Jessica Young (1)

Ogbemi Ekwejunor-Etchie (1)

Reuben Tan (1)

Lingjiao Chen (1)

Zhengyan Shi (1)

Alex Dow (1)

Cassiano Becker (1)

Anant Khandelwal (1)

Wenhui Wang (1)

Zhiliang Peng (1)

Yaoyao Chang (1)

Jianwei Yu (1)

Hao Chen (1)

Waqas Zamir (1)

Wassim Hamidouche (1)

Taketomo Isazawa (1)

Renyi Qu (1)

Hannah Cha (1)

Hannah Washington (1)

Lorenzo Jaime Flores (1)

Published Date

Publication

On decoder-only architecture for speech-to-text and large language model integration

Jian Wu, Yashesh Gaur, Zhuo Chen, Long Zhou, Yimeng Zhu, Tianrui Wang, Jinyu Li, Shujie Liu, Bo Ren, Linquan Liu, Yu Wu

Workshop of Automatic Speech Recognition and Understanding | December 2023

Publication

A Weakly-Supervised Streaming Multilingual Speech Model with Truly Zero-Shot Capability

Jian Xue, Peidong Wang, Jinyu Li, Eric Sun

Workshop of Automatic Speech Recognition and Understanding | December 2023

Publication

Large Search Model: Redefining Search Stack in the Era of LLMs

Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei

SIGIR Forum | December 2023, Vol 57(2)

Publication

Large-Scale Streaming End-to-End Speech Translation

Jinyu Li

December 2023

Invited Talk at NTU and SJTU

Publication

Building High-accuracy Multilingual ASR with Gated Language Experts and Curriculum Training

Eric Sun, Jinyu Li, Yuxuan Hu, Yimeng Zhu, Long Zhou, Jian Xue, Peidong Wang, Linquan Liu, Shujie Liu, Edward Lin, Yifan Gong

December 2023

Publication

Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments

Sara Papi, Peidong Wang, Junkun Chen, Jian Xue, Jinyu Li, Yashesh Gaur

Workshop of Automatic Speech Recognition and Understanding | December 2023

Microsoft Research Blog

Orca 2: Teaching Small Language Models How to Reason

November 20, 2023 | Ahmed Awadallah, Andres Codas, Luciano Del Corro, Hamed Khanpour, Shweti Mahajan, Arindam Mitra, Hamid Palangi, Corby Rosset, Clarisse Simoes Ribeiro, Guoqing Zheng

At Microsoft, we’re expanding AI capabilities by training small language models to achieve the kind of enhanced reasoning and comprehension typically found only in much larger models.

Orca-2 blog hero | abstract waves of data

Publication

Orca-2: Teaching Small Language Models How to Reason

Arindam Mitra, Luciano Del Corro, Shweti Mahajan, Andres Codas, Clarisse Simoes Ribeiro, Sahaj Agrawal, Xuxi Chen, Anastasia Razdaibiedina, Erik Jones, Kriti Aggarwal, Hamid Palangi, Guoqing Zheng, Corby Rosset, Hamed Khanpour, Ahmed Awadallah

November 2023

Video Access Access Project

Microsoft Research Blog

Skeleton-of-Thought: Parallel decoding speeds up and improves LLM output

November 17, 2023 | Xuefei Ning, Zinan Lin

This research was accepted by the 2024 International Conference on Learning Representations. Large language models (LLMs) such as LLaMA and OpenAI’s GPT-4 are revolutionizing technology. However, one of the common complaints about LLMs is their…

Skeleton of Thought blog hero - flow diagram

Publication

Exploring how politeness impacts the user experience of chatbots for mental health support

Robert Bowman, Orla Cooney, Joseph W. Newbold, Anja Thieme, Leigh Clark, Gavin Doherty, Benjamin Cowan

International Journal of Human-Computer Studies (IJHCS) | November 2023

Human language technologies

Highlights