illustration of a pie graph and column graph on top of a computer on a green gradient background

Data platforms and analytics

TaskWeaver: A code-first agent framework for efficient data analytics and domain adaptation

Garnet: an open-source, next-generation, faster cache-store for accelerating applications and services

GenAI for Industry - AI-generated image compilation of industrial blueprints from renewable energy to transporation and manufacturing

Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning

Enhanced autoscaling with VASIM: Vertical Autoscaling Simulator Toolkit

Current selections

Sort by: Most recent

Clear selections

Search within these results

Content Types

People

Surajit Chaudhuri (120)

Qingwei Lin 林庆维 (88)

Dongmei Zhang (85)

Nathalie Henry Riche (68)

Badrish Chandramouli (67)

Wentao Wu (66)

Vivek Narasayya (65)

Yeye He (55)

Phil Bernstein (42)

Sumit Gulwani (35)

Carlo Curino (34)

Shi Han (34)

Xing Xie (34)

Jim Gray (31)

Avrilia Floratou (31)

Johannes Gehrke (30)

Yinan Li (30)

Rathijit Sen (30)

Nicolas Bruno (28)

Yiwen Zhu (24)

Arnd Christian König (23)

Bo Qiao (23)

Yu Kang (23)

Subru Krishnan (22)

Weiwei Cui (22)

Matteo Interlandi (22)

Saravan Rajmohan (22)

Darren Edge (21)

Wei Chen (20)

Pu Zhao (19)

Haoyu Dong (18)

Si Qin (18)

Chris White (17)

Jonathan Larson (16)

Suman Nath (16)

Brian Kroth (16)

Jesús Camacho-Rodríguez (16)

Raghav Kaushik (15)

Scott Counts (14)

Karthik Ramachandra (14)

Juan M. Lavista Ferres (14)

Venkatesh Emani (14)

Mukul Singh (14)

Emre Kiciman (13)

Manoj Syamala (13)

Vu Le (13)

Haidong Zhang (12)

Eric Horvitz (12)

Kate Crawford (12)

Leslie Lamport (12)

Markus Weimer (12)

Minghua Ma (12)

Chin-Yew Lin (11)

Manish Gupta (11)

Ishai Menache (11)

Anshuman Dutt (11)

Baining Guo (10)

Jake Hofman (10)

Rui Ding (10)

Kaushik Rajan (10)

Thomas Moscibroda (10)

Aleksander Fabijan (10)

Anna Pavlenko (10)

Joyce Cahoon (10)

Gust Verbruggen (10)

Ganesh Ananthanarayanan (9)

Nathan Evans (9)

Yun Wang (9)

Ashvin Agrawal (9)

Fotis Psallidas (9)

Jonathan M. Carlson (8)

Kim Herzig (8)

Hang Dong (8)

Brandon Haynes (8)

Will Guyman (8)

Smitha Saligrama (8)

Cameron Runde (8)

Dave Brown (7)

Greg Smith (7)

David Heckerman (7)

John (JD) Douceur (7)

John Snyder (7)

Manik Varma (7)

Peter Lee (7)

Ranveer Chandra (7)

Sebastian Burckhardt (7)

Jaime Teevan (7)

Amgad Madkour (7)

Madeleine Daepp (7)

Raghu Ramakrishnan (7)

Anja Gruenheid (7)

Yuanyuan Tian (7)

Nancy Baym (6)

Ed Cutrell (6)

Darren Gehring (6)

Kukjin Lee (6)

Lidong Zhou (6)

Nick Craswell (6)

Ben Zorn (6)

Lukas M. Maas (6)

Brent Hecht (6)

Weiwei Yang (6)

Abigail Sellen (5)

Dan Marshall (5)

Daniel G. Goldstein (5)

Dave Maltz (5)

Dushyanth Narayanan (5)

Jacki O'Neill (5)

Kenji Takeda (5)

Kori Inkpen (5)

Karin Strauss (5)

Michel Pahud (5)

Song Ge (5)

Sergey Yekhanin (5)

Iris Shen (5)

Aseem Rastogi (5)

Yi Shan (5)

Longqi Yang (5)

Vasileios Zois (5)

Carolyn Buractaon (5)

Bahar Sarrafzadeh (5)

Anthony Cintron Roman (5)

Shaleen Deep (5)

Liqun Li (5)

Akash Lal (4)

Chetan Bansal (4)

Furu Wei (4)

Hsiao-Wuen Hon (4)

Jennifer Wortman Vaughan (4)

Mary L. Gray (4)

Peter Bodík (4)

Ryen W. White (4)

Sameh Elnikety (4)

Shamsi Iqbal (4)

Siân Lindley (4)

Hanna Wallach (4)

Yongguang Zhang (4)

Bichlien Nguyen (4)

Fangzhao Wu (4)

Darrin Eide (4)

Javier Hernandez (4)

Ashish Tiwari (4)

Jenna Butler (4)

Jack Williams (4)

Sara Malvar (4)

Jennifer Neville (4)

Fangkai Yang (4)

Alvin Chen (3)

Alec Wolman (3)

Amit Sharma (3)

Andrew Putnam (3)

Victor Bahl (3)

Butler Lampson (3)

Christian Bird (3)

Daan Leijen (3)

David Rothschild (3)

Gordon Bell (3)

Gaoxiang Xu (3)

Janardhan (Jana) Kulkarni (3)

John Langford (3)

Nicole Immorlica (3)

Nikhil Swamy (3)

Paul Mineiro (3)

Rick Rogahn (3)

Sean Rintel (3)

Stefan Saroiu (3)

Sumit Basu (3)

Siddharth Suri (3)

Vassily Lyutsarev (3)

Ramarathnam Venkatesan (3)

Zhitao Hou (3)

Tahina Ramananandro (3)

Chinmay Singh (3)

Mihaela Vorvoreanu (3)

Rahee Ghosh Peshawaria (3)

Advait Sarkar (3)

Hannes Schulz (3)

Sunayana Sitaram (3)

Luke Marshall (3)

Sonia Jaffe (3)

Konstantina Mellou (3)

Benjamin Arai (3)

Arjun Radhakrishna (3)

Mengting Wan (3)

Ashley J. Llorens (3)

Ran Jia (3)

Leonardo Nunes (3)

Harish Doraiswamy (3)

Serena Hillman (3)

Yashoteja Prabhu (3)

Jue Zhang (3)

Bruno Silva (3)

Rujia Wang (3)

Sampath Rajendra (3)

Lev Tankelevitch (3)

Andrew D. Wilson (2)

Josh Benaloh (2)

Bin Benjamin Zhu (2)

Bozidar Radunovic (2)

Chuck Needham (2)

Christopher Bishop (2)

Dany Rouhana (2)

Dan Bohus (2)

Doug Burger (2)

Hannes Gamper (2)

Jacek Czerwonka (2)

Jennifer Chayes (2)

Jonathan "Peli" de Halleux (2)

Jinyu Li (2)

John Tang (2)

Jack W. Stokes (2)

Kalika Bali (2)

Jay Lorch (2)

Matthai Philipose (2)

Qiufeng Yin (2)

Roy Levin (2)

Sanjeev Mehrotra (2)

Shobana Balakrishnan (2)

Shuvendu Lahiri (2)

Srinath Setty (2)

Sriram Rajamani (2)

Scott Saponas (2)

Tony Hoare (2)

Thomas Karagiannis (2)

Yuan-Jyue Chen (2)

Swami Manohar (2)

Shital Shah (2)

Solon Barocas (2)

Harsha Simhadri (2)

Lester Mackey (2)

Bryan Tower (2)

Rafah Hosn (2)

Irene Zhang (2)

Esha Ghosh (2)

Tobias Schnabel (2)

Tal Zaccai (2)

Kate Lytvynets (2)

Vaishnavi Ranganathan (2)

Akshay Nambi (2)

Jakub Tarnawski (2)

Daniel S. Berger (2)

Adam D. Troy (2)

Gustavo Soares (2)

Hao Ai (2)

Garnet Vaz (2)

Liudmila Ulanova (2)

Weiqing Liu (2)

Caleb Robinson (2)

Aaron L Halfaker (2)

Neha Parikh Shah (2)

Philipp Witte (2)

Millicent Ochieng (2)

Roberto Santos (2)

Sebastian Kohlmeier (2)

April Kwong (2)

Chang Xu (2)

Yangyu Huang (2)

James Devine (2)

Kate Nowak (2)

Allen Kim (2)

Chris Parnin (2)

Xuchao Zhang (2)

Dayenne Souza (2)

Advitya Gemawat (2)

Stephen Schneider (2)

Haotian Li (2)

Kiran Tomlinson (2)

Rebecca Janssen (2)

Gaurav Verma (2)

Junjie Xing (2)

Xiaoying Wang (2)

Achraf Chalabi (1)

Adam Fourney (1)

A.J. Brush (1)

Austin Donnelly (1)

Bodhi Priyantha (1)

Brendan Lucier (1)

Chong Luo (1)

Cormac Herley (1)

Fan Yang (1)

Nicolo Fusi (1)

E. Glen Weyl (1)

G. Ramalingam (1)

Hitesh Ballani (1)

Íñigo Goiri (1)

Ivan Tashev (1)

Jianfeng Gao (1)

Jianlong Fu (1)

Jonathan Lester (1)

Katja Hofmann (1)

Karen Easterbrook (1)

Kevin Kane (1)

Ken Woodberry (1)

Laurent Bussard (1)

Lei Cui (1)

Lei Ji (1)

Lenin Ravindranath Sivalingam (1)

Lev Nachmanson (1)

Bin Li (1)

Lijuan Wang (1)

Madan Musuvathi (1)

Manuel Costa (1)

Margus Veanes (1)

Michel Galley (1)

Michel Naim Gerguis (1)

Markus Mobius (1)

Nikolaj Bjørner (1)

Neel Joshi (1)

Neeraj Kayal (1)

Nirupama Chandrasekaran (1)

Olivier Nano (1)

Bo-June (Paul) Hsu (1)

Peng Cheng (1)

Qiang Huo (1)

Ravishankar Krishnaswamy (1)

Ray Huang (1)

Ran Gal (1)

Ricardo Bianchini (1)

Rich Draves (1)

Siddhartha Sen (1)

Rick Szeliski (1)

Todd Massengill (1)

Xiaodong Liu (1)

Xin Ma (1)

Xiulian Peng (1)

Daniel Firestone (1)

Paul Thomas (1)

Ankit Garg (1)

Arun Iyer (1)

Hongzhi Li (1)

Sean Andrist (1)

Yi Mao (1)

Qi Dai (1)

Qi Chen (1)

Benn Thomsen (1)

Xiao Lv (1)

Dan R. K. Ports (1)

Sitaram Lanka (1)

Christopher Gooley (1)

Scarlett Li (1)

Qianxi Zhang (1)

Martez Mott (1)

Jianxun Lian (1)

Pulkit Misra (1)

Junyi Liu (1)

Li Dong (1)

David Alvarez-Melis (1)

Wei Cui (1)

Bei Liu (1)

Rangan Majumder (1)

Kai Qiu (1)

Shruti Tople (1)

Carl Mitchell (1)

Xiubo Geng (1)

Jen Townsend (1)

Julie Stevenson (1)

Danny Simmons (1)

Sasha Patotski (1)

Yeyun Gong (1)

Prashanth Srikanthan (1)

Widad Machmouchi (1)

Vaibhav Kumar Bajpai (1)

Xenofon Foukas (1)

Bill Weeks (1)

Vishak Gopal (1)

Yoganand Rajasekaran (1)

Shaohan Huang (1)

Jordan Ash (1)

James Weinstein (1)

Ankita Agrawal (1)

Tracy Brodeur (1)

Shelley Koch (1)

Jingwen Lu (1)

Dean Carignan (1)

Camille Couturier (1)

Amanda K. Hall (1)

Samuel Chege Maina (1)

Gabriela Martinez Sanchez (1)

Jason (Zengzhong) Li (1)

James Brand (1)

Tengchao Lv (1)

Renato L. de F. Cunha (1)

Ross Cutler (1)

Patricia Kovaleski (1)

Michael Hansen (1)

Hugo Barbalho (1)

Swati Sharma (1)

Xiaoyuan Yi (1)

Roberto Estevão (1)

Mohamed Ahmed (1)

Jake Smith (1)

Najeeb G. Abdulhamid (1)

Nan Ma (1)

Michael Taylor (1)

Heng-Yi Liu (1)

Priyanka Paul (1)

Robert Osazuwa Ness (1)

Victor Ruehle (1)

Monwhea Jeng (1)

Alex Lu (1)

Ashkan Aazami (1)

Jing Jin (1)

David Hall (1)

Tommy Guy (1)

Arnaud Flutre (1)

A J (HE/HIM) (1)

Michal Sroka (1)

Amy Luers (1)

Kali Frost (1)

ANA HERNANDEZ (1)

Alejandro Gutierrez Munoz (1)

Allie Giddings (1)

Rahul Dodhia (1)

Xingxing Zhang (1)

Jiahang Xu (1)

Srikant Bharadwaj (1)

Yuge Zhang (1)

Tammy Glazer (1)

Changho Hwang (1)

Morris Sharp (1)

Jaspreet Bagga (1)

Bonnie Kruft (1)

Jing Yao (1)

Xi (Ada) Wang (1)

Corby Rosset (1)

Judith Amores (1)

Tara Safavi (1)

Nan Chen (1)

Nicholas Jing Yuan (1)

Marco Molinaro (1)

Yasharth Bajpai (1)

Santiago Salcido (1)

Rafael Padilha (1)

Riyaz Pishori (1)

Dan Vann (1)

Alonso Guevara Fernández (1)

Jonathan Mace (1)

Christian Poelitz (1)

Nicolai Marquardt (1)

Girmaw Abebe Tadesse (1)

Lucia Ronchi Darre (1)

Ashley Conard (1)

Pashmina Cameron (1)

Siddarth Asokan (1)

Renee St. Amant (1)

Brian Houck (1)

Maria Angels de Luis Balaguer (1)

Ha Trinh (1)

Joshua Bradley (1)

Seth Spielman (1)

Arman Salimi (1)

Yupan Huang (1)

Gagan Somashekar (1)

Jennifer Marsman (1)

Ananya Singha (1)

Pei Zhou (1)

Ashish Sharma (1)

Matthew Perron (1)

Sihao Chen (1)

Philippe Laban (1)

Cindy Chiu (1)

Emerson Murphy-Hill (1)

Lingjiao Chen (1)

Bruce Wittmann (1)

Renyi Qu (1)

Lin Ai (1)

Sheshera Mysore (1)

Debarati Das (1)

Avik Dutta (1)

Jihoon Tack (1)

Maia Stiber (1)

Lorenzo Jaime Flores (1)

Published Date

Publication

LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Sparse Retrieval

Ziyang Luo, Pu Zhao, Can Xu, Xiubo Geng, Tao Shen, Chongyang Tao, Jing Ma, Qingwei Lin 林庆维, Daxin Jiang

ICCV’23 | December 2023

Publication

Open Datasheets: Machine-readable Documentation for Open Datasets and Responsible AI Assessments

Anthony Cintron Roman, Jennifer Wortman Vaughan, Valerie See, Steph Ballard, Nicolas Schifano, Jehú Torres, Caleb Robinson, Juan M. Lavista Ferres

December 2023

Github Project

Publication

STEAM: Observability-Preserving Trace Sampling

Shilin He, Botao Feng, Liqun Li, Xu Zhang, Yu Kang, Qingwei Lin 林庆维, S. Rajmohan, Dongmei Zhang

FSE’23 Industry | November 2023

Publication

Diffusion-Based Time Series Data Imputation for Cloud Failure Prediction at Microsoft 365

Fangkai Yang, Wenjie Yin, Lu Wang, Tianci Li, Pu Zhao, Bo Liu, Paul Wang, Bo Qiao, Yudong Liu, Mårten Björkman, S. Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang

FSE’23 Industry | November 2023

Video

Large Scale Intelligent Microservices – IEEE Big Data 2020 Paper Presentation

November 16, 2023

Deploying Machine Learning (ML) algorithms within databases is a challenge due to the varied computational footprints of modern ML algorithms and the myriad of database technologies each with their own restrictive syntax. We introduce an…

17:32

Publication

Learning Arithmetic Formulas in the Presence of Noise: A General Framework and Applications to Unsupervised Learning

Pritam Chandra, Ankit Garg, Neeraj Kayal, Kunal Mittal, Tanmay Sinha

Electronic Colloquium on Computational Complexity, 2023 | November 2023

Video

Demonstration of CORNET: Learning Spreadsheet Formatting Rules by Example

November 10, 2023 | Mukul Singh

Abstract: Data management and analysis tasks are often carried out using spreadsheet software. A popular feature in most spreadsheet platforms is the ability to define data-dependent formatting rules. These rules can express actions such as…

06:18

Project

Query Acceleration for Data Lakes

Accelerating query processing on open data formats As businesses become more data-driven, there is an increasing interest in adopting data lakes (e.g., Microsoft Fabric) in large enterprises. A data lake is a large storage repository…

Project

Self-service Data Preparation

It is often cited that data scientists spend a significant portion of their time (up to 80%), cleaning and preparing data. For less-technical users, who may be less proficient in writing code (e.g., in Excel,…

Project

FRA: Flexible Resource Allocation in Multi-Tenant Relational Database-as-a-Service

Oversubscription is an essential cost management strategy in multi-tenant, cloud Database-as-a-Service (DBaaS), and its importance is magnified by the emergence of serverless databases. In the FRA project, we have developed novel resource management techniques that…

Data platforms and analytics

Highlights