ICML 2019论文列表 - Proceedings of the 36th International Conference on Machine Learning, ICML 2019, 9-15 June 2019, Long Beach, California, USA.| 数据学习 (DataLearner)

icml 2019 论文列表

Proceedings of the 36th International Conference on Machine Learning, ICML 2019, 9-15 June 2019, Long Beach, California, USA.

Natural Analysts in Adaptive Data Analysis.

Tijana Zrnic Moritz Hardt

Fast Context Adaptation via Meta-Learning.

Luisa M. Zintgraf Kyriacos Shiarlis Vitaly Kurin Katja Hofmann Shimon Whiteson

Beating Stochastic and Adversarial Semi-bandits Optimally and Simultaneously.

Julian Zimmert Haipeng Luo Chen-Yu Wei

Latent Normalizing Flows for Discrete Sequences.

Zachary M. Ziegler Alexander M. Rush

Surrogate Losses for Online Learning of Stepsizes in Stochastic Non-Convex Optimization.

Zhenxun Zhuang Ashok Cutkosky Francesco Orabona

The Anisotropic Noise in Stochastic Gradient Descent: Its Behavior of Escaping from Sharp Minima and Regularization Effects.

Zhanxing Zhu Jingfeng Wu Bing Yu Lei Wu Jinwen Ma

Learning Classifiers for Target Domain with Limited or No Labels.

Pengkai Zhu Hanxiao Wang Venkatesh Saligrama

Poission Subsampled Rényi Differential Privacy.

Yuqing Zhu Yu-Xiang Wang

Improved Dynamic Graph Learning through Fault-Tolerant Sparsification.

Chun Jiang Zhu Sabine Storandt Kam-yiu Lam Song Han Jinbo Bi

Transferable Clean-Label Poisoning Attacks on Deep Neural Nets.

Chen Zhu W. Ronny Huang Hengduo Li Gavin Taylor Christoph Studer Tom Goldstein

BayesNAS: A Bayesian Approach for Neural Architecture Search.

Hongpeng Zhou Minghao Yang Jun Wang Wei Pan

Toward Understanding the Importance of Noise in Training Neural Networks.

Mo Zhou Tianyi Liu Yan Li Dachao Lin Enlu Zhou Tuo Zhao

Lipschitz Generative Adversarial Nets.

Zhiming Zhou Jiadong Liang Yuxuan Song Lantao Yu Hongwei Wang Weinan Zhang Yong Yu Zhihua Zhang

Lower Bounds for Smooth Nonconvex Finite-Sum Optimization.

Dongruo Zhou Quanquan Gu

Stochastic Iterative Hard Thresholding for Graph-structured Sparsity Optimization.

Baojian Zhou Feng Chen Yiming Ying

Maximum Entropy-Regularized Multi-Goal Reinforcement Learning.

Rui Zhao Xudong Sun Volker Tresp

Improving Neural Network Quantization without Retraining using Outlier Channel Splitting.

Ritchie Zhao Yuwei Hu Jordan Dotzel Christopher De Sa Zhiru Zhang

Metric-Optimized Example Weights.

Sen Zhao Mahdi Milani Fard Harikrishna Narasimhan Maya R. Gupta

On Learning Invariant Representations for Domain Adaptation.

Han Zhao Remi Tachet des Combes Kun Zhang Geoffrey J. Gordon

Adaptive Monte Carlo Multiple Testing via Multi-Armed Bandits.

Martin J. Zhang James Zou David Tse

Interpreting Adversarially Trained Convolutional Neural Networks.

Tianyuan Zhang Zhanxing Zhu

Greedy Orthogonal Pivoting Algorithm for Non-Negative Matrix Factorization.

Kai Zhang Sheng Zhang Jun Liu Jun Wang Jie Zhang

Learning Novel Policies For Tasks.

Yunbo Zhang Wenhao Yu Greg Turk

Theoretically Principled Trade-off between Robustness and Accuracy.

Hongyang Zhang Yaodong Yu Jiantao Jiao Eric P. Xing Laurent El Ghaoui Michael I. Jordan

Fast and Stable Maximum Likelihood Estimation for Incomplete Multinomial Models.

Chenyang Zhang Guosheng Yin

A Composite Randomized Incremental Gradient Method.

Junyu Zhang Lin Xiao

SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning.

Marvin Zhang Sharad Vikram Laura Smith Pieter Abbeel Matthew J. Johnson Sergey Levine

Co-Representation Network for Generalized Zero-Shot Learning.

Fei Zhang Guangming Shi

Random Function Priors for Correlation Modeling.

Aonan Zhang John W. Paisley

Adaptive Regret of Convex and Smooth Functions.

Lijun Zhang Tie-Yan Liu Zhi-Hua Zhou

Bridging Theory and Algorithm for Domain Adaptation.

Yuchen Zhang Tianle Liu Mingsheng Long Michael I. Jordan

Incremental Randomized Sketching for Online Kernel Learning.

Xiao Zhang Shizhong Liao

Neural Collaborative Subspace Clustering.

Tong Zhang Pan Ji Mehrtash Harandi Wen-bing Huang Hongdong Li

LatentGNN: Learning Efficient Non-local Relations for Visual Recognition.

Songyang Zhang Xuming He Shipeng Yan

Circuit-GNN: Graph Neural Networks for Distributed Circuit Design.

Guo Zhang Hao He Dina Katabi

Self-Attention Generative Adversarial Networks.

Han Zhang Ian J. Goodfellow Dimitris N. Metaxas Augustus Odena

When Samples Are Strategically Selected.

Hanrui Zhang Yu Cheng Vincent Conitzer

Warm-starting Contextual Bandits: Robustly Combining Supervised and Bandit Feedback.

Chicheng Zhang Alekh Agarwal Hal Daumé III John Langford Sahand Negahban

Making Convolutional Networks Shift-Invariant Again.

Richard Zhang

Global Convergence of Block Coordinate Descent in Deep Learning.

Jinshan Zeng Tim Tsz-Kit Lau Shaobo Lin Yuan Yao

Tighter Problem-Dependent Regret Bounds in Reinforcement Learning without Domain Knowledge using Value Function Bounds.

Andrea Zanette Emma Brunskill

Context-Aware Zero-Shot Learning for Object Recognition.

Eloi Zablocki Patrick Bordes Laure Soulier Benjamin Piwowarski Patrick Gallinari

Conditional Gradient Methods via Stochastic Path-Integrated Differential Estimator.

Alp Yurtsever Suvrit Sra Volkan Cevher

A Conditional-Gradient-Based Augmented Lagrangian Framework.

Alp Yurtsever Olivier Fercoq Volkan Cevher

Dirichlet Simplex Nest and Geometric Inference.

Mikhail Yurochkin Aritra Guha Yuekai Sun XuanLong Nguyen

Bayesian Nonparametric Federated Learning of Neural Networks.

Mikhail Yurochkin Mayank Agarwal Soumya Ghosh Kristjan H. Greenewald Trong Nghia Hoang Yasaman Khazaeni

Trimming the $\ell_1$ Regularizer: Statistical Analysis, Optimization, and Applications to Deep Learning.

Jihun Yun Peng Zheng Eunho Yang Aurelie C. Lozano Aleksandr Y. Aravkin

Differential Inclusions for Modeling Nonsmooth ADMM Variants: A Continuous Limit Theory.

Huizhuo Yuan Yuren Zhou Chris Junchi Li Qingyun Sun

Generative Modeling of Infinite Occluded Objects for Compositional Scene Representation.

Jinyang Yuan Bin Li Xiangyang Xue

Online Adaptive Principal Component Analysis and Its extensions.

Jianjun Yuan Andrew G. Lamperski

Distributed Learning over Unreliable Networks.

Chen Yu Hanlin Tang Cédric Renggli Simon Kassing Ankit Singla Dan Alistarh Ce Zhang Ji Liu

Multi-Agent Adversarial Inverse Reinforcement Learning.

Lantao Yu Jiaming Song Stefano Ermon

On the Linear Speedup Analysis of Communication Efficient Momentum SGD for Distributed Non-Convex Optimization.

Hao Yu Rong Jin Sen Yang

On the Computation and Communication Complexity of Parallel SGD with Dynamic Batch Sizes for Stochastic Non-Convex Optimization.

Hao Yu Rong Jin

How does Disagreement Help Generalization against Label Corruption?

Xingrui Yu Bo Han Jiangchao Yao Gang Niu Ivor W. Tsang Masashi Sugiyama

DAG-GNN: DAG Structure Learning with Graph Neural Networks.

Yue Yu Jie Chen Tian Gao Mo Yu

Learning Neurosymbolic Generative Models via Program Synthesis.

Halley Young Osbert Bastani Mayur Naik

Position-aware Graph Neural Networks.

Jiaxuan You Rex Ying Jure Leskovec

Towards Accurate Model Selection in Deep Unsupervised Domain Adaptation.

Kaichao You Ximei Wang Mingsheng Long Michael I. Jordan

TapNet: Neural Network Augmented with Task-Adaptive Projection for Few-Shot Learning.

Sung Whan Yoon Jun Seo Jaekyun Moon

NAS-Bench-101: Towards Reproducible Neural Architecture Search.

Chris Ying Aaron Klein Eric Christiansen Esteban Real Kevin Murphy Frank Hutter

ARSM: Augment-REINFORCE-Swap-Merge Estimator for Gradient Backpropagation Through Categorical Variables.

Mingzhang Yin Yuguang Yue Mingyuan Zhou

Rademacher Complexity for Adversarially Robust Generalization.

Dong Yin Kannan Ramchandran Peter L. Bartlett

Defending Against Saddle Point Attack in Byzantine-Robust Distributed Learning.

Dong Yin Yudong Chen Kannan Ramchandran Peter L. Bartlett

Understanding Geometry of Encoder-Decoder CNNs.

Jong Chul Ye Woon Kyoung Sung

Tight Kernel Query Complexity of Kernel Ridge Regression and Kernel $k$-means Clustering.

Taisuke Yasuda David P. Woodruff Manuel Fernandez

Hierarchically Structured Meta-learning.

Huaxiu Yao Ying Wei Junzhou Huang Zhenhui Li

Efficient Nonconvex Regularized Tensor Completion with Structure-aware Proximal Iterations.

Quanming Yao James Tin-Yau Kwok Bo Han

ME-Net: Towards Effective Adversarial Robustness with Matrix Estimation.

Yuzhe Yang Guo Zhang Zhi Xu Dina Katabi

SWALP : Stochastic Weight Averaging in Low Precision Training.

Guandao Yang Tianyi Zhang Polina Kirichenko Junwen Bai Andrew Gordon Wilson Christopher De Sa

LegoNet: Efficient Convolutional Neural Networks with Lego Filters.

Zhaohui Yang Yunhe Wang Chuanjian Liu Hanting Chen Chunjing Xu Boxin Shi Chao Xu Chang Xu

Sample-Optimal Parametric Q-Learning Using Linearly Additive Features.

Lin Yang Mengdi Wang

Learning to Prove Theorems via Interacting with Proof Assistants.

Kaiyu Yang Jia Deng

Supervised Hierarchical Clustering with Exponential Linkage.

Nishant Yadav Ari Kobren Nicholas Monath Andrew McCallum

Variational Russian Roulette for Deep Bayesian Nonparametrics.

Kai Xu Akash Srivastava Charles Sutton

Learning a Prior over Intent via Meta-Inverse Reinforcement Learning.

Kelvin Xu Ellis Ratner Anca D. Dragan Sergey Levine Chelsea Finn

Stochastic Optimization for DC Functions and Non-smooth Non-convex Regularizers with Non-asymptotic Convergence.

Yi Xu Qi Qi Qihang Lin Rong Jin Tianbao Yang

Gromov-Wasserstein Learning for Graph Matching and Node Embedding.

Hongteng Xu Dixin Luo Hongyuan Zha Lawrence Carin

Power k-Means Clustering.

Jason Xu Kenneth Lange

Calibrated Approximate Bayesian Inference.

Hanwen Xing Geoff Nicholls Jeong Lee

Differentiable Linearized ADMM.

Xingyu Xie Jianlong Wu Guangcan Liu Zhisheng Zhong Zhouchen Lin

Zeno: Distributed Stochastic Gradient Descent with Suspicion-based Fault-tolerance.

Cong Xie Sanmi Koyejo Indranil Gupta

On Scalable and Efficient Computation of Large Scale Optimal Transport.

Yujia Xie Minshuo Chen Haoming Jiang Tuo Zhao Hongyuan Zha

Domain Adaptation with Asymmetrically-Relaxed Distribution Alignment.

Yifan Wu Ezra Winston Divyansh Kaushik Zachary C. Lipton

Simplifying Graph Convolutional Networks.

Felix Wu Amauri H. Souza Jr. Tianyi Zhang Christopher Fifty Tao Yu Kilian Q. Weinberger

Deep Compressed Sensing.

Yan Wu Mihaela Rosca Timothy P. Lillicrap

Heterogeneous Model Reuse via Optimizing Multiparty Multiclass Margin.

Xi-Zhu Wu Song Liu Zhi-Hua Zhou

Learning a Compressed Sensing Measurement Matrix via Gradient Unrolling.

Shanshan Wu Alex Dimakis Sujay Sanghavi Felix X. Yu Daniel Niels Holtmann-Rice Dmitry Storcheus Afshin Rostamizadeh Sanjiv Kumar

Imitation Learning from Imperfect Demonstration.

Yueh-Hua Wu Nontawat Charoenphakdee Han Bao Voot Tangkaratt Masashi Sugiyama

Wasserstein Adversarial Examples via Projected Sinkhorn Iterations.

Eric Wong Frank R. Schmidt J. Zico Kolter

Partially Exchangeable Networks and Architectures for Learning Summary Statistics in Approximate Bayesian Computation.

Samuel Wiqvist Pierre-Alexandre Mattei Umberto Picchini Jes Frellsen

Fairness risk measures.

Robert C. Williamson Aditya Krishna Menon

End-to-End Probabilistic Inference for Nonstationary Audio Analysis.

William J. Wilkinson Michael Riis Andersen Joshua D. Reiss Dan Stowell Arno Solin

Moment-Based Variational Inference for Markov Jump Processes.

Christian Wildner Heinz Koeppl

Automatic Classifiers as Scientific Instruments: One Step Further Away from Ground-Truth.

Jacob Whitehill Anand Ramakrishnan

Improving Model Selection by Employing the Test Data.

Max Westphal Werner Brannath

Learning deep kernels for exponential family densities.

Wenliang Li Danica J. Sutherland Heiko Strathmann Arthur Gretton

PROVEN: Verifying Robustness of Neural Networks with a Probabilistic Approach.

Lily Weng Pin-Yu Chen Lam M. Nguyen Mark S. Squillante Akhilan Boopathy Ivan V. Oseledets Luca Daniel

Non-Monotonic Sequential Text Generation.

Sean Welleck Kianté Brantley Hal Daumé III Kyunghyun Cho

CapsAndRuns: An Improved Method for Approximately Optimal Algorithm Configuration.

Gellért Weisz András György Csaba Szepesvári

On the statistical rate of nonlinear recovery in generative models with heavy-tailed data.

Xiaohan Wei Zhuoran Yang Zhaoran Wang

Generalized Linear Rule Models.

Dennis Wei Sanjeeb Dash Tian Gao Oktay Günlük

AdaGrad stepsizes: sharp convergence over nonconvex landscapes.

Rachel Ward Xiaoxia Wu Léon Bottou

Jumpout : Improved Dropout for Deep Neural Networks with ReLUs.

Shengjie Wang Tianyi Zhou Jeff A. Bilmes

Bias Also Matters: Bias Attribution for Deep Neural Network Explanation.

Shengjie Wang Tianyi Zhou Jeff A. Bilmes

On the Generalization Gap in Reparameterizable Reinforcement Learning.

Huan Wang Stephan Zheng Caiming Xiong Richard Socher

Doubly Robust Joint Learning for Recommendation on Data Missing Not at Random.

Xiaojie Wang Rui Zhang Yu Sun Jianzhong Qi

On Sparse Linear Regression in the Local Differential Privacy Model.

Di Wang Jinhui Xu

Repairing without Retraining: Avoiding Disparate Impact with Counterfactual Distributions.

Hao Wang Berk Ustun Flávio P. Calmon

Deep Factors for Forecasting.

Yuyang Wang Alex Smola Danielle C. Maddix Jan Gasthaus Dean Foster Tim Januschowski

State-Regularized Recurrent Neural Networks.

Cheng Wang Mathias Niepert

On the Convergence and Robustness of Adversarial Training.

Yisen Wang Xingjun Ma James Bailey Jinfeng Yi Bowen Zhou Quanquan Gu

Nonlinear Stein Variational Gradient Descent for Learning Diversified Mixture Models.

Dilin Wang Qiang Liu

EigenDamage: Structured Pruning in the Kronecker-Factored Eigenbasis.

Chaoqi Wang Roger B. Grosse Sanja Fidler Guodong Zhang

Improving Neural Language Modeling via Adversarial Training.

Dilin Wang ChengYue Gong Qiang Liu

SATNet: Bridging deep learning and logical reasoning using a differentiable satisfiability solver.

Po-Wei Wang Priya L. Donti Bryan Wilder J. Zico Kolter

Random Expert Distillation: Imitation Learning via Expert Policy Support Estimation.

Ruohan Wang Carlo Ciliberto Pierluigi Vito Amadori Yiannis Demiris

Differentially Private Empirical Risk Minimization with Non-convex Loss Functions.

Di Wang Changyou Chen Jinhui Xu

Convolutional Poisson Gamma Belief Network.

Chaojie Wang Bo Chen Sucheng Xiao Mingyuan Zhou

Gaining Free or Low-Cost Interpretability with Interpretable Partial Substitute.

Tong Wang

Graph Convolutional Gaussian Processes.

Ian Walker Ben Glocker

On the Limitations of Representing Functions on Sets.

Edward Wagstaff Fabian Fuchs Martin Engelcke Ingmar Posner Michael A. Osborne

Learning to select for a predefined ranking.

Aleksandr Vorobev Aleksei Ustimenko Gleb Gusev Pavel Serdyukov

On the Design of Estimators for Bandit Off-Policy Evaluation.

Nikos Vlassis Aurélien Bibaut Maria Dimakopoulou Tony Jebara

Understanding Priors in Bayesian Neural Networks at the Unit Level.

Mariia Vladimirova Jakob Verbeek Pablo Mesejo Julyan Arbel

Maximum Likelihood Estimation for Learning Populations of Parameters.

Ramya Korlakai Vinayak Weihao Kong Gregory Valiant Sham M. Kakade

Manifold Mixup: Better Representations by Interpolating Hidden States.

Vikas Verma Alex Lamb Christopher Beckham Amir Najafi Ioannis Mitliagkas David Lopez-Paz Yoshua Bengio

Probabilistic Neural Symbolic Models for Interpretable Visual Question Answering.

Ramakrishna Vedantam Karan Desai Stefan Lee Marcus Rohrbach Dhruv Batra Devi Parikh

Learning Dependency Structures for Weak Supervision Models.

Paroma Varma Frederic Sala Ann He Alexander Ratner Christopher Ré

Model Comparison for Semantic Grouping.

Francisco Vargas Kamen Brestnichki Nils Hammerla

Composing Value Functions in Reinforcement Learning.

Benjamin van Niekerk Steven D. James Adam Christopher Earle Benjamin Rosman

Characterization of Convex Objective Functions and Optimal Expected Convergence Rates for SGD.

Marten van Dijk Lam M. Nguyen Phuong Ha Nguyen Dzung T. Phan

Large-Scale Sparse Kernel Canonical Correlation Analysis.

Viivi Uurtio Sahely Bhadra Juho Rousu

Fairness without Harm: Decoupled Classifiers with Preference Guarantees.

Berk Ustun Yang Liu David C. Parkes

Sublinear Space Private Algorithms Under the Sliding Window Model.

Jalaj Upadhyay

Distributed, Egocentric Representations of Graphs for Detecting Critical Structures.

Ruo-Chun Tzeng Shan-Hung Wu

Metropolis-Hastings Generative Adversarial Networks.

Ryan D. Turner Jane Hung Eric Frank Yunus Saatchi Jason Yosinski

Homomorphic Sensing.

Manolis C. Tsakiris Liangzu Peng

Learning Hawkes Processes Under Synchronization Noise.

William Trouleau Jalal Etesami Matthias Grossglauser Negar Kiyavash Patrick Thiran

LR-GLM: High-Dimensional Bayesian Inference Using Low-Rank Data Approximations.

Brian L. Trippe Jonathan H. Huggins Raj Agrawal Tamara Broderick

DeepNose: Using artificial neural networks to represent the space of odorants.

Ngoc B. Tran Daniel R. Kepple Sergey Shuvaev Alexei A. Koulakov

Bayesian Generative Active Deep Learning.

Toan Tran Thanh-Toan Do Ian D. Reid Gustavo Carneiro

Discovering Latent Covariance Structures for Multiple Time Series.

Anh Tong Jaesik Choi

Optimal Transport for structured data with application on graphs.

Titouan Vayer Nicolas Courty Romain Tavenard Laetitia Chapel Rémi Flamary

Transfer of Samples in Policy Search via Multiple Importance Sampling.

Andrea Tirinzoni Mattia Salvini Marcello Restelli

Random Matrix Improved Covariance Estimation for a Large Class of Metrics.

Malik Tiomoko Romain Couillet Florent Bouchard Guillaume Ginolhac

ELF OpenGo: an analysis and open reimplementation of AlphaZero.

Yuandong Tian Jerry Ma Qucheng Gong Shubho Sengupta Zhuoyuan Chen James Pinkerton Larry Zitnick

Combating Label Noise in Deep Learning using Abstention.

Sunil Thulasidasan Tanmoy Bhattacharya Jeff A. Bilmes Gopinath Chennupati Jamal Mohd-Yusof

Concentration Inequalities for Conditional Value at Risk.

Philip S. Thomas Erik G. Learned-Miller

Action Robust Reinforcement Learning and Applications in Continuous Control.

Chen Tessler Yonathan Efroni Shie Mannor

Kernel Normalized Cut: a Theoretical Revisit.

Yoshikazu Terada Michio Yamamoto

The Natural Language of Actions.

Guy Tennenholtz Shie Mannor

Predicate Exchange: Inference with Declarative Knowledge.

Zenna Tavares Javier Burroni Edgar Minasyan Armando Solar-Lezama Rajesh Ranganath

Variational Annealing of GANs: A Langevin Perspective.

Chenyang Tao Shuyang Dai Liqun Chen Ke Bai Junya Chen Chang Liu Ruiyi Zhang Georgiy V. Bobashev Lawrence Carin

Adaptive Neural Trees.

Ryutaro Tanno Kai Arulkumaran Daniel C. Alexander Antonio Criminisi Aditya V. Nori

DoubleSqueeze: Parallel Stochastic Gradient Descent with Double-pass Error-Compensated Compression.

Hanlin Tang Chen Yu Xiangru Lian Tong Zhang Ji Liu

The Variational Predictive Natural Gradient.

Da Tang Rajesh Ranganath

Correlated Variational Auto-Encoders.

Da Tang Dawen Liang Tony Jebara Nicholas Ruozzi

Mallows ranking models: maximum likelihood estimate and regeneration.

Wenpin Tang

Hierarchical Decompositional Mixtures of Variational Autoencoders.

Ping Liang Tan Robert Peharz

EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks.

Mingxing Tan Quoc V. Le

Making Deep Q-learning methods robust to time discretization.

Corentin Tallec Léonard Blier Yann Ollivier

Equivariant Transformer Networks.

Kai Sheng Tai Peter Bailis Gregory Valiant

Accelerated Flow for Probability Distributions.

Amirhossein Taghvaei Prashant G. Mehta

Hyperbolic Disk Embeddings for Directed Acyclic Graphs.

Ryota Suzuki Ryusuke Takahama Shun Onoda

Robustly Disentangled Causal Mechanisms: Validating Deep Representations for Interventional Robustness.

Raphael Suter Ðorðe Miladinovic Bernhard Schölkopf Stefan Bauer

Active Learning for Decision-Making from Imbalanced Observational Data.

Iiris Sundin Peter Schulam Eero Siivola Aki Vehtari Suchi Saria Samuel Kaski

Provably Efficient Imitation Learning from Observation Alone.

Wen Sun Anirudh Vemula Byron Boots Drew Bagnell

Contextual Memory Trees.

Wen Sun Alina Beygelzimer Hal Daumé III John Langford Paul Mineiro

Learning Distance for Sequences by Learning a Ground Metric.

Bing Su Ying Wu

CAB: Continuous Adaptive Blending for Policy Evaluation and Learning.

Yi Su Lequn Wang Michele Santacatterina Thorsten Joachims

Learning Optimal Linear Regularizers.

Matthew Streeter

BERT and PALs: Projected Attention Layers for Efficient Adaptation in Multi-Task Learning.

Asa Cooper Stickland Iain Murray

Insertion Transformer: Flexible Sequence Generation via Insertion Operations.

Mitchell Stern William Chan Jamie Kiros Jakob Uszkoreit

Faster Attend-Infer-Repeat with Tractable Probabilistic Models.

Karl Stelzner Robert Peharz Kristian Kersting

Escaping Saddle Points with Adaptive Gradient Methods.

Matthew Staib Sashank J. Reddi Satyen Kale Sanjiv Kumar Suvrit Sra

Compressing Gradient Optimizers via Count-Sketches.

Ryan Spring Anastasios Kyrillidis Vijai Mohan Anshumali Shrivastava

Dual Entangled Polynomial Code: Three-Dimensional Coding for Distributed Matrix Multiplication.

Pedro Soto Jun Li Xiaodi Fan

MASS: Masked Sequence to Sequence Pre-training for Language Generation.

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Revisiting the Softmax Bellman Operator: New Benefits and New Perspective.

Zhao Song Ronald Parr Lawrence Carin

SELFIE: Refurbishing Unclean Samples for Robust Deep Learning.

Hwanjun Song Minseok Kim Jae-Gil Lee

Distribution calibration for regression.

Hao Song Tom Diethe Meelis Kull Peter A. Flach

QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning.

Kyunghwan Son Daewoo Kim Wan Ju Kang David Hostallero Yung Yi

The Evolved Transformer.

David R. So Quoc V. Le Chen Liang

GEOMetrics: Exploiting Geometric Structure for Graph-Encoded Objects.

Edward J. Smith Scott Fujimoto Adriana Romero David Meger

kernelPSI: a Post-Selection Inference Framework for Nonlinear Variable Selection.

Lotfi Slim Clément Chatelain Chloé-Agathe Azencott Jean-Philippe Vert

Understanding Impacts of High-Order Loss Approximations and Features in Deep Learning Interpretation.

Sahil Singla Eric Wallace Shi Feng Soheil Feizi

Non-Parametric Priors For Generative Adversarial Networks.

Rajhans Singh Pavan K. Turaga Suren Jayasuriya Ravi Garg Martin W. Braun

A Tail-Index Analysis of Stochastic Gradient Noise in Deep Neural Networks.

Umut Simsekli Levent Sagun Mert Gürbüzbalaban

Refined Complexity of PCA with Outliers.

Kirill Simonov Fedor V. Fomin Petr A. Golovach Fahad Panolan

First-Order Adversarial Vulnerability of Neural Networks and Input Dimension.

Carl-Johann Simon-Gabriel Yann Ollivier Léon Bottou Bernhard Schölkopf David Lopez-Paz

Revisiting precision recall definition for generative modeling.

Loïc Simon Ryan Webster Julien Rabin

Rehashing Kernel Evaluation in High Dimensions.

Paris Siminelakis Kexin Rong Peter Bailis Moses Charikar Philip Alexander Levis

Model-Based Active Exploration.

Pranav Shyam Wojciech Jaskowski Faustino Gomez

Fast Direct Search in an Optimally Compressed Continuous Target Space for Efficient Multi-Label Active Learning.

Weishi Shi Qi Yu

Scalable Training of Inference Networks for Gaussian-Process Models.

Jiaxin Shi Mohammad Emtiyaz Khan Jun Zhu

Replica Conditional Sequential Monte Carlo.

Alex Shestopaloff Arnaud Doucet

Learning with Bad Training Data via Iterative Trimmed Loss Minimization.

Yanyao Shen Sujay Sanghavi

Hessian Aided Policy Gradient.

Zebang Shen Alejandro Ribeiro Hamed Hassani Hui Qian Chao Mi

Mixture Models for Diverse Machine Translation: Tricks of the Trade.

Tianxiao Shen Myle Ott Michael Auli Marc'Aurelio Ranzato

Learning to Clear the Market.

Weiran Shen Sébastien Lahaie Renato Paes Leme

Conditional Independence in Testing Bayesian Networks.

Yujia Shen Haiying Huang Arthur Choi Adnan Darwiche

Compressed Factorization: Fast and Accurate Low-Rank Factorization of Compressively-Sensed Data.

Vatsal Sharan Kai Sheng Tai Peter Bailis Gregory Valiant

Exploration Conscious Reinforcement Learning Revisited.

Lior Shani Yonathan Efroni Shie Mannor

On the Feasibility of Learning, Rather than Assuming, Human Biases for Reward Inference.

Rohin Shah Noah Gundotra Pieter Abbeel Anca D. Dragan

Discovering Context Effects from Raw Choice Data.

Arjun Seshadri Alex Peysakhovich Johan Ugander

Weakly-Supervised Temporal Localization via Occurrence Count Learning.

Julien Schroeter Kirill A. Sidorov A. David Marshall

Locally Private Bayesian Inference for Count Models.

Aaron Schein Zhiwei Steven Wu Alexandra Schofield Mingyuan Zhou Hanna M. Wallach

A Theoretical Analysis of Contrastive Unsupervised Representation Learning.

Nikunj Saunshi Orestis Plevrakis Sanjeev Arora Mikhail Khodak Hrishikesh Khandeparkar

Breaking Inter-Layer Co-Adaptation by Classifier Anonymization.

Ikuro Sato Kohta Ishikawa Guoqing Liu Masayuki Tanaka

Near optimal finite time identification of arbitrary linear dynamical systems.

Tuhin Sarkar Alexander Rakhlin

Multivariate Submodular Optimization.

Richard Santiago F. Bruce Shepherd

Deep Gaussian Processes with Importance-Weighted Variational Inference.

Hugh Salimbeni Vincent Dutordoir James Hensman Marc Peter Deisenroth

An Optimal Private Stochastic-MAB Algorithm based on Optimal Private Stopping Rule.

Touqir Sajed Or Sheffet

Tractable n-Metrics for Multiple Graphs.

Sam Safavi José Bento

White-box vs Black-box: Bayes Optimal Strategies for Membership Inference.

Alexandre Sablayrolles Matthijs Douze Cordelia Schmid Yann Ollivier Hervé Jégou

Plug-and-Play Methods Provably Converge with Properly Trained Denoisers.

Ernest K. Ryu Jialin Liu Sicheng Wang Xiaohan Chen Zhangyang Wang Wotao Yin

A Contrastive Divergence for Combining Variational Inference and MCMC.

Francisco J. R. Ruiz Michalis K. Titsias

Statistics and Samples in Distributional Reinforcement Learning.

Mark Rowland Robert Dadashi Saurabh Kumar Rémi Munos Marc G. Bellemare Will Dabney

Iterative Linearized Control: Stable Algorithms and Complexity Guarantees.

Vincent Roulet Dmitriy Drusvyatskiy Siddhartha S. Srinivasa Zaïd Harchaoui

Neuron birth-death dynamics accelerates gradient descent and converges asymptotically.

Grant M. Rotskoff Samy Jelassi Joan Bruna Eric Vanden-Eijnden

The Odds are Odd: A Statistical Test for Detecting Adversarial Examples.

Kevin Roth Yannic Kilcher Thomas Hofmann

Good Initializations of Variational Bayes for Deep Models.

Simone Rossi Pietro Michiardi Maurizio Filippone

Online Convex Optimization in Adversarial Markov Decision Processes.

Aviv Rosenberg Yishay Mansour

Separable value functions across time-scales.

Joshua Romoff Peter Henderson Ahmed Touati Yann Ollivier Joelle Pineau Emma Brunskill

Efficient learning of smooth probability functions from Bernoulli tests with guarantees.

Paul Rolland Ali Kavis Alexander Immer Adish Singla Volkan Cevher

A Persistent Weisfeiler-Lehman Procedure for Graph Classification.

Bastian Rieck Christian Bock Karsten M. Borgwardt

A Polynomial Time MCMC Method for Sampling from Continuous Determinantal Point Processes.

Alireza Rezaei Shayan Oveis Gharan

Adversarial Online Learning with noise.

Alon Resler Yishay Mansour

Adaptive Antithetic Sampling for Variance Reduction.

Hongyu Ren Shengjia Zhao Stefano Ermon

Almost Unsupervised Text to Speech and Automatic Speech Recognition.

Yi Ren Xu Tan Tao Qin Sheng Zhao Zhou Zhao Tie-Yan Liu

Fast Rates for a kNN Classifier Robust to Unknown Asymmetric Label Noise.

Henry W. J. Reeve Ata Kabán

Do ImageNet Classifiers Generalize to ImageNet?

Benjamin Recht Rebecca Roelofs Ludwig Schmidt Vaishaal Shankar

A Block Coordinate Descent Proximal Method for Simultaneous Filtering and Parameter Estimation.

Ramin Raziperchikolaei Harish S. Bhat

Efficient On-Device Models using Neural Projections.

Sujith Ravi

HyperGAN: A Generative Model for Diverse, Performant Neural Networks.

Neale Ratzlaff Fuxin Li

Topological Data Analysis of Decision Boundaries with Application to Model Selection.

Karthikeyan Natesan Ramamurthy Kush R. Varshney Krishnan Mody

Screening rules for Lasso with non-convex Sparse Regularizers.

Alain Rakotomamonjy Gilles Gasso Joseph Salmon

Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables.

Kate Rakelly Aurick Zhou Chelsea Finn Sergey Levine Deirdre Quillen

Does Data Augmentation Lead to Positive Margin?

Shashank Rajput Zhili Feng Zachary B. Charles Po-Ling Loh Dimitris S. Papailiopoulos

Look Ma, No Latent Variables: Accurate Cutset Networks via Compilation.

Tahrima Rahman Shasha Jin Vibhav Gogate

On the Spectral Bias of Neural Networks.

Nasim Rahaman Aristide Baratin Devansh Arpit Felix Draxler Min Lin Fred A. Hamprecht Yoshua Bengio Aaron C. Courville

Game Theoretic Optimization via Gradient-based Nikaido-Isoda Function.

Arvind U. Raghunathan Anoop Cherian Devesh K. Jha

Direct Uncertainty Prediction for Medical Second Opinions.

Maithra Raghu Katy Blumer Rory Sayres Ziad Obermeyer Robert D. Kleinberg Sendhil Mullainathan Jon M. Kleinberg

Meta-Learning Neural Bloom Filters.

Jack W. Rae Sergey Bartunov Timothy P. Lillicrap

Learning to Collaborate in Markov Decision Processes.

Goran Radanovic Rati Devidze David C. Parkes Adish Singla

Nonlinear Distributional Gradient Temporal-Difference Learning.

Chao Qu Shie Mannor Huan Xu

GMNN: Graph Markov Neural Networks.

Meng Qu Yoshua Bengio Jian Tang

Imperceptible, Robust, and Targeted Adversarial Examples for Automatic Speech Recognition.

Yao Qin Nicholas Carlini Garrison W. Cottrell Ian J. Goodfellow Colin Raffel

Fault Tolerance in Iterative-Convergent Machine Learning.

Aurick Qiao Bryon Aragam Bingjing Zhang Eric P. Xing

AutoVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss.

Kaizhi Qian Yang Zhang Shiyu Chang Xuesong Yang Mark Hasegawa-Johnson

SGD with Arbitrary Sampling: General Analysis and Improved Rates.

Xun Qian Peter Richtárik Robert M. Gower Alibek Sailanbayev Nicolas Loizou Egor Shulgin

SAGA with Arbitrary Sampling.

Xun Qian Zheng Qu Peter Richtárik

Hiring Under Uncertainty.

Manish Purohit Sreenivas Gollapudi Manish Raghavan

On Variational Bounds of Mutual Information.

Ben Poole Sherjil Ozair Aäron van den Oord Alex Alemi George Tucker

Voronoi Boundary Classification: A High-Dimensional Geometric Approach via Weighted Monte Carlo Integration.

Vladislav Polianskii Florian T. Pokorny

Temporal Gaussian Mixture Layer for Videos.

A. J. Piergiovanni Michael S. Ryoo

Towards Understanding Knowledge Distillation.

Mary Phuong Christoph Lampert

Cognitive model priors for predicting human decisions.

David D. Bourgin Joshua C. Peterson Daniel Reichman Stuart J. Russell Thomas L. Griffiths

Exploiting structure of uncertainty for efficient matroid semi-bandits.

Pierre Perrault Vianney Perchet Michal Valko

Collaborative Channel Pruning for Deep Networks.

Hanyu Peng Jiaxiang Wu Shifeng Chen Junzhou Huang

Domain Agnostic Learning with Disentangled Representations.

Xingchao Peng Zijun Huang Ximeng Sun Kate Saenko

COMIC: Multi-view Clustering Without Parameter Selection.

Xi Peng Zhenyu Huang Jiancheng Lv Hongyuan Zhu Joey Tianyi Zhou

Fingerprint Policy Optimisation for Robust Reinforcement Learning.

Supratik Paul Michael A. Osborne Shimon Whiteson

Subspace Robust Wasserstein Distances.

François-Pierre Paty Marco Cuturi

Self-Supervised Exploration via Disagreement.

Deepak Pathak Dhiraj Gandhi Abhinav Gupta

Spectral Approximate Inference.

Sejun Park Eunho Yang Se-Young Yun Jinwoo Shin

The Effect of Network Width on Stochastic Gradient Descent and Generalization: an Empirical Study.

Daniel S. Park Jascha Sohl-Dickstein Quoc V. Le Samuel L. Smith

Variational Laplace Autoencoders.

Yookoon S. Park Chris Dongjoo Kim Gunhee Kim

Generalized Majorization-Minimization.

Sobhan Naderi Parizi Kun He Reza Aghajani Stan Sclaroff Pedro F. Felzenszwalb

Measurements of Three-Level Hierarchical Structure in the Outliers in the Spectrum of Deepnet Hessians.

Vardan Papyan

Deep Residual Output Layers for Neural Language Generation.

Nikolaos Pappas James Henderson

Optimistic Policy Optimization via Multiple Importance Sampling.

Matteo Papini Alberto Maria Metelli Lorenzo Lupo Marcello Restelli

Nonparametric Bayesian Deep Networks with Local Competition.

Konstantinos P. Panousis Sotirios Chatzis Sergios Theodoridis

Improving Adversarial Robustness via Promoting Ensemble Diversity.

Tianyu Pang Kun Xu Chao Du Ning Chen Jun Zhu

Multiplicative Weights Updates as a distributed constrained optimization algorithm: Convergence to second-order stationary points almost always.

Ioannis Panageas Georgios Piliouras Xiao Wang

Overparameterized Nonlinear Learning: Gradient Descent Takes the Shortest Path?

Samet Oymak Mahdi Soltanolkotabi

Inferring Heterogeneous Causal Effects in Presence of Spatial Confounding.

Muhammad Osama Dave Zachariah Thomas B. Schön

Orthogonal Random Forest for Causal Inference.

Miruna Oprescu Vasilis Syrgkanis Zhiwei Steven Wu

Approximation and non-parametric estimation of ResNet-type convolutional neural networks.

Kenta Oono Taiji Suzuki

Scalable Learning in Reproducing Kernel Krein Spaces.

Dino Oglic Thomas Gärtner

TensorFuzz: Debugging Neural Networks with Coverage-Guided Fuzzing.

Augustus Odena Catherine Olsson David G. Andersen Ian J. Goodfellow

Model Function Based Conditional Gradient Method with Armijo-like Line Search.

Peter Ochs Yura Malitsky

Counterfactual Off-Policy Evaluation with Gumbel-Max Structural Causal Models.

Michael Oberst David A. Sontag

Tensor Variable Elimination for Plated Factor Graphs.

Fritz Obermeyer Eli Bingham Martin Jankowiak Neeraj Pradhan Justin T. Chiu Alexander M. Rush Noah D. Goodman

Learning to Infer Program Sketches.

Maxwell I. Nye Luke B. Hewitt Joshua B. Tenenbaum Armando Solar-Lezama

Remember and Forget for Experience Replay.

Guido Novati Petros Koumoutsakos

Training Neural Networks with Local Error Signals.

Arild Nøkland Lars Hiller Eidnes

Lossless or Quantized Boosting with Integer Arithmetic.

Richard Nock Robert C. Williamson

Rotation Invariant Householder Parameterization for Bayesian PCA.

Rajbir-Singh Nirwan Nils Bertschinger

Non-Asymptotic Analysis of Fractional Langevin Monte Carlo for Non-Convex Optimization.

Thanh Huy Nguyen Umut Simsekli Gaël Richard

Anomaly Detection With Multiple-Hypotheses Predictions.

Duc Tam Nguyen Zhongyu Lou Michael Klar Thomas Brox

On Connected Sublevel Sets in Deep Learning.

Quynh Nguyen

Learning to bid in revenue-maximizing auctions.

Thomas Nedelec Noureddine El Karoui Vianney Perchet

Safe Grid Search with Optimal Complexity.

Eugène Ndiaye Tam Le Olivier Fercoq Joseph Salmon Ichiro Takeuchi

Phaseless PCA: Low-Rank Matrix Recovery from Column-wise Phaseless Measurements.

Seyedehsara Nayer Praneeth Narayanamurthy Namrata Vaswani

A Framework for Bayesian Optimization in Embedded Subspaces.

Amin Nayebi Alexander Munteanu Matthias Poloczek

Zero-Shot Knowledge Distillation in Deep Networks.

Gaurav Kumar Nayak Konda Reddy Mopuri Vaisakh Shaj Venkatesh Babu Radhakrishnan Anirban Chakraborty

Learning Context-dependent Label Permutations for Multi-label Classification.

Jinseok Nam Young-Bum Kim Eneldo Loza Mencía Sunghyun Park Ruhi Sarikaya Johannes Fürnkranz

Hybrid Models with Deep and Invertible Features.

Eric T. Nalisnick Akihiro Matsukawa Yee Whye Teh Dilan Görür Balaji Lakshminarayanan

Dropout as a Structured Shrinkage Prior.

Eric T. Nalisnick José Miguel Hernández-Lobato Padhraic Smyth

SGD without Replacement: Sharper Rates for General Smooth Convex Functions.

Dheeraj Nagaraj Prateek Jain Praneeth Netrapalli

A Wrapped Normal Distribution on Hyperbolic Space for Gradient-Based Learning.

Yoshihiro Nagano Shoichiro Yamaguchi Yasuhiro Fujita Masanori Koyama

Lexicographic and Depth-Sensitive Margins in Homogeneous and Non-Homogeneous Deep Models.

Mor Shpigel Nacson Suriya Gunasekar Jason D. Lee Nathan Srebro Daniel Soudry

Learning Optimal Fair Policies.

Razieh Nabi Daniel Malinsky Ilya Shpitser

Relational Pooling for Graph Representations.

Ryan L. Murphy Balasubramaniam Srinivasan Vinayak A. Rao Bruno Ribeiro

A Dynamical Systems Perspective on Nesterov Acceleration.

Michael Muehlebach Michael I. Jordan

Parameter efficient training of deep convolutional neural networks by dynamic sparse reparameterization.

Hesham Mostafa Xin Wang

Parsimonious Black-Box Adversarial Attacks via Efficient Combinatorial Optimization.

Seungyong Moon Gaon An Hyun Oh Song

Flat Metric Minimization with Applications in Generative Modeling.

Thomas Möllenhoff Daniel Cremers

Agnostic Federated Learning.

Mehryar Mohri Gary Sivek Ananda Theertha Suresh

Co-manifold learning with missing data.

Gal Mishne Eric C. Chi Ronald R. Coifman

Formal Privacy for Functional Data with Gaussian Perturbations.

Ardalan Mirshani Matthew Reimherr Aleksandra B. Slavkovic

Discriminative Regularization for Latent Variable Models with Applications to Electrocardiography.

Andrew C. Miller Ziad Obermeyer John P. Cunningham Sendhil Mullainathan

On Dropout and Nuclear Norm Regularization.

Poorya Mianjy Raman Arora

Optimality Implies Kernel Sum Classifiers are Statistically Efficient.

Raphael A. Meyer Jean Honorio

Understanding and correcting pathologies in the training of learned optimizers.

Luke Metz Niru Maheswaranathan Jeremy Nixon C. Daniel Freeman Jascha Sohl-Dickstein

Reinforcement Learning in Configurable Continuous Environments.

Alberto Maria Metelli Emanuele Ghelfi Marcello Restelli

Simple Stochastic Gradient Methods for Non-Smooth Non-Convex Regularized Optimization.

Michael R. Metel Akiko Takeda

Spectral Clustering of Signed Graphs via Matrix Power Means.

Pedro Mercado Francesco Tudisco Matthias Hein

Geometric Losses for Distributional Learning.

Arthur Mensch Mathieu Blondel Gabriel Peyré

Ithemal: Accurate, Portable and Fast Basic Block Throughput Estimation using Deep Neural Networks.

Charith Mendis Alex Renda Saman P. Amarasinghe Michael Carbin

The Wasserstein Transform.

Facundo Mémoli Zane T. Smith Zhengchao Wan

Same, Same But Different: Recovering Neural Network Quantization Error Through Weight Factorization.

Eldad Meller Alexander Finkelstein Uri Almog Mark Grobman

Imputing Missing Events in Continuous-Time Event Streams.

Hongyuan Mei Guanghui Qin Jason Eisner

Stochastic Blockmodels meet Graph Neural Networks.

Nikhil Mehta Lawrence Carin Piyush Rai

Toward Controlling Discrimination in Online Ad Auctions.

L. Elisa Celis Anay Mehrotra Nisheeth K. Vishnoi

Efficient Amortised Bayesian Inference for Hierarchical and Nonlinear Dynamical Systems.

Geoffrey Roeder Paul K. Grant Andrew Phillips Neil Dalchau Edward Meeds

Graphical-model based estimation and inference for differential privacy.

Ryan McKenna Daniel Sheldon Gerome Miklau

Distributional Reinforcement Learning for Efficient Exploration.

Borislav Mavrin Hengshuai Yao Linglong Kong Kaiwen Wu Yaoliang Yu

MIWAE: Deep Generative Modelling and Imputation of Incomplete Data Sets.

Pierre-Alexandre Mattei Jes Frellsen

Disentangling Disentanglement in Variational Autoencoders.

Emile Mathieu Tom Rainforth N. Siddharth Yee Whye Teh

Optimal Minimal Margin Maximization with Boosting.

Alexander Mathiasen Kasper Green Larsen Allan Grønlund

Fairness-Aware Learning for Continuous Attributes and Treatments.

Jérémie Mary Clément Calauzènes Noureddine El Karoui

Decomposing feature-level variation with Covariate Gaussian Process Latent Variable Models.

Kaspar Märtens Kieran R. Campbell Christopher Yau

On the Universality of Invariant Networks.

Haggai Maron Ethan Fetaya Nimrod Segol Yaron Lipman

Adversarial Generation of Time-Frequency Features with application in audio synthesis.

Andrés Marafioti Nathanaël Perraudin Nicki Holighaus Piotr Majdak

A Baseline for Any Order Gradient Estimation in Stochastic Computation Graphs.

Jingkai Mao Jakob N. Foerster Tim Rocktäschel Maruan Al-Shedivat Gregory Farquhar Shimon Whiteson

Passed & Spurious: Descent Algorithms and Local Minima in Spiked Matrix-Tensor Models.

Stefano Sarao Mannelli Florent Krzakala Pierfrancesco Urbani Lenka Zdeborová

Learning from Delayed Outcomes via Proxies with Applications to Recommender Systems.

Timothy A. Mann Sven Gowal András György Huiyi Hu Ray Jiang Balaji Lakshminarayanan Prav Srinivasan

Calibrated Model-Based Deep Reinforcement Learning.

Ali Malik Volodymyr Kuleshov Jiaming Song Danny Nemer Harlan Seymour Stefano Ermon

Breaking the gridlock in Mixture-of-Experts: Consistent and Efficient Algorithms.

Ashok Vardhan Makkuva Pramod Viswanath Sreeram Kannan Sewoong Oh

Curvature-Exploiting Acceleration of Elastic Net Computations.

Vien V. Mai Mikael Johansson

Traditional and Heavy Tailed Self Regularization in Neural Network Models.

Michael W. Mahoney Charles H. Martin

Data Poisoning Attacks in Multi-Party Learning.

Saeed Mahloujifar Mohammad Mahmoody Ameer Mohammed

Guided evolutionary strategies: augmenting random search with surrogate gradients.

Niru Maheswaranathan Luke Metz George Tucker Dami Choi Jascha Sohl-Dickstein

Composable Core-sets for Determinant Maximization: A Simple Near-Optimal Algorithm.

Sepideh Mahabadi Piotr Indyk Shayan Oveis Gharan Alireza Rezaei

Bayesian leave-one-out cross-validation for large data.

Måns Magnusson Michael Riis Andersen Johan Jonasson Aki Vehtari

EDDI: Efficient Dynamic Discovery of High-Value Information with Partial VAE.

Chao Ma Sebastian Tschiatschek Konstantina Palla José Miguel Hernández-Lobato Sebastian Nowozin Cheng Zhang

Variational Implicit Processes.

Chao Ma Yingzhen Li José Miguel Hernández-Lobato

Disentangled Graph Convolutional Networks.

Jianxin Ma Peng Cui Kun Kuang Xin Wang Wenwu Zhu

Differentiable Dynamic Normalization for Learning Deep Representation.

Ping Luo Zhanglin Peng Wenqi Shao Ruimao Zhang Jiamin Ren Lingyun Wu

Leveraging Low-Rank Relations Between Surrogate Tasks in Structured Prediction.

Giulia Luise Dimitrios Stamos Massimiliano Pontil Carlo Ciliberto

High-Fidelity Image Generation With Fewer Labels.

Mario Lucic Michael Tschannen Marvin Ritter Xiaohua Zhai Olivier Bachem Sylvain Gelly

Generalized Approximate Survey Propagation for High-Dimensional Estimation.

Carlo Lucibello Luca Saglietti Yue M. Lu

CoT: Cooperative Training for Generative Modeling of Discrete Data.

Sidi Lu Lantao Yu Siyuan Feng Yaoming Zhu Weinan Zhang

Optimal Algorithms for Lipschitz Bandits with Heavy-tailed Rewards.

Shiyin Lu Guanghui Wang Yao Hu Lijun Zhang

Neurally-Guided Structure Inference.

Sidi Lu Jiayuan Mao Joshua B. Tenenbaum Jiajun Wu

PA-GD: On the Convergence of Perturbed Alternating Gradient Descent to Second-Order Stationary Points for Structured Nonconvex Optimization.

Songtao Lu Mingyi Hong Zhengdao Wang

Bayesian Counterfactual Risk Minimization.

Ben London Ted Sandler

Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations.

Francesco Locatello Stefan Bauer Mario Lucic Gunnar Rätsch Sylvain Gelly Bernhard Schölkopf Olivier Bachem

Sliced-Wasserstein Flows: Nonparametric Generative Modeling via Optimal Transport and Diffusions.

Antoine Liutkus Umut Simsekli Szymon Majewski Alain Durmus Fabian-Robert Stöter

Understanding MCMC Dynamics as Flows on the Wasserstein Space.

Chang Liu Jingwei Zhuo Jun Zhu

Understanding and Accelerating Particle-Based Variational Inference.

Chang Liu Jingwei Zhuo Pengyu Cheng Ruiyi Zhang Jun Zhu

On Certifying Non-Uniform Bounds against Adversarial Attacks.

Chen Liu Ryota Tomioka Volkan Cevher

Taming MAML: Efficient unbiased meta-reinforcement learning.

Hao Liu Richard Socher Caiming Xiong

The Implicit Fairness Criterion of Unconstrained Learning.

Lydia T. Liu Max Simchowitz Moritz Hardt

Data Poisoning Attacks on Stochastic Bandits.

Fang Liu Ness B. Shroff

Sparse Extreme Multi-label Learning with Oracle Property.

Weiwei Liu Xiaobo Shen

Rao-Blackwellized Stochastic Gradients for Discrete Distributions.

Runjing Liu Jeffrey Regier Nilesh Tripuraneni Michael I. Jordan Jon D. McAuliffe

Transferable Adversarial Training: A General Approach to Adapting Deep Classifiers.

Hong Liu Mingsheng Long Jianmin Wang Michael I. Jordan

Acceleration of SVRG and Katyusha X by Inexact Preconditioning.

Yanli Liu Fei Feng Wotao Yin

Fast and Simple Natural-Gradient Variational Inference with Mixture of Exponential-family Approximations.

Wu Lin Mohammad Emtiyaz Khan Mark Schmidt

On Efficient Optimal Transport: An Analysis of Greedy and Accelerated Mirror Descent Algorithms.

Tianyi Lin Nhat Ho Michael I. Jordan

Kernel-Based Reinforcement Learning in Robust Markov Decision Processes.

Shiau Hong Lim Arnaud Autef

Inference and Sampling of $K_33$-free Ising Models.

Valerii Likhosherstov Yury Maximov Misha Chertkov

Regularization in directable environments with application to Tetris.

Jan Malte Lichtenberg Özgür Simsek

Cautious Regret Minimization: Online Optimization with Long-Term Budget Constraints.

Nikolaos Liakopoulos Apostolos Destounis Georgios S. Paschos Thrasyvoulos Spyropoulos Panayotis Mertikopoulos

Alternating Minimizations Converge to Second-Order Optimal Solutions.

Qiuwei Li Zhihui Zhu Gongguo Tang

Learn to Grow: A Continual Structure Learning Framework for Overcoming Catastrophic Forgetting.

Xilai Li Yingbo Zhou Tianfu Wu Richard Socher Caiming Xiong

Feature-Critic Networks for Heterogeneous Domain Generalization.

Yiying Li Yongxin Yang Wei Zhou Timothy M. Hospedales

Towards a Unified Analysis of Random Fourier Features.

Zhu Li Jean-Francois Ton Dino Oglic Dino Sejdinovic

Adversarial camera stickers: A physical camera-based attack on deep learning systems.

Juncheng Li Frank R. Schmidt J. Zico Kolter

Exploiting Worker Correlation for Label Aggregation in Crowdsourcing.

Yuan Li Benjamin I. P. Rubinstein Trevor Cohn

Bayesian Joint Spike-and-Slab Graphical Lasso.

Zehang Richard Li Tyler H. McCormick Samuel J. Clark

NATTACK: Learning the Distributions of Adversarial Examples for an Improved Black-Box Attack on Deep Neural Networks.

Yandong Li Lijun Li Liqiang Wang Tong Zhang Boqing Gong

Online Learning to Rank with Features.

Shuai Li Tor Lattimore Csaba Szepesvári

Area Attention.

Yang Li Lukasz Kaiser Samy Bengio Si Si

Graph Matching Networks for Learning the Similarity of Graph Structured Objects.

Yujia Li Chenjie Gu Thomas Dullien Oriol Vinyals Pushmeet Kohli

LGM-Net: Learning to Generate Matching Networks for Few-Shot Learning.

Huai-Yu Li Weiming Dong Xing Mei Chongyang Ma Feiyue Huang Bao-Gang Hu

Sublinear quantum algorithms for training linear and kernel-based classifiers.

Tongyang Li Shouvanik Chakrabarti Xiaodi Wu

Are Generative Classifiers More Robust to Adversarial Attacks?

Yingzhen Li John Bradshaw Yash Sharma

Cheap Orthogonal Constraints in Neural Networks: A Simple Parametrization of the Orthogonal and Unitary Group.

Mario Lezcano Casado David Martínez-Rubio

MONK Outlier-Robust Mean Embedding Estimation by Median-of-Means.

Matthieu Lerasle Zoltán Szabó Timothée Mathieu Guillaume Lecué

Sublinear Time Nearest Neighbor Search over Generalized Weighted Space.

Yifan Lei Qiang Huang Mohan S. Kankanhalli Anthony K. H. Tung

Robust Inference via Generative Classifiers for Handling Noisy Labels.

Kimin Lee Sukmin Yun Kibok Lee Honglak Lee Bo Li Jinwoo Shin

First-Order Algorithms Converge Faster than $O(1/k)$ on Convex Problems.

Ching-pei Lee Stephen J. Wright

Set Transformer: A Framework for Attention-based Permutation-Invariant Neural Networks.

Juho Lee Yoonho Lee Jungtaek Kim Adam R. Kosiorek Seungjin Choi Yee Whye Teh

Self-Attention Graph Pooling.

Junhyun Lee Inyeop Lee Jaewoo Kang

Functional Transparency for Structured Data: a Game-Theoretic Approach.

Guang-He Lee Wengong Jin David Alvarez-Melis Tommi S. Jaakkola

Target-Based Temporal-Difference Learning.

Donghwan Lee Niao He

Batch Policy Learning under Constraints.

Hoang Minh Le Cameron Voloshin Yisong Yue

POLITEX: Regret Bounds for Policy Iteration using Expert Prediction.

Yasin Abbasi-Yadkori Peter L. Bartlett Kush Bhatia Nevena Lazic Csaba Szepesvári Gellért Weisz

DP-GP-LVM: A Bayesian Non-Parametric Model for Learning Multivariate Dependency Structures.

Andrew R. Lawrence Carl Henrik Ek Neill D. F. Campbell

Lorentzian Distance Learning for Hyperbolic Representations.

Marc Teva Law Renjie Liao Jake Snell Richard S. Zemel

A Better k-means++ Algorithm via Local Search.

Silvio Lattanzi Christian Sohler

Safe Policy Improvement with Baseline Bootstrapping.

Romain Laroche Paul Trichelair Remi Tachet des Combes

Projection onto Minkowski Sums with Application to Constrained Learning.

Joong-Ho Won Jason Xu Kenneth Lange

A Recurrent Neural Cascade-based Model for Continuous-Time Diffusion.

Sylvain Lamprier

State-Reification Networks: Improving Generalization by Modeling the Distribution of Hidden Representations.

Alex Lamb Jonathan Binas Anirudh Goyal Sandeep Subramanian Ioannis Mitliagkas Yoshua Bengio Michael Mozer

Characterizing Well-Behaved vs. Pathological Deep Neural Networks.

Antoine Labatie

Garbage In, Reward Out: Bootstrapping Exploration in Multi-Armed Bandits.

Branislav Kveton Csaba Szepesvári Sharan Vaswani Zheng Wen Tor Lattimore Mohammad Ghavamzadeh

Making Decisions that Reduce Discriminatory Impacts.

Matt J. Kusner Chris Russell Joshua R. Loftus Ricardo Silva

A Large-Scale Study on Regularization and Normalization in GANs.

Karol Kurach Mario Lucic Xiaohua Zhai Marcin Michalski Sylvain Gelly

Geometry and Symmetry in Short-and-Sparse Deconvolution.

Han-Wen Kuo Yenson Lau Yuqian Zhang John Wright

Loss Landscapes of Regularized Linear Autoencoders.

Daniel Kunin Jonathan M. Bloom Aleksandrina Goeva Cotton Seed

Faster Algorithms for Binary Matrix Factorization.

Ravi Kumar Rina Panigrahy Ali Rahimi David P. Woodruff

Estimate Sequences for Variance-Reduced Stochastic Composite Optimization.

Andrei Kulunchakov Julien Mairal

On the Complexity of Approximating Wasserstein Barycenters.

Alexey Kroshnin Nazarii Tupitsa Darina Dvinskikh Pavel E. Dvurechensky Alexander V. Gasnikov Cesar A. Uribe

Similarity of Neural Network Representations Revisited.

Simon Kornblith Mohammad Norouzi Honglak Lee Geoffrey E. Hinton

LIT: Learned Intermediate Representation Training for Model Compression.

Animesh Koratana Daniel Kang Peter Bailis Matei Zaharia

Stochastic Beams and Where To Find Them: The Gumbel-Top-k Trick for Sampling Sequences Without Replacement.

Wouter Kool Herke van Hoof Max Welling

Robust Learning from Untrusted Sources.

Nikola Konstantinov Christoph Lampert

Decentralized Stochastic Optimization and Gossip Algorithms with Compressed Communication.

Anastasia Koloskova Sebastian U. Stich Martin Jaggi

POPQORN: Quantifying Robustness of Recurrent Neural Networks.

Ching-Yun Ko Zhaoyang Lyu Lily Weng Luca Daniel Ngai Wong Dahua Lin

Guarantees for Spectral Clustering with Fairness Constraints.

Matthäus Kleindessner Samira Samadi Pranjal Awasthi Jamie Morgenstern

Fair k-Center Clustering for Data Summarization.

Matthäus Kleindessner Pranjal Awasthi Jamie Morgenstern

AUCμ: A Performance Metric for Multi-Class Machine Learning Models.

Ross Kleiman David Page

Adaptive and Safe Bayesian Optimization in High Dimensions via One-Dimensional Subspaces.

Johannes Kirschner Mojmir Mutny Nicole Hiller Rasmus Ischebeck Andreas Krause

CompILE: Compositional Imitation Learning and Execution.

Thomas Kipf Yujia Li Hanjun Dai Vinícius Flores Zambaldi Alvaro Sanchez-Gonzalez Edward Grefenstette Pushmeet Kohli Peter W. Battaglia

Bit-Swap: Recursive Bits-Back Coding for Lossless Compression with Hierarchical Latent Variables.

Friso H. Kingma Pieter Abbeel Jonathan Ho

Uniform Convergence Rate of the Kernel Density Estimator Adaptive to Intrinsic Volume Dimension.

Jisu Kim Jaehyeok Shin Alessandro Rinaldo Larry A. Wasserman

Contextual Multi-armed Bandit Algorithm for Semiparametric Reward Model.

Gi-Soo Kim Myunghee Cho Paik

Curiosity-Bottleneck: Exploration By Distilling Task-Specific Novelty.

Youngjin Kim Wontae Nam Hyunwoo Kim Ji-Hoon Kim Gunhee Kim

FloWaveNet : A Generative Flow for Raw Audio.

Sungwon Kim Sang-gil Lee Jongyoon Song Jaehyeon Kim Sungroh Yoon

EMI: Exploration with Mutual Information.

Hyoungseok Kim Jaekyeom Kim Yeonwoo Jeong Sergey Levine Hyun Oh Song

Geometry Aware Convolutional Filters for Omnidirectional Images Representation.

Renata Khasanova Pascal Frossard

Collaborative Evolutionary Reinforcement Learning.

Shauharda Khadka Somdeb Majumdar Tarek Nassar Zach Dwiel Evren Tumer Santiago Miret Yinyin Liu Kagan Tumer

CHiVE: Varying Prosody in Speech Synthesis with a Linguistically Driven Dynamic Hierarchical Conditional Variational Network.

Tom Kenter Vincent Wan Chun-an Chan Rob Clark Jakub Vit

Adaptive Scale-Invariant Online Algorithms for Learning Linear Models.

Michal Kempka Wojciech Kotlowski Manfred K. Warmuth

Submodular Streaming in All Its Glory: Tight Approximation, Minimum Memory and Low Adaptive Complexity.

Ehsan Kazemi Marko Mitrovic Morteza Zadimoghaddam Silvio Lattanzi Amin Karbasi

Shallow-Deep Networks: Understanding and Mitigating Network Overthinking.

Yigitcan Kaya Sanghyun Hong Tudor Dumitras

Robust Estimation of Tree Structured Gaussian Graphical Models.

Ashish Katiyar Jessica Hoffmann Constantine Caramanis

Processing Megapixel Images with Deep Attention-Sampling Models.

Angelos Katharopoulos François Fleuret

Neural Inverse Knitting: From Images to Manufacturing Instructions.

Alexandre Kaspar Tae-Hyun Oh Liane Makatura Petr Kellnhofer Wojciech Matusik

Riemannian adaptive stochastic gradient algorithms on matrix manifolds.

Hiroyuki Kasai Pratik Jawanpuria Bamdev Mishra

Error Feedback Fixes SignSGD and other Gradient Compression Schemes.

Sai Praneeth Karimireddy Quentin Rebjock Sebastian U. Stich Martin Jaggi

Policy Consolidation for Continual Reinforcement Learning.

Christos Kaplanis Murray Shanahan Claudia Clopath

Differentially Private Learning of Geometric Concepts.

Haim Kaplan Yishay Mansour Yossi Matias Uri Stemmer

Myopic Posterior Sampling for Adaptive Goal Oriented Design of Experiments.

Kirthevasan Kandasamy Willie Neiswanger Reed Zhang Akshay Krishnamurthy Jeff Schneider Barnabás Póczos

Trainable Decoding of Sets of Sequences for Neural Sequence Models.

Ashwin Kalyan Peter Anderson Stefan Lee Dhruv Batra

Classifying Treatment Responders Under Causal Effect Monotonicity.

Nathan Kallus

Robust Influence Maximization for Hyperparametric Models.

Dimitris Kalimeris Gal Kaplun Yaron Singer

Molecular Hypergraph Grammar with Its Application to Molecular Optimization.

Hiroshi Kajino

Statistical Foundations of Virtual Democracy.

Anson Kahng Min Kyung Lee Ritesh Noothigattu Ariel D. Procaccia Christos-Alexandros Psomas

Bilinear Bandits with Low-rank Structure.

Kwang-Sung Jun Rebecca Willett Stephen J. Wright Robert D. Nowak

GOODE: A Gaussian Off-The-Shelf Ordinary Differential Equation Solver.

David John Vincent Heuveline Michael Schober

Kernel Mean Matching for Content Addressability of GANs.

Wittawat Jitkrittum Patsorn Sangkloy Muhammad Waleed Gondal Amit Raj James Hays Bernhard Schölkopf

Discovering Options for Exploration by Minimizing Cover Time.

Yuu Jinnai Jee Won Park David Abel George Dimitri Konidaris

Finding Options that Minimize Planning Time.

Yuu Jinnai David Abel David Ellis Hershkowitz Michael L. Littman George Dimitri Konidaris

Neural Logic Reinforcement Learning.

Zhengyao Jiang Shan Luo

Improved Zeroth-Order Variance Reduced Algorithms and Analysis for Nonconvex Optimization.

Kaiyi Ji Zhe Wang Yi Zhou Yingbin Liang

Learning Discrete and Continuous Factors of Data via Alternating Disentanglement.

Yeonwoo Jeong Hyun Oh Song

Training CNNs with Selective Allocation of Channels.

Jongheon Jeong Jinwoo Shin

Ladder Capsule Network.

Taewon Jeong Youngmin Lee Heeyoung Kim

Graph Neural Network for Music Score Data and Modeling Expressive Piano Performance.

Dasaem Jeong Taegyun Kwon Yoojin Kim Juhan Nam

A Deep Reinforcement Learning Perspective on Internet Congestion Control.

Nathan Jay Noga H. Rotman Brighten Godfrey Michael Schapira Aviv Tamar

Social Influence as Intrinsic Motivation for Multi-Agent Deep Reinforcement Learning.

Natasha Jaques Angeliki Lazaridou Edward Hughes Çaglar Gülçehre Pedro A. Ortega DJ Strouse Joel Z. Leibo Nando de Freitas

Learning What and Where to Transfer.

Yunhun Jang Hankook Lee Sung Ju Hwang Jinwoo Shin

DBSCAN++: Towards fast and scalable density clustering.

Jennifer Jang Heinrich Jiang

Sum-of-Squares Polynomial Flow.

Priyank Jaini Kira A. Selby Yaoliang Yu

Differentially Private Fair Learning.

Matthew Jagielski Michael J. Kearns Jieming Mao Alina Oprea Aaron Roth Saeed Sharifi-Malvajerdi Jonathan R. Ullman

Learning from a Learner.

Alexis Jacq Matthieu Geist Ana Paiva Olivier Pietquin

Causal Identification under Markov Equivalence: Completeness Results.

Amin Jaber Jiji Zhang Elias Bareinboim

Complementary-Label Learning for Arbitrary Losses and Models.

Takashi Ishida Gang Niu Aditya Krishna Menon Masashi Sugiyama

Actor-Attention-Critic for Multi-Agent Reinforcement Learning.

Shariq Iqbal Fei Sha

Phase transition in PCA with missing data: Reduced signal-to-noise ratio, not sample size!

Niels Bruun Ipsen Lars Kai Hansen

Learning Structured Decision Problems with Unawareness.

Craig Innes Alex Lascarides

Overcoming Mean-Field Approximations in Recurrent Gaussian Process Models.

Alessandro Davide Ialongo Mark van der Wilk James Hensman Carl Edward Rasmussen

HexaGAN: Generative Adversarial Nets for Real World Classification.

Uiwon Hwang Dahuin Jung Sungroh Yoon

Composing Entropic Policies using Divergence Correction.

Jonathan J. Hunt André Barreto Timothy P. Lillicrap Nicolas Heess

Causal Discovery and Forecasting in Nonstationary Environments with State-Space Models.

Biwei Huang Kun Zhang Mingming Gong Clark Glymour

Addressing the Loss-Metric Mismatch with Adaptive Loss Alignment.

Chen Huang Shuangfei Zhai Walter Talbott Miguel Ángel Bautista Shih-Yu Sun Carlos Guestrin Joshua M. Susskind

Stable and Fair Classification.

Lingxiao Huang Nisheeth K. Vishnoi

Hierarchical Importance Weighted Autoencoders.

Chin-Wei Huang Kris Sankaran Eeshan Dhekane Alexandre Lacoste Aaron C. Courville

Detecting Overlapping and Correlated Communities without Pure Nodes: Identifiability and Algorithm.

Kejun Huang Xiao Fu

Unsupervised Deep Learning by Neighbourhood Discovery.

Jiabo Huang Qi Dong Shaogang Gong Xiatian Zhu

Faster Stochastic Alternating Direction Method of Multipliers for Nonconvex Optimization.

Feihu Huang Songcan Chen Heng Huang

Bayesian Deconditional Kernel Mean Embeddings.

Kelvin Hsu Fabio Ramos

Classification from Positive, Unlabeled and Biased Negative Data.

Yu-Guan Hsieh Gang Niu Masashi Sugiyama

Finding Mixed Nash Equilibria of Generative Adversarial Networks.

Ya-Ping Hsieh Chen Liu Volkan Cevher

Stay With Me: Lifetime Maximization Through Heteroscedastic Linear Bandits With Reneging.

Ping-Chun Hsieh Xi Liu Anirban Bhattacharya P. R. Kumar

Parameter-Efficient Transfer Learning for NLP.

Neil Houlsby Andrei Giurgiu Stanislaw Jastrzebski Bruna Morrone Quentin de Laroussilhe Andrea Gesmundo Mona Attariyan Sylvain Gelly

Nonconvex Variance Reduced Optimization with Arbitrary Sampling.

Samuel Horváth Peter Richtárik

Emerging Convolutions for Generative Normalizing Flows.

Emiel Hoogeboom Rianne van den Berg Max Welling

Better generalization with less data using robust gradient descent.

Matthew J. Holland Kazushi Ikeda

Connectivity-Optimized Representation Learning via Persistent Homology.

Christoph D. Hofer Roland Kwitt Marc Niethammer Mandar Dixit

Collective Model Fusion for Multiple Black-Box Experts.

Quang Minh Hoang Trong Nghia Hoang Bryan Kian Hsiang Low Carl Kingsford

Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules.

Daniel Ho Eric Liang Xi Chen Ion Stoica Pieter Abbeel

Flow++: Improving Flow-Based Generative Models with Variational Dequantization and Architecture Design.

Jonathan Ho Xi Chen Aravind Srinivas Yan Duan Pieter Abbeel

Using Pre-Training Can Improve Model Robustness and Uncertainty.

Dan Hendrycks Kimin Lee Mantas Mazeika

Graph Resistance and Learning from Pairwise Comparisons.

Julien M. Hendrickx Alexander Olshevsky Venkatesh Saligrama

On the Long-term Impact of Algorithmic Decision Policies: Effort Unfairness and Feature Segregation through Social Learning.

Hoda Heidari Vedant Nanda Krishna P. Gummadi

Provably Efficient Maximum Entropy Exploration.

Elad Hazan Sham M. Kakade Karan Singh Abby Van Soest

On the Impact of the Activation function on Deep Neural Networks Training.

Soufiane Hayou Arnaud Doucet Judith Rousseau

Understanding and Controlling Memory in Recurrent Neural Networks.

Doron Haviv Alexander Rivkind Omri Barak

Submodular Observation Selection and Information Gathering for Quadratic Models.

Abolfazl Hashemi Mahsa Ghasemi Haris Vikalo Ufuk Topcu

Per-Decision Option Discounting.

Anna Harutyunyan Peter Vrancx Philippe Hamel Ann Nowé Doina Precup

Submodular Maximization beyond Non-negativity: Guarantees, Fast Algorithms, and Applications.

Chris Harshaw Moran Feldman Justin Ward Amin Karbasi

Random Shuffling Beats SGD after Finite Epochs.

Jeff Z. HaoChen Suvrit Sra

Doubly-Competitive Distribution Estimation.

Yi Hao Alon Orlitsky

Importance Sampling Policy Evaluation with an Estimated Behavior Policy.

Josiah Hanna Scott Niekum Peter Stone

Complexity of Linear Regions in Deep Networks.

Boris Hanin David Rolnick

Dimension-Wise Importance Sampling Weight Clipping for Sample-Efficient Reinforcement Learning.

Seungyul Han Youngchul Sung

Grid-Wise Control for Multi-Agent Reinforcement Learning in Video Game AI.

Lei Han Peng Sun Yali Du Jiechao Xiong Qing Wang Xinghai Sun Han Liu Tong Zhang

Neural Separation of Observed and Unobserved Distributions.

Tavi Halperin Ariel Ephrat Yedid Hoshen

Learning Latent Dynamics for Planning from Pixels.

Danijar Hafner Timothy P. Lillicrap Ian Fischer Ruben Villegas David Ha Honglak Lee James Davidson

Trading Redundancy for Communication: Speeding up Distributed SGD for Non-convex Optimization.

Farzin Haddadpour Mohammad Mahdi Kamani Mehrdad Mahdavi Viveck R. Cadambe

On The Power of Curriculum Learning in Training Deep Networks.

Guy Hacohen Daphna Weinshall

IMEXnet A Forward Stable Deep Neural Network.

Eldad Haber Keegan Lensink Eran Treister Lars Ruthotto

Memory-Optimal Direct Convolutions for Maximizing Classification Accuracy in Embedded Applications.

Albert Gural Boris Murmann

Learning to Exploit Long-term Relational Dependencies in Knowledge Graphs.

Lingbing Guo Zequn Sun Wei Hu

Exploring interpretable LSTM neural networks over multi-variable data.

Tian Guo Tao Lin Nino Antulov-Fantulin

Simple Black-box Adversarial Attacks.

Chuan Guo Jacob R. Gardner Yurong You Andrew Gordon Wilson Kilian Q. Weinberger

Humor in Word Embeddings: Cockamamie Gobbledegook for Nincompoops.

Limor Gultchin Genevieve Patterson Nancy Baym Nathaniel Swinger Adam Kalai

An Investigation of Model-Free Planning.

Arthur Guez Mehdi Mirza Karol Gregor Rishabh Kabra Sébastien Racanière Theophane Weber David Raposo Adam Santoro Laurent Orseau Tom Eccles Greg Wayne David Silver Timothy P. Lillicrap

Towards a Deep and Unified Understanding of Deep Neural Models in NLP.

Chaoyu Guan Xiting Wang Quanshi Zhang Runjin Chen Di He Xing Xie

Fast Algorithm for Generalized Multinomial Models with Ranking Data.

Jiaqi Gu Guosheng Yin

Graphite: Iterative Generative Modeling of Graphs.

Aditya Grover Aaron Zweig Stefano Ermon

Multi-Object Representation Learning with Iterative Variational Inference.

Klaus Greff Raphaël Lopez Kaufman Rishabh Kabra Nick Watters Christopher Burgess Daniel Zoran Loic Matthey Matthew Botvinick Alexander Lerchner

Learning to Optimize Multigrid PDE Solvers.

Daniel Greenfeld Meirav Galun Ronen Basri Irad Yavneh Ron Kimmel

Automatic Posterior Transformation for Likelihood-Free Inference.

David S. Greenberg Marcel Nonnenmacher Jakob H. Macke

A Statistical Investigation of Long Memory in Language and Music.

Alexander Greaves-Tunnell Zaïd Harchaoui

Adaptive Sensor Placement for Continuous Spaces.

James A. Grant Alexis Boukouvalas Ryan-Rhys Griffiths David S. Leslie Sattar Vakili Enrique Munoz de Cote

Counterfactual Visual Explanations.

Yash Goyal Ziyan Wu Jan Ernst Dhruv Batra Devi Parikh Stefan Lee

Combining parametric and nonparametric models for off-policy evaluation.

Omer Gottesman Yao Liu Scott Sussex Emma Brunskill Finale Doshi-Velez

Obtaining Fairness using Optimal Transport Theory.

Paula Gordaliza Eustasio del Barrio Fabrice Gamboa Jean-Michel Loubes

Quantile Stein Variational Gradient Descent for Batch Bayesian Optimization.

ChengYue Gong Jian Peng Qiang Liu

Efficient Training of BERT by Progressively Stacking.

Linyuan Gong Di He Zhuohan Li Tao Qin Liwei Wang Tie-Yan Liu

The information-theoretic value of unlabeled data in semi-supervised learning.

Alexander Golovnev Dávid Pál Balázs Szörényi

Online Algorithms for Rent-Or-Buy with Expert Advice.

Sreenivas Gollapudi Debmalya Panigrahi

Amortized Monte Carlo Integration.

Adam Golinski Frank Wood Tom Rainforth

Estimating Information Flow in Deep Neural Networks.

Ziv Goldfeld Ewout van den Berg Kristjan H. Greenewald Igor Melnyk Nam Nguyen Brian Kingsbury Yury Polyanskiy

Discovering Conditionally Salient Features with Statistical Guarantees.

Jaime Roquero Gimenez James Y. Zou

Adversarial Examples Are a Natural Consequence of Test Error in Noise.

Justin Gilmer Nicolas Ford Nicholas Carlini Ekin D. Cubuk

Learning to Groove with Inverse Sequence Transformations.

Jon Gillick Adam Roberts Jesse H. Engel Douglas Eck David Bamman

A Tree-Based Method for Fast Repeated Sampling of Determinantal Point Processes.

Jennifer Gillenwater Alex Kulesza Zelda Mariet Sergei Vassilvitskii

Efficient Dictionary Learning with Gradient Descent.

Dar Gilboa Sam Buchanan John Wright

Data Shapley: Equitable Valuation of Data for Machine Learning.

Amirata Ghorbani James Y. Zou

An Investigation into Neural Net Optimization via Hessian Eigenvalue Density.

Behrooz Ghorbani Shankar Krishnan Ying Xiao

An Instability in Variational Inference for Topic Models.

Behrooz Ghorbani Hamid Javadi Andrea Montanari

Recursive Sketches for Modular Deep Learning.

Badih Ghazi Rina Panigrahy Joshua R. Wang

Improved Parallel Algorithms for Density-Based Network Clustering.

Mohsen Ghaffari Silvio Lattanzi Slobodan Mitrovic

Learning and Data Selection in Big Datasets.

Hossein Shokri Ghadikolaei Hadi G. Ghauch Carlo Fischione Mikael Skoglund

Partially Linear Additive Gaussian Graphical Models.

Sinong Geng Minhao Yan Mladen Kolar Sanmi Koyejo

DeepMDP: Learning Continuous Latent Space Models for Representation Learning.

Carles Gelada Saurabh Kumar Jacob Buckman Ofir Nachum Marc G. Bellemare

A Theory of Regularized Markov Decision Processes.

Matthieu Geist Bruno Scherrer Olivier Pietquin

SelectiveNet: A Deep Neural Network with an Integrated Reject Option.

Yonatan Geifman Ran El-Yaniv

Optimal Mini-Batch and Step Sizes for SAGA.

Nidham Gazagnadou Robert M. Gower Joseph Salmon

Multi-Frequency Phase Synchronization.

Tingran Gao Zhizhen Zhao

Geometric Scattering for Graph Data Analysis.

Feng Gao Guy Wolf Matthew J. Hirn

Demystifying Dropout.

Hongchang Gao Jian Pei Heng Huang

Rate Distortion For Model Compression: From Theory To Practice.

Weihao Gao Yu-Han Liu Chong Wang Sewoong Oh

Deep Generative Learning via Variational Gradient Flow.

Yuan Gao Yuling Jiao Yang Wang Yao Wang Can Yang Shunkang Zhang

Graph U-Nets.

Hongyang Gao Shuiwang Ji

Breaking the Softmax Bottleneck via Learnable Monotonic Pointwise Non-linearities.

Octavian Ganea Sylvain Gelly Gary Bécigneul Aliaksei Severyn

Transfer Learning for Related Reinforcement Learning Tasks via Image-to-Image Translation.

Shani Gamrian Yoav Goldberg

Off-Policy Deep Reinforcement Learning without Exploration.

Scott Fujimoto David Meger Doina Precup

Beyond Adaptive Submodularity: Approximation Guarantees of Greedy Policy with Adaptive Submodularity Ratio.

Kaito Fujii Shinsaku Sakaue

MetricGAN: Generative Adversarial Networks based Black-box Metric Scores Optimization for Speech Enhancement.

Szu-Wei Fu Chien-Feng Liao Yu Tsao Shou-De Lin

Diagnosing Bottlenecks in Deep Q-learning Algorithms.

Justin Fu Aviral Kumar Matthew Soh Sergey Levine

Analyzing and Improving Representations with the Soft Nearest Neighbor Loss.

Nicholas Frosst Nicolas Papernot Geoffrey E. Hinton

Fast and Flexible Inference of Joint Distributions from their Marginals.

Charlie Frogner Tomaso A. Poggio

Approximating Orthogonal Matrices with Effective Givens Factorization.

Thomas Frerix Joan Bruna

Distributional Multivariate Policy Evaluation and Exploration with the Bellman GAN.

Dror Freirich Tzahi Shimkin Ron Meir Aviv Tamar

Learning Discrete Structures for Graph Neural Networks.

Luca Franceschi Mathias Niepert Massimiliano Pontil Xiao He

On discriminative learning of prediction uncertainty.

Vojtech Franc Daniel Prusa

Scalable Nonparametric Sampling from Multimodal Posteriors with the Posterior Bootstrap.

Edwin Fong Simon Lyddon Chris C. Holmes

Bayesian Action Decoder for Deep Multi-Agent Reinforcement Learning.

Jakob N. Foerster H. Francis Song Edward Hughes Neil Burch Iain Dunning Shimon Whiteson Matthew Botvinick Michael Bowling

DL2: Training and Querying Neural Networks with Logic.

Marc Fischer Mislav Balunovic Dana Drachsler-Cohen Timon Gehr Ce Zhang Martin T. Vechev

Online Meta-Learning.

Chelsea Finn Aravind Rajeswaran Sham M. Kakade Sergey Levine

Almost surely constrained convex optimization.

Olivier Fercoq Ahmet Alacaoglu Ion Necoara Volkan Cevher

Decentralized Exploration in Multi-Armed Bandits.

Raphaël Féraud Réda Alami Romain Laroche

The advantages of multiple classes for reducing overfitting from test set reuse.

Vitaly Feldman Roy Frostig Moritz Hardt

Invariant-Equivariant Representation Learning for Multi-Class Data.

Ilya Feige

Dead-ends and Secure Exploration in Reinforcement Learning.

Mehdi Fatemi Shikhar Sharma Harm van Seijen Samira Ebrahimi Kahou

Regret Circuits: Composability of Regret Minimizers.

Gabriele Farina Christian Kroer Tuomas Sandholm

Stable-Predictive Optimistic Counterfactual Regret Minimization.

Gabriele Farina Christian Kroer Noam Brown Tuomas Sandholm

Multi-Frequency Vector Diffusion Maps.

Yifeng Fan Zhizhen Zhao

Non-monotone Submodular Maximization with Nearly Optimal Adaptivity and Query Complexity.

Matthew Fahrbach Vahab S. Mirrokni Morteza Zadimoghaddam

On the Connection Between Adversarial Robustness and Saliency Map Interpretability.

Christian Etmann Sebastian Lunz Peter Maass Carola Schönlieb

Cross-Domain 3D Equivariant Image Embeddings.

Carlos Esteves Avneesh Sud Zhengyi Luo Kostas Daniilidis Ameesh Makadia

Exploring the Landscape of Spatial Robustness.

Logan Engstrom Brandon Tran Dimitris Tsipras Ludwig Schmidt Aleksander Madry

Improved Convergence for $\ell_1$ and $\ell_∞$ Regression via Iteratively Reweighted Least Squares.

Alina Ene Adrian Vladu

Sequential Facility Location: Approximate Submodularity and Greedy Algorithm.

Ehsan Elhamifar

GDPP: Learning Diverse Generations using Determinantal Point Processes.

Mohamed Elfeki Camille Couprie Morgane Rivière Mohamed Elhoseiny

Semi-Cyclic Stochastic Gradient Descent.

Hubert Eichner Tomer Koren Brendan McMahan Nathan Srebro Kunal Talwar

Imitating Latent Policies from Observation.

Ashley D. Edwards Himanshu Sahni Yannick Schroecker Charles L. Isbell Jr.

Band-limited Training and Inference for Convolutional Neural Networks.

Adam Dziedzic John Paparrizos Sanjay Krishnan Aaron J. Elmore Michael J. Franklin

Autoregressive Energy Machines.

Conor Durkan Charlie Nash

Learning interpretable continuous-time models of latent stochastic dynamical systems.

Lea Duncker Gergo Bohner Julien Boussard Maneesh Sahani

Wasserstein of Wasserstein Loss for Learning Generative Models.

Yonatan Dukler Wuchen Li Alex Tong Lin Guido Montúfar

Optimal Auctions through Deep Learning.

Paul Duetting Zhe Feng Harikrishna Narasimhan David C. Parkes Sai Srivatsa Ravindranath

Task-Agnostic Dynamics Priors for Deep Reinforcement Learning.

Yilun Du Karthik Narasimhan

Incorporating Grouping Information into Bayesian Decision Tree Ensembles.

Junliang Du Antonio R. Linero

Gradient Descent Finds Global Minima of Deep Neural Networks.

Simon S. Du Jason D. Lee Haochuan Li Liwei Wang Xiyu Zhai

Provably efficient RL with Rich Observations via Latent State Decoding.

Simon S. Du Akshay Krishnamurthy Nan Jiang Alekh Agarwal Miroslav Dudík John Langford

Width Provably Matters in Optimization for Deep Linear Neural Networks.

Simon S. Du Wei Hu

Generalized No Free Lunch Theorem for Adversarial Robustness.

Elvis Dohmatob

Trajectory-Based Off-Policy Deep Reinforcement Learning.

Andreas Doerr Michael Volpp Marc Toussaint Sebastian Trimpe Christian Daniel

Finite-Time Analysis of Distributed TD(0) with Linear Function Approximation on Multi-Agent Reinforcement Learning.

Thinh T. Doan Siva Theja Maguluri Justin Romberg

Noisy Dual Principal Component Pursuit.

Tianyu Ding Zhihui Zhu Tianjiao Ding Yunchen Yang Daniel P. Robinson Manolis C. Tsakiris René Vidal

Approximated Oracle Filter Pruning for Destructive CNN Width Optimization.

Xiaohan Ding Guiguang Ding Yuchen Guo Jungong Han Chenggang Yan

Sever: A Robust Meta-Algorithm for Stochastic Optimization.

Ilias Diakonikolas Gautam Kamath Daniel Kane Jerry Li Jacob Steinhardt Alistair Stewart

Learning to Convolve: A Generalized Weight-Tying Approach.

Nichita Diaconu Daniel E. Worrall

A Multitask Multiple Kernel Learning Algorithm for Survival Analysis with Application to Cancer Biology.

Onur Dereli Ceyda Oguz Mehmet Gönen

Learning-to-Learn Stochastic Gradient Descent with Biased Regularization.

Giulia Denevi Carlo Ciliberto Riccardo Grazzi Massimiliano Pontil

Stochastic Deep Networks.

Gwendoline de Bie Gabriel Peyré Marco Cuturi

Teaching a black-box learner.

Sanjoy Dasgupta Daniel Hsu Stefanos Poulis Xiaojin Zhu

TarMAC: Targeted Multi-Agent Communication.

Abhishek Das Théophile Gervet Joshua Romoff Dhruv Batra Devi Parikh Mike Rabbat Joelle Pineau

A Kernel Theory of Modern Data Augmentation.

Tri Dao Albert Gu Alexander Ratner Virginia Smith Chris De Sa Christopher Ré

Learning Fast Algorithms for Linear Transforms Using Butterfly Factorizations.

Tri Dao Albert Gu Matthew Eichhorn Atri Rudra Christopher Ré

Policy Certificates: Towards Accountable Reinforcement Learning.

Christoph Dann Lihong Li Wei Wei Emma Brunskill

Bayesian Optimization Meets Bayesian Optimal Stopping.

Zhongxiang Dai Haibin Yu Bryan Kian Hsiang Low Patrick Jaillet

The Value Function Polytope in Reinforcement Learning.

Robert Dadashi Marc G. Bellemare Adrien Ali Taïga Nicolas Le Roux Dale Schuurmans

Open Vocabulary Learning on Source Code with a Graph-Structured Cache.

Milan Cvitkovic Badal Singh Animashree Anandkumar

Minimal Achievable Sufficient Statistic Learning.

Milan Cvitkovic Günther Koliander

Matrix-Free Preconditioning in Online Learning.

Ashok Cutkosky Tamás Sarlós

Anytime Online-to-Batch, Optimism and Acceleration.

Ashok Cutkosky

Flexibly Fair Representation Learning by Disentanglement.

Elliot Creager David Madras Jörn-Henrik Jacobsen Marissa A. Weis Kevin Swersky Toniann Pitassi Richard S. Zemel

Submodular Cost Submodular Cover with an Approximate Oracle.

Victoria G. Crawford Alan Kuhnle My T. Thai

Boosted Density Estimation Remastered.

Zac Cranko Richard Nock

Monge blunts Bayes: Hardness Results for Adversarial Training.

Zac Cranko Aditya Krishna Menon Richard Nock Cheng Soon Ong Zhan Shi Christian J. Walder

Training Well-Generalizing Classifiers for Fairness Metrics and Other Data-Dependent Constraints.

Andrew Cotter Maya R. Gupta Heinrich Jiang Nathan Srebro Karthik Sridharan Serena Wang Blake E. Woodworth Seungil You

Shape Constraints for Set Functions.

Andrew Cotter Maya R. Gupta Heinrich Jiang Erez Louidor James Muller Taman Narayan Serena Wang Tao Zhu

Active Learning with Disagreement Graphs.

Corinna Cortes Giulia DeSalvo Mehryar Mohri Ningshan Zhang Claudio Gentile

Online Learning with Sleeping Experts and Feedback Graphs.

Corinna Cortes Giulia DeSalvo Claudio Gentile Mehryar Mohri Scott Yang

Adjustment Criteria for Generalizing Experimental Findings.

Juan D. Correa Jin Tian Elias Bareinboim

Scalable Metropolis-Hastings for Exact Bayesian Inference with Large Datasets.

Robert Cornish Paul Vanetti Alexandre Bouchard-Côté George Deligiannidis Arnaud Doucet

A fully differentiable beam search decoder.

Ronan Collobert Awni Y. Hannun Gabriel Synnaeve

CURIOUS: Intrinsically Motivated Modular Multi-Goal Reinforcement Learning.

Cédric Colas Pierre-Yves Oudeyer Olivier Sigaud Pierre Fournier Mohamed Chetouani

Gauge Equivariant Convolutional Networks and the Icosahedral CNN.

Taco Cohen Maurice Weiler Berkay Kicanaoglu Max Welling

Certified Adversarial Robustness via Randomized Smoothing.

Jeremy M. Cohen Elan Rosenfeld J. Zico Kolter

Learning Linear-Quadratic Regulators Efficiently with only √T Regret.

Alon Cohen Tomer Koren Yishay Mansour

Empirical Analysis of Beam Search Performance Degradation in Neural Sequence Models.

Eldan Cohen J. Christopher Beck

Quantifying Generalization in Reinforcement Learning.

Karl Cobbe Oleg Klimov Christopher Hesse Taehoon Kim John Schulman

On Medians of (Randomized) Pairwise Means.

Stéphan Clémençon Pierre Laforgue Patrice Bertail

Dimensionality Reduction for Tukey Regression.

Kenneth L. Clarkson Ruosong Wang David P. Woodruff

Sensitivity Analysis of Linear Structural Causal Models.

Carlos Cinelli Daniel Kumor Bryant Chen Judea Pearl Elias Bareinboim

New results on information theoretic clustering.

Ferdinando Cicalese Eduardo Sany Laber Lucas Murtinho

Weak Detection of Signal in the Spiked Wigner Model.

Hye Won Chung Ji Oon Lee

MeanSum: A Neural Model for Unsupervised Multi-Document Abstractive Summarization.

Eric Chu Peter J. Liu

Probability Functional Descent: A Unifying Perspective on GANs, Variational Inference, and Reinforcement Learning.

Casey Chu Jose H. Blanchet Peter W. Glynn

Unifying Orthogonal Monte Carlo Methods.

Krzysztof Choromanski Mark Rowland Wenyu Chen Adrian Weller

Beyond Backprop: Online Alternating Minimization with Auxiliary Variables.

Anna Choromanska Benjamin Cowen Sadhana Kumaravel Ronny Luss Mattia Rigotti Irina Rish Paolo Diachille Viatcheslav Gurev Brian Kingsbury Ravi Tejwani Djallel Bouneffouf

Neural Joint Source-Channel Coding.

Kristy Choi Kedar Tatwawadi Aditya Grover Tsachy Weissman Stefano Ermon

Random Walks on Hypergraphs with Edge-Dependent Vertex Weights.

Uthsav Chitra Benjamin J. Raphael

Variational Inference for sparse network reconstruction from count data.

Julien Chiquet Stéphane Robin Mahendra Mariadassou

Predictor-Corrector Policy Optimization.

Ching-An Cheng Xinyan Yan Nathan D. Ratliff Byron Boots

Control Regularization for Reduced Variance Reinforcement Learning.

Richard Cheng Abhinav Verma Gábor Orosz Swarat Chaudhuri Yisong Yue Joel Burdick

RaFM: Rank-Aware Factorization Machines.

Xiaoshuang Chen Yin Zheng Jiaxing Wang Wenye Ma Junzhou Huang

Robust Decision Trees Against Adversarial Examples.

Hongge Chen Huan Zhang Duane S. Boning Cho-Jui Hsieh

Multivariate-Information Adversarial Ensemble for Scalable Joint Distribution Matching.

Ziliang Chen Zhanfu Yang Xiaoxi Wang Xiaodan Liang Xiaopeng Yan Guanbin Li Liang Lin

Katalyst: Boosting Convex Katayusha for Non-Convex Problems with a Large Condition Number.

Zaiyi Chen Yi Xu Haoyuan Hu Tianbao Yang

Fast Incremental von Neumann Graph Entropy Computation: Theory, Algorithm, and Applications.

Pin-Yu Chen Lingfei Wu Sijia Liu Indika Rajapakse

Transferability vs. Discriminability: Batch Spectral Penalization for Adversarial Domain Adaptation.

Xinyang Chen Sinan Wang Mingsheng Long Jianmin Wang

A Gradual, Semi-Discrete Approach to Generative Network Training via Explicit Wasserstein Minimization.

Yucheng Chen Matus Telgarsky Chao Zhang Bolton Bailey Daniel Hsu Jian Peng

Understanding and Utilizing Deep Neural Networks Trained with Noisy Labels.

Pengfei Chen Benben Liao Guangyong Chen Shengyu Zhang

Generative Adversarial User Model for Reinforcement Learning Based Recommendation System.

Xinshi Chen Shuang Li Hui Li Shaohua Jiang Yuan Qi Le Song

Information-Theoretic Considerations in Batch Reinforcement Learning.

Jinglin Chen Nan Jiang

Proportionally Fair Clustering.

Xingyu Chen Brandon Fain Liang Lyu Kamesh Munagala

Particle Flow Bayes' Rule.

Xinshi Chen Hanjun Dai Le Song

Stein Point Markov Chain Monte Carlo.

Wilson Ye Chen Alessandro Barp François-Xavier Briol Jackson Gorham Mark A. Girolami Lester W. Mackey Chris J. Oates

Nearest Neighbor and Kernel Survival Analysis: Nonasymptotic Error Bounds and Strong Consistency Rates.

George H. Chen

PAC Identification of Many Good Arms in Stochastic Multi-Armed Bandits.

Arghya Roy Chaudhuri Shivaram Kalyanakrishnan

Neural Network Attributions: A Causal Perspective.

Aditya Chattopadhyay Piyushi Manupriya Anirban Sarkar Vineeth N. Balasubramanian

Online learning with kernel losses.

Niladri S. Chatterji Aldo Pacchiano Peter L. Bartlett

On Symmetric Losses for Learning from Corrupted Labels.

Nontawat Charoenphakdee Jongyeong Lee Masashi Sugiyama

Dynamic Measurement Scheduling for Event Forecasting using Deep RL.

Chun-Hao Chang Mingjie Mai Anna Goldenberg

Learning Action Representations for Reinforcement Learning.

Yash Chandak Georgios Theocharous James Kostas Scott M. Jordan Philip S. Thomas

Automated Model Selection with Bayesian Quadrature.

Henry Chai Jean-Francois Ton Michael A. Osborne Roman Garnett

Competing Against Nash Equilibria in Adversarially Changing Zero-Sum Games.

Adrian Rivera Cardoso Jacob D. Abernethy He Wang Huan Xu

Dynamic Learning with Frequent New Product Launches: A Sequential Multinomial Logit Bandit Problem.

Junyu Cao Wei Sun

Active Embedding Search via Noisy Paired Comparisons.

Gregory Canal Andrew K. Massimino Mark A. Davenport Christopher J. Rozell

Accelerated Linear Convergence of Stochastic Momentum Methods in Wasserstein Distances.

Bugra Can Mert Gürbüzbalaban Lingjiong Zhu

A Quantitative Analysis of the Effect of Batch Normalization on Gradient Descent.

Yongqiang Cai Qianxiao Li Zuowei Shen

What is the Effect of Importance Weighting in Deep Learning?

Jonathon Byrd Zachary Chase Lipton

Rates of Convergence for Sparse Variational Gaussian Process Regression.

David R. Burt Carl Edward Rasmussen Mark van der Wilk

Learning Generative Models across Incomparable Spaces.

Charlotte Bunne David Alvarez-Melis Andreas Krause Stefanie Jegelka

Self-similar Epochs: Value in arrangement.

Eliav Buchnik Edith Cohen Avinatan Hassidim Yossi Matias

Adversarial examples from computational constraints.

Sébastien Bubeck Yin Tat Lee Eric Price Ilya P. Razenshteyn

Why do Larger Models Generalize Better? A Theoretical Perspective via the XOR Problem.

Alon Brutzkus Amir Globerson

Low Latency Privacy Preserving Inference.

Alon Brutzkus Ran Gilad-Bachrach Oren Elisha

Understanding the Origins of Bias in Word Embeddings.

Marc-Etienne Brunet Colleen Alkalay-Houlihan Ashton Anderson Richard S. Zemel

Deep Counterfactual Regret Minimization.

Noam Brown Adam Lerer Sam Gross Tuomas Sandholm

Extrapolating Beyond Suboptimal Demonstrations via Inverse Reinforcement Learning from Observations.

Daniel S. Brown Wonjoon Goo Prabhat Nagarajan Scott Niekum

Conditioning by adaptive sampling for robust design.

David H. Brookes Hahnbeom Park Jennifer Listgarten

Active Manifolds: A non-linear analogue to Active Subspaces.

Robert A. Bridges Anthony D. Gruber Christopher Felder Miki E. Verma Chelsey Hoff

Target Tracking for Contextual Bandits: Application to Demand Side Management.

Margaux Brégère Pierre Gaillard Yannig Goude Gilles Stoltz

Coresets for Ordered Weighted Clustering.

Vladimir Braverman Shaofeng H.-C. Jiang Robert Krauthgamer Xuan Wu

Blended Conditonal Gradients.

Gábor Braun Sebastian Pokutta Dan Tu Stephen J. Wright

Unreproducible Research is Reproducible.

Xavier Bouthillier César Laurent Pascal Vincent

Compositional Fairness Constraints for Graph Embeddings.

Avishek Joey Bose William L. Hamilton

Online Variance Reduction with Mixtures.

Zalán Borsos Sebastian Curi Kfir Yehuda Levy Andreas Krause

Adversarial Attacks on Node Embeddings via Graph Poisoning.

Aleksandar Bojchevski Stephan Günnemann

Correlated bandits or: How to minimize mean-squared error online.

Vinay Praneeth Boda Prashanth L. A.

Rethinking Lossy Compression: The Rate-Distortion-Perception Tradeoff.

Yochai Blau Tomer Michaeli

A Kernel Perspective for Regularizing Deep Neural Networks.

Alberto Bietti Grégoire Mialon Dexiong Chen Julien Mairal

More Efficient Off-Policy Evaluation through Regularized Targeted Learning.

Aurélien Bibaut Ivana Malenica Nikos Vlassis Mark J. van der Laan

Optimal Continuous DR-Submodular Maximization and Applications to Provable Mean Field Inference.

Yatao An Bian Joachim M. Buhmann Andreas Krause

Analyzing Federated Learning through an Adversarial Lens.

Arjun Nitin Bhagoji Supriyo Chakraborty Prateek Mittal Seraphin B. Calo

Bandit Multiclass Linear Classification: Efficient Algorithms for the Separable Case.

Alina Beygelzimer Dávid Pál Balázs Szörényi Devanathan Thiruvenkatachari Chen-Yu Wei Chicheng Zhang

Adversarially Learned Representations for Information Obfuscation and Inference.

Martín Bertrán Natalia Martínez Afroditi Papadaki Qiang Qiu Miguel R. D. Rodrigues Galen Reeves Guillermo Sapiro

Optimal Kronecker-Sum Approximation of Real Time Recurrent Learning.

Frederik Benzing Marcelo Matheus Gauy Asier Mujika Anders Martinsson Angelika Steger

Overcoming Multi-model Forgetting.

Yassine Benyahia Kaicheng Yu Kamil Bennani-Smires Martin Jaggi Anthony C. Davison Mathieu Salzmann Claudiu Musat

Greedy Layerwise Learning Can Scale To ImageNet.

Eugene Belilovsky Michael Eickenberg Edouard Oyallon

Invertible Residual Networks.

Jens Behrmann Will Grathwohl Ricky T. Q. Chen David Duvenaud Jörn-Henrik Jacobsen

Active Learning for Probabilistic Structured Prediction of Cuts and Matchings.

Sima Behpour Anqi Liu Brian D. Ziebart

Switching Linear Dynamics for Variational Bayes Filtering.

Philip Becker-Ehmck Jan Peters Patrick van der Smagt

Recurrent Kalman Networks: Factorized Inference in High-Dimensional Deep Feature Spaces.

Philipp Becker Harit Pandya Gregor H. W. Gebhardt Cheng Zhao C. James Taylor Gerhard Neumann

Efficient optimization of loops and limits with randomized telescoping sums.

Alex Beatson Ryan P. Adams

Noise2Self: Blind Denoising by Self-Supervision.

Joshua Batson Loïc Royer

Categorical Feature Compression via Submodular Optimization.

MohammadHossein Bateni Lin Chen Hossein Esfandiari Thomas Fu Vahab S. Mirrokni Afshin Rostamizadeh

Pareto Optimal Streaming Unsupervised Classification.

Soumya Basu Steven Gutstein Brent Lance Sanjay Shakkottai

Scale-free adaptive planning for deterministic dynamics & discounted rewards.

Peter L. Bartlett Victor Gabillon Jennifer Healey Michal Valko

A Personalized Affective Memory Model for Improving Emotion Recognition.

Pablo V. A. Barros German Ignacio Parisi Stefan Wermter

Learning to Route in Similarity Graphs.

Dmitry Baranchuk Dmitry Persiyanov Anton Sinitsin Artem Babenko

Structured agents for physical construction.

Victor Bapst Alvaro Sanchez-Gonzalez Carl Doersch Kimberly L. Stachenfeld Pushmeet Kohli Peter W. Battaglia Jessica B. Hamrick

HOList: An Environment for Machine Learning of Higher Order Logic Theorem Proving.

Kshitij Bansal Sarah M. Loos Markus N. Rabe Christian Szegedy Stewart Wilcox

Concrete Autoencoders: Differentiable Feature Selection and Reconstruction.

Muhammed Fatih Balin Abubakar Abid James Y. Zou

Open-ended learning in symmetric zero-sum games.

David Balduzzi Marta Garnelo Yoram Bachrach Wojciech Czarnecki Julien Pérolat Max Jaderberg Thore Graepel

Provable Guarantees for Gradient-Based Meta-Learning.

Maria-Florina Balcan Mikhail Khodak Ameet Talwalkar

Entropic GANs meet VAEs: A Statistical Approach to Compute Sample Likelihoods in GANs.

Yogesh Balaji Hamed Hassani Rama Chellappa Soheil Feizi

Scalable Fair Clustering.

Arturs Backurs Piotr Indyk Krzysztof Onak Baruch Schieber Ali Vakilian Tal Wagner

Beyond the Chinese Restaurant and Pitman-Yor processes: Statistical Models with double power-law behavior.

Fadhel Ayed Juho Lee Francois Caron

Feature Grouping as a Stochastic Regularizer for High-Dimensional Structured Data.

Sergül Aydöre Bertrand Thirion Gaël Varoquaux

Benefits and Pitfalls of the Exponential Mechanism with Applications to Hilbert Spaces and Functional PCA.

Jordan Awan Ana Kenney Matthew Reimherr Aleksandra B. Slavkovic

Linear-Complexity Data-Parallel Earth Mover's Distance Approximations.

Kubilay Atasu Thomas Mittelholzer

Bayesian Optimization of Composite Functions.

Raul Astudillo Peter I. Frazier

Stochastic Gradient Push for Distributed Deep Learning.

Mahmoud Assran Nicolas Loizou Nicolas Ballas Michael G. Rabbat

Distributed Weighted Matching via Randomized Composable Coresets.

Sepehr Assadi MohammadHossein Bateni Vahab S. Mirrokni

Fine-Grained Analysis of Optimization and Generalization for Overparameterized Two-Layer Neural Networks.

Sanjeev Arora Simon S. Du Wei Hu Zhiyuan Li Ruosong Wang

Unsupervised Label Noise Modeling and Loss Correction.

Eric Arazo Diego Ortego Paul Albert Noel E. O'Connor Kevin McGuinness

Sparse Multi-Channel Variational Autoencoder for the Joint Analysis of Heterogeneous Data.

Luigi Antelmi Nicholas Ayache Philippe Robert Marco Lorenzi

Sorting Out Lipschitz Function Approximation.

Cem Anil James Lucas Roger B. Grosse

Scaling Up Ordinal Embedding: A Landmark Approach.

Jesse Anderton Javed A. Aslam

Explaining Deep Neural Networks with a Polynomial Time Algorithm for Shapley Value Approximation.

Marco Ancona Cengiz Öztireli Markus H. Gross

Bounding User Contributions: A Bias-Variance Trade-off in Differential Privacy.

Kareem Amin Alex Kulesza Andres Muñoz Medina Sergei Vassilvitskii

Asynchronous Batch Bayesian Optimisation with Improved Local Penalisation.

Ahsan S. Alvi Bin Xin Ru Jan-Peter Calliess Stephen J. Roberts Michael A. Osborne

A Convergence Theory for Deep Learning via Over-Parameterization.

Zeyuan Allen-Zhu Yuanzhi Li Zhao Song

Infinite Mixture Prototypes for Few-shot Learning.

Kelsey R. Allen Evan Shelhamer Hanul Shin Joshua B. Tenenbaum

Analogies Explained: Towards Understanding Word Embeddings.

Carl Allen Timothy M. Hospedales

Graph Element Networks: adaptive, structured computation and memory.

Ferran Alet Adarsh Keshav Jeewajee Maria Bauzá Villalonga Alberto Rodriguez Tomás Lozano-Pérez Leslie Pack Kaelbling

Multi-objective training of Generative Adversarial Networks with multiple discriminators.

Isabela Albuquerque João Monteiro Thang Doan Breandan Considine Tiago H. Falk Ioannis Mitliagkas

Validating Causal Inference Models via Influence Functions.

Ahmed M. Alaa Mihaela van der Schaar

Projections for Approximate Policy Iteration Algorithms.

Riad Akrour Joni Pajarinen Jan Peters Gerhard Neumann

Adaptive Stochastic Natural Gradient Method for One-Shot Neural Architecture Search.

Youhei Akimoto Shinichi Shirakawa Nozomu Yoshinari Kento Uchida Shota Saito Kouhei Nishida

Fairwashing: the risk of rationalization.

Ulrich Aïvodji Hiromi Arai Olivier Fortineau Sébastien Gambs Satoshi Hara Alain Tapp

Understanding the Impact of Entropy on Policy Optimization.

Zafarali Ahmed Nicolas Le Roux Mohammad Norouzi Dale Schuurmans

The Kernel Interaction Trick: Fast Bayesian Discovery of Pairwise Interactions in High Dimensions.

Raj Agrawal Brian L. Trippe Jonathan H. Huggins Tamara Broderick

Learning to Generalize from Sparse and Underspecified Rewards.

Rishabh Agarwal Chen Liang Dale Schuurmans Mohammad Norouzi

Fair Regression: Quantitative Definitions and Reduction-Based Algorithms.

Alekh Agarwal Miroslav Dudík Zhiwei Steven Wu

Online Control with Adversarial Disturbances.

Naman Agarwal Brian Bullins Elad Hazan Sham M. Kakade Karan Singh

Efficient Full-Matrix Adaptive Regularization.

Naman Agarwal Brian Bullins Xinyi Chen Elad Hazan Karan Singh Cyril Zhang Yi Zhang

Static Automatic Batching In TensorFlow.

Ashish Agarwal

PAC Learnability of Node Functions in Networked Dynamical Systems.

Abhijin Adiga Chris J. Kuhlman Madhav Marathe S. S. Ravi Anil Vullikanti

TibGM: A Transferable and Information-Based Graphical Model Approach for Reinforcement Learning.

Tameem Adel Adrian Weller

Learning Models from Data with Measurement Error: Tackling Underreporting.

Roy Adams Yuelong Ji Xiaobin Wang Suchi Saria

Communication Complexity in Locally Private Distribution Estimation and Heavy Hitters.

Jayadev Acharya Ziteng Sun

Distributed Learning with Sublinear Communication.

Jayadev Acharya Chris De Sa Dylan J. Foster Karthik Sridharan

Communication-Constrained Inference and the Role of Shared Randomness.

Jayadev Acharya Clément L. Canonne Himanshu Tyagi

MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing.

Sami Abu-El-Haija Bryan Perozzi Amol Kapoor Nazanin Alipourfard Kristina Lerman Hrayr Harutyunyan Greg Ver Steeg Aram Galstyan

Dynamic Weights in Multi-Objective Deep Reinforcement Learning.

Axel Abels Diederik M. Roijers Tom Lenaerts Ann Nowé Denis Steckelmacher

AReS and MaRS Adversarial and MMD-Minimizing Regression for SDEs.

Gabriele Abbati Philippe Wenk Michael A. Osborne Andreas Krause Bernhard Schölkopf Stefan Bauer