ICLR 2021论文列表 - 9th International Conference on Learning Representations, ICLR 2021, Virtual Event, Austria, May 3-7, 2021.| 数据学习 (DataLearner)

ICLR 2021 论文列表

9th International Conference on Learning Representations, ICLR 2021, Virtual Event, Austria, May 3-7, 2021.

Evaluation of Neural Architectures trained with square Loss vs Cross-Entropy in Classification Tasks.

Like Hui Mikhail Belkin

Explainable Subgraph Reasoning for Forecasting on Temporal Knowledge Graphs.

Zhen Han Peng Chen Yunpu Ma Volker Tresp

Simple Spectral Graph Convolution.

Hao Zhu Piotr Koniusz

PolarNet: Learning to Optimize Polar Keypoints for Keypoint Based Object Detection.

Xiongwei Wu Doyen Sahoo Steven C. H. Hoi

Deconstructing the Regularization of BatchNorm.

Yann Dauphin Ekin Dogus Cubuk

Generative Scene Graph Networks.

Fei Deng Zhuo Zhi Donghun Lee Sungjin Ahn

Learnable Embedding sizes for Recommender Systems.

Siyi Liu Chen Gao Yihong Chen Depeng Jin Yong Li

Overfitting for Fun and Profit: Instance-Adaptive Data Compression.

Ties van Rozendaal Iris A. M. Huijben Taco Cohen

Acting in Delayed Environments with Non-Stationary Markov Policies.

Esther Derman Gal Dalal Shie Mannor

ARMOURED: Adversarially Robust MOdels using Unlabeled data by REgularizing Diversity.

Kangkang Lu Cuong Manh Nguyen Xun Xu Kiran Chari Yu Jing Goh Chuan-Sheng Foo

Solving Compositional Reinforcement Learning Problems via Task Reduction.

Yunfei Li Yilin Wu Huazhe Xu Xiaolong Wang Yi Wu

A Geometric Analysis of Deep Generative Image Models and Its Applications.

Binxu Wang Carlos R. Ponce

Fast and Complete: Enabling Complete Neural Network Verification with Rapid and Massively Parallel Incomplete Verifiers.

Kaidi Xu Huan Zhang Shiqi Wang Yihan Wang Suman Jana Xue Lin Cho-Jui Hsieh

Is Attention Better Than Matrix Decomposition?

Zhengyang Geng Meng-Hao Guo Hongxu Chen Xia Li Ke Wei Zhouchen Lin

Communication in Multi-Agent Reinforcement Learning: Intention Sharing.

Woojun Kim Jongeui Park Youngchul Sung

A Discriminative Gaussian Mixture Model with Sparsity.

Hideaki Hayashi Seiichi Uchida

Interpretable Neural Architecture Search via Bayesian Optimisation with Weisfeiler-Lehman Kernels.

Bin Xin Ru Xingchen Wan Xiaowen Dong Michael A. Osborne

New Bounds For Distributed Mean Estimation and Variance Reduction.

Peter Davies Vijaykrishna Gurunanthan Niusha Moshrefi Saleh Ashkboos Dan Alistarh

Certify or Predict: Boosting Certified Robustness with Compositional Architectures.

Mark Niklas Müller Mislav Balunovic Martin T. Vechev

Taming GANs with Lookahead-Minmax.

Tatjana Chavdarova Matteo Pagliardini Sebastian U. Stich François Fleuret Martin Jaggi

Bowtie Networks: Generative Modeling for Joint Few-Shot Recognition and Novel-View Synthesis.

Zhipeng Bao Yu-Xiong Wang Martial Hebert

Learning Subgoal Representations with Slow Dynamics.

Siyuan Li Lulu Zheng Jianhao Wang Chongjie Zhang

GAN2GAN: Generative Noise Learning for Blind Denoising with Single Noisy Images.

Sungmin Cha Taeeon Park Byeongjoon Kim Jongduk Baek Taesup Moon

CO2: Consistent Contrast for Unsupervised Visual Representation Learning.

Chen Wei Huiyu Wang Wei Shen Alan L. Yuille

CPR: Classifier-Projection Regularization for Continual Learning.

Sungmin Cha Hsiang Hsu Taebaek Hwang Flávio P. Calmon Taesup Moon

Fooling a Complete Neural Network Verifier.

Dániel Zombori Balázs Bánhelyi Tibor Csendes István Megyeri Márk Jelasity

Representation Learning via Invariant Causal Mechanisms.

Jovana Mitrovic Brian McWilliams Jacob C. Walker Lars Holger Buesing Charles Blundell

Interpreting and Boosting Dropout from a Game-Theoretic View.

Hao Zhang Sen Li Yinchao Ma Mingjie Li Yichen Xie Quanshi Zhang

BOIL: Towards Representation Change for Few-shot Learning.

Jaehoon Oh Hyungjun Yoo ChangHwan Kim Se-Young Yun

Generating Adversarial Computer Programs using Optimized Obfuscations.

Shashank Srikant Sijia Liu Tamara Mitrovska Shiyu Chang Quanfu Fan Gaoyuan Zhang Una-May O'Reilly

On the Curse of Memory in Recurrent Neural Networks: Approximation and Optimization Analysis.

Zhong Li Jiequn Han Weinan E Qianxiao Li

FOCAL: Efficient Fully-Offline Meta-Reinforcement Learning via Distance Metric Learning and Behavior Regularization.

Lanqing Li Rui Yang Dijun Luo

Seq2Tens: An Efficient Representation of Sequences by Low-Rank Tensor Projections.

Csaba Tóth Patric Bonnier Harald Oberhauser

Neural Jump Ordinary Differential Equations: Consistent Continuous-Time Prediction and Filtering.

Calypso Herrera Florian Krach Josef Teichmann

Hyperbolic Neural Networks++.

Ryohei Shimizu Yusuke Mukuta Tatsuya Harada

Parameter-Based Value Functions.

Francesco Faccio Louis Kirsch Jürgen Schmidhuber

Bayesian Few-Shot Classification with One-vs-Each Pólya-Gamma Augmented Gaussian Processes.

Jake Snell Richard S. Zemel

Spatially Structured Recurrent Modules.

Nasim Rahaman Anirudh Goyal Muhammad Waleed Gondal Manuel Wuthrich Stefan Bauer Yash Sharma Yoshua Bengio Bernhard Schölkopf

Teaching Temporal Logics to Neural Networks.

Christopher Hahn Frederik Schmitt Jens U. Kreber Markus Norman Rabe Bernd Finkbeiner

Robust Learning of Fixed-Structure Bayesian Networks in Nearly-Linear Time.

Yu Cheng Honghao Lin

Reset-Free Lifelong Learning with Skill-Space Planning.

Kevin Lu Aditya Grover Pieter Abbeel Igor Mordatch

TropEx: An Algorithm for Extracting Linear Terms in Deep Neural Networks.

Martin Trimmel Henning Petzka Cristian Sminchisescu

Adapting to Reward Progressivity via Spectral Reinforcement Learning.

Michael Dann John Thangarajah

Attentional Constellation Nets for Few-Shot Learning.

Weijian Xu Yifan Xu Huaijin Wang Zhuowen Tu

Decentralized Attribution of Generative Models.

Changhoon Kim Yi Ren Yezhou Yang

Randomized Ensembled Double Q-Learning: Learning Fast Without a Model.

Xinyue Chen Che Wang Zijian Zhou Keith W. Ross

Learning Value Functions in Deep Policy Gradients using Residual Variance.

Yannis Flet-Berliac Reda Ouhamma Odalric-Ambrym Maillard Philippe Preux

Knowledge Distillation as Semiparametric Inference.

Tri Dao Govinda M. Kamath Vasilis Syrgkanis Lester Mackey

Combining Physics and Machine Learning for Network Flow Estimation.

Arlei Lopes da Silva Furkan Kocayusufoglu Saber Jafarpour Francesco Bullo Ananthram Swami Ambuj K. Singh

Personalized Federated Learning with First Order Model Optimization.

Michael Zhang Karan Sapra Sanja Fidler Serena Yeung Jose M. Alvarez

Large Batch Simulation for Deep Reinforcement Learning.

Brennan Shacklett Erik Wijmans Aleksei Petrenko Manolis Savva Dhruv Batra Vladlen Koltun Kayvon Fatahalian

MetaNorm: Learning to Normalize Few-Shot Batches Across Domains.

Ying-Jun Du Xiantong Zhen Ling Shao Cees G. M. Snoek

Byzantine-Resilient Non-Convex Stochastic Gradient Descent.

Zeyuan Allen-Zhu Faeze Ebrahimianghazani Jerry Li Dan Alistarh

Accurate Learning of Graph Representations with Graph Multiset Pooling.

Jinheon Baek Minki Kang Sung Ju Hwang

NBDT: Neural-Backed Decision Tree.

Alvin Wan Lisa Dunlap Daniel Ho Jihan Yin Scott Lee Suzanne Petryk Sarah Adel Bargal Joseph E. Gonzalez

Estimating informativeness of samples with Smooth Unique Information.

Hrayr Harutyunyan Alessandro Achille Giovanni Paolini Orchid Majumder Avinash Ravichandran Rahul Bhotika Stefano Soatto

Estimating Lipschitz constants of monotone deep equilibrium models.

Chirag Pabbaraju Ezra Winston J. Zico Kolter

GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing.

Tao Yu Chien-Sheng Wu Xi Victoria Lin Bailin Wang Yi Chern Tan Xinyi Yang Dragomir R. Radev Richard Socher Caiming Xiong

Improving Zero-Shot Voice Style Transfer via Disentangled Representation Learning.

Siyang Yuan Pengyu Cheng Ruiyi Zhang Weituo Hao Zhe Gan Lawrence Carin

HyperDynamics: Meta-Learning Object and Agent Dynamics with Hypernetworks.

Zhou Xian Shamit Lal Hsiao-Yu Tung Emmanouil Antonios Platanios Katerina Fragkiadaki

Anytime Sampling for Autoregressive Models via Ordered Autoencoding.

Yilun Xu Yang Song Sahaj Garg Linyuan Gong Rui Shu Aditya Grover Stefano Ermon

Disentangling 3D Prototypical Networks for Few-Shot Concept Learning.

Mihir Prabhudesai Shamit Lal Darshan Patil Hsiao-Yu Tung Adam W. Harley Katerina Fragkiadaki

Implicit Under-Parameterization Inhibits Data-Efficient Deep Reinforcement Learning.

Aviral Kumar Rishabh Agarwal Dibya Ghosh Sergey Levine

Generating Furry Cars: Disentangling Object Shape and Appearance across Multiple Domains.

Utkarsh Ojha Krishna Kumar Singh Yong Jae Lee

Learning to Make Decisions via Submodular Regularization.

Ayya Alieva Aiden Aceves Jialin Song Stephen Mayo Yisong Yue Yuxin Chen

Adaptive and Generative Zero-Shot Learning.

Yu-Ying Chou Hsuan-Tien Lin Tyng-Luh Liu

CompOFA - Compound Once-For-All Networks for Faster Multi-Platform Deployment.

Manas Sahni Shreya Varshini Alind Khare Alexey Tumanov

Training BatchNorm and Only BatchNorm: On the Expressive Power of Random Features in CNNs.

Jonathan Frankle David J. Schwab Ari S. Morcos

Towards Resolving the Implicit Bias of Gradient Descent for Matrix Factorization: Greedy Low-Rank Learning.

Zhiyuan Li Yuping Luo Kaifeng Lyu

Batch Reinforcement Learning Through Continuation Method.

Yijie Guo Shengyu Feng Nicolas Le Roux Ed H. Chi Honglak Lee Minmin Chen

Class Normalization for (Continual)? Generalized Zero-Shot Learning.

Ivan Skorokhodov Mohamed Elhoseiny

VTNet: Visual Transformer Network for Object Goal Navigation.

Heming Du Xin Yu Liang Zheng

More or Less: When and How to Build Convolutional Neural Network Ensembles.

Abdul Wasay Stratos Idreos

Efficient Empowerment Estimation for Unsupervised Stabilization.

Ruihan Zhao Kevin Lu Pieter Abbeel Stas Tiomkin

SOLAR: Sparse Orthogonal Learned and Random Embeddings.

Tharun Medini Beidi Chen Anshumali Shrivastava

Combining Ensembles and Data Augmentation Can Harm Your Calibration.

Yeming Wen Ghassen Jerfel Rafael Muller Michael W. Dusenberry Jasper Snoek Balaji Lakshminarayanan Dustin Tran

Fourier Neural Operator for Parametric Partial Differential Equations.

Zongyi Li Nikola Borislavov Kovachki Kamyar Azizzadenesheli Burigede Liu Kaushik Bhattacharya Andrew M. Stuart Anima Anandkumar

Saliency is a Possible Red Herring When Diagnosing Poor Generalization.

Joseph D. Viviano Becks Simpson Francis Dutil Yoshua Bengio Joseph Paul Cohen

Provably robust classification of adversarial examples with detection.

Fatemeh Sheikholeslami Ali Lotfi J. Zico Kolter

SAFENet: A Secure, Accurate and Fast Neural Network Inference.

Qian Lou Yilin Shen Hongxia Jin Lei Jiang

Supervised Contrastive Learning for Pre-trained Language Model Fine-tuning.

Beliz Gunel Jingfei Du Alexis Conneau Veselin Stoyanov

Combining Label Propagation and Simple Models out-performs Graph Neural Networks.

Qian Huang Horace He Abhay Singh Ser-Nam Lim Austin R. Benson

Local Search Algorithms for Rank-Constrained Convex Optimization.

Kyriakos Axiotis Maxim Sviridenko

Pre-training Text-to-Text Transformers for Concept-centric Common Sense.

Wangchunshu Zhou Dong-Ho Lee Ravi Kiran Selvam Seyeon Lee Xiang Ren

Decoupling Global and Local Representations via Invertible Generative Flows.

Xuezhe Ma Xiang Kong Shanghang Zhang Eduard H. Hovy

SCoRe: Pre-Training for Context Representation in Conversational Semantic Parsing.

Tao Yu Rui Zhang Alex Polozov Christopher Meek Ahmed Hassan Awadallah

Evaluating the Disentanglement of Deep Generative Models through Manifold Topology.

Sharon Zhou Eric Zelikman Fred Lu Andrew Y. Ng Gunnar E. Carlsson Stefano Ermon

End-to-End Egospheric Spatial Memory.

Daniel James Lenton Stephen James Ronald Clark Andrew J. Davison

Bypassing the Ambient Dimension: Private SGD with Gradient Subspace Identification.

Yingxue Zhou Steven Wu Arindam Banerjee

BREEDS: Benchmarks for Subpopulation Shift.

Shibani Santurkar Dimitris Tsipras Aleksander Madry

PAC Confidence Predictions for Deep Neural Network Classifiers.

Sangdon Park Shuo Li Insup Lee Osbert Bastani

Dance Revolution: Long-Term Dance Generation with Music via Curriculum Learning.

Ruozi Huang Huang Hu Wei Wu Kei Sawada Mi Zhang Daxin Jiang

Sparse encoding for more-interpretable feature-selecting representations in probabilistic matrix factorization.

Joshua C. Chang Patrick Fletcher Jungmin Han Ted L. Chang Shashaank Vattikuti Bart Desmet Ayah Zirikly Carson C. Chow

Hopper: Multi-hop Transformer for Spatiotemporal Reasoning.

Honglu Zhou Asim Kadav Farley Lai Alexandru Niculescu-Mizil Martin Renqiang Min Mubbasir Kapadia Hans Peter Graf

Prediction and generalisation over directed actions by grid cells.

Changmin Yu Timothy Behrens Neil Burgess

Why resampling outperforms reweighting for correcting sampling bias with stochastic gradients.

Jing An Lexing Ying Yuhua Zhu

MELR: Meta-Learning via Modeling Episode-Level Relationships for Few-Shot Learning.

Nanyi Fei Zhiwu Lu Tao Xiang Songfang Huang

In Defense of Pseudo-Labeling: An Uncertainty-Aware Pseudo-label Selection Framework for Semi-Supervised Learning.

Mamshad Nayeem Rizve Kevin Duarte Yogesh Singh Rawat Mubarak Shah

Vector-output ReLU Neural Network Problems are Copositive Programs: Convex Analysis of Two Layer Networks and Polynomial-time Algorithms.

Arda Sahiner Tolga Ergen John M. Pauly Mert Pilanci

One Network Fits All? Modular versus Monolithic Task Formulations in Neural Networks.

Atish Agarwala Abhimanyu Das Brendan Juba Rina Panigrahy Vatsal Sharan Xin Wang Qiuyi Zhang

AdaFuse: Adaptive Temporal Fusion Network for Efficient Action Recognition.

Yue Meng Rameswar Panda Chung-Ching Lin Prasanna Sattigeri Leonid Karlinsky Kate Saenko Aude Oliva Rogério Feris

Dataset Meta-Learning from Kernel Ridge-Regression.

Timothy Nguyen Zhourong Chen Jaehoon Lee

Repurposing Pretrained Models for Robust Out-of-domain Few-Shot Learning.

Namyeong Kwon Hwidong Na Gabriel Huang Simon Lacoste-Julien

On Position Embeddings in BERT.

Benyou Wang Lifeng Shang Christina Lioma Xin Jiang Hao Yang Qun Liu Jakob Grue Simonsen

Conditional Negative Sampling for Contrastive Learning of Visual Representations.

Mike Wu Milan Mosse Chengxu Zhuang Daniel Yamins Noah D. Goodman

Learning and Evaluating Representations for Deep One-Class Classification.

Kihyuk Sohn Chun-Liang Li Jinsung Yoon Minho Jin Tomas Pfister

Faster Binary Embeddings for Preserving Euclidean Distances.

Jinjie Zhang Rayan Saab

Coping with Label Shift via Distributionally Robust Optimisation.

Jingzhao Zhang Aditya Krishna Menon Andreas Veit Srinadh Bhojanapalli Sanjiv Kumar Suvrit Sra

On Dyadic Fairness: Exploring and Mitigating Bias in Graph Connections.

Peizhao Li Yifei Wang Han Zhao Pengyu Hong Hongfu Liu

Model-Based Offline Planning.

Arthur Argenson Gabriel Dulac-Arnold

Neural Networks for Learning Counterfactual G-Invariances from Single Environments.

S. Chandra Mouli Bruno Ribeiro

Learning Energy-Based Models by Diffusion Recovery Likelihood.

Ruiqi Gao Yang Song Ben Poole Ying Nian Wu Diederik P. Kingma

QPLEX: Duplex Dueling Multi-Agent Q-Learning.

Jianhao Wang Zhizhou Ren Terry Liu Yang Yu Chongjie Zhang

Directed Acyclic Graph Neural Networks.

Veronika Thost Jie Chen

Does enhanced shape bias improve neural network robustness to common corruptions?

Chaithanya Kumar Mummadi Ranjitha Subramaniam Robin Hutmacher Julien Vitay Volker Fischer Jan Hendrik Metzen

OPAL: Offline Primitive Discovery for Accelerating Offline Reinforcement Learning.

Anurag Ajay Aviral Kumar Pulkit Agrawal Sergey Levine Ofir Nachum

PDE-Driven Spatiotemporal Disentanglement.

Jérémie Donà Jean-Yves Franceschi Sylvain Lamprier Patrick Gallinari

Mapping the Timescale Organization of Neural Language Models.

Hsiang-Yun Sherry Chien Jinhan Zhang Christopher J. Honey

X2T: Training an X-to-Text Typing Interface with Online Learning from User Feedback.

Jensen Gao Siddharth Reddy Glen Berseth Nicholas Hardy Nikhilesh Natraj Karunesh Ganguly Anca D. Dragan Sergey Levine

Stochastic Security: Adversarial Defense Using Long-Run Dynamics of Energy-Based Models.

Mitch Hill Jonathan Craig Mitchell Song-Chun Zhu

CoCo: Controllable Counterfactuals for Evaluating Dialogue State Trackers.

Shiyang Li Semih Yavuz Kazuma Hashimoto Jia Li Tong Niu Nazneen Fatema Rajani Xifeng Yan Yingbo Zhou Caiming Xiong

Beyond Categorical Label Representations for Image Classification.

Boyuan Chen Yu Li Sunand Raghupathi Hod Lipson

Long Range Arena : A Benchmark for Efficient Transformers.

Yi Tay Mostafa Dehghani Samira Abnar Yikang Shen Dara Bahri Philip Pham Jinfeng Rao Liu Yang Sebastian Ruder Donald Metzler

Generalized Energy Based Models.

Michael Arbel Liang Zhou Arthur Gretton

SALD: Sign Agnostic Learning with Derivatives.

Matan Atzmon Yaron Lipman

WaveGrad: Estimating Gradients for Waveform Generation.

Nanxin Chen Yu Zhang Heiga Zen Ron J. Weiss Mohammad Norouzi William Chan

Learning advanced mathematical computations from examples.

François Charton Amaury Hayat Guillaume Lample

Linear Last-iterate Convergence in Constrained Saddle-point Optimization.

Chen-Yu Wei Chung-Wei Lee Mengxiao Zhang Haipeng Luo

Go with the flow: Adaptive control for Neural ODEs.

Mathieu Chalvidal Matthew Ricci Rufin VanRullen Thomas Serre

Understanding Over-parameterization in Generative Adversarial Networks.

Yogesh Balaji Mohammadmahdi Sajedi Neha Mukund Kalibhat Mucong Ding Dominik Stöger Mahdi Soltanolkotabi Soheil Feizi

Multiscale Score Matching for Out-of-Distribution Detection.

Ahsan Mahmood Junier Oliva Martin Andreas Styner

Tradeoffs in Data Augmentation: An Empirical Study.

Raphael Gontijo Lopes Sylvia J. Smullin Ekin Dogus Cubuk Ethan Dyer

Rapid Task-Solving in Novel Environments.

Samuel Ritter Ryan Faulkner Laurent Sartran Adam Santoro Matthew M. Botvinick David Raposo

Temporally-Extended ε-Greedy Exploration.

Will Dabney Georg Ostrovski André Barreto

Extracting Strong Policies for Robotics Tasks from Zero-Order Trajectory Optimizers.

Cristina Pinneri Shambhuraj Sawant Sebastian Blaes Georg Martius

Global optimality of softmax policy gradient with single hidden layer neural networks in the mean-field regime.

Andrea Agazzi Jianfeng Lu

Unsupervised Discovery of 3D Physical Objects from Video.

Yilun Du Kevin A. Smith Tomer D. Ullman Joshua B. Tenenbaum Jiajun Wu

Sample-Efficient Automated Deep Reinforcement Learning.

Jörg K. H. Franke Gregor Köhler André Biedenkapp Frank Hutter

Learning Structural Edits via Incremental Tree Transformations.

Ziyu Yao Frank F. Xu Pengcheng Yin Huan Sun Graham Neubig

Flowtron: an Autoregressive Flow-based Generative Network for Text-to-Speech Synthesis.

Rafael Valle Kevin J. Shih Ryan Prenger Bryan Catanzaro

Private Post-GAN Boosting.

Marcel Neunhoeffer Steven Wu Cynthia Dwork

Modeling the Second Player in Distributionally Robust Optimization.

Paul Michel Tatsunori Hashimoto Graham Neubig

Are Neural Nets Modular? Inspecting Functional Modularity Through Differentiable Weight Masks.

Róbert Csordás Sjoerd van Steenkiste Jürgen Schmidhuber

Multiplicative Filter Networks.

Rizal Fathony Anit Kumar Sahu Devin Willmott J. Zico Kolter

Representation learning for improved interpretability and classification accuracy of clinical factors from EEG.

Garrett Honke Irina Higgins Nina Thigpen Vladimir Miskovic Katie Link Sunny Duan Pramod Gupta Julia Klawohn Greg Hajcak

GShard: Scaling Giant Models with Conditional Computation and Automatic Sharding.

Dmitry Lepikhin HyoukJoong Lee Yuanzhong Xu Dehao Chen Orhan Firat Yanping Huang Maxim Krikun Noam Shazeer Zhifeng Chen

Multi-Level Local SGD: Distributed SGD for Heterogeneous Hierarchical Networks.

Timothy Castiglia Anirban Das Stacy Patterson

R-GAP: Recursive Gradient Attack on Privacy.

Junyi Zhu Matthew B. Blaschko

Isometric Transformation Invariant and Equivariant Graph Convolutional Networks.

Masanobu Horie Naoki Morita Toshiaki Hishinuma Yu Ihara Naoto Mitsume

Chaos of Learning Beyond Zero-sum and Coordination via Game Decompositions.

Yun Kuen Cheung Yixin Tao

Grounding Language to Autonomously-Acquired Skills via Goal Generation.

Ahmed Akakzia Cédric Colas Pierre-Yves Oudeyer Mohamed Chetouani Olivier Sigaud

Trajectory Prediction using Equivariant Continuous Convolution.

Robin Walters Jinxi Li Rose Yu

On the role of planning in model-based deep reinforcement learning.

Jessica B. Hamrick Abram L. Friesen Feryal Behbahani Arthur Guez Fabio Viola Sims Witherspoon Thomas Anthony Lars Holger Buesing Petar Velickovic Theophane Weber

A Hypergradient Approach to Robust Regression without Correspondence.

Yujia Xie Yixiu Mao Simiao Zuo Hongteng Xu Xiaojing Ye Tuo Zhao Hongyuan Zha

Fast convergence of stochastic subgradient method under interpolation.

Huang Fang Zhenan Fan Michael P. Friedlander

Representing Partial Programs with Blended Abstract Semantics.

Maxwell I. Nye Yewen Pu Matthew Bowers Jacob Andreas Joshua B. Tenenbaum Armando Solar-Lezama

Meta-learning with negative learning rates.

Alberto Bernacchia

Wasserstein Embedding for Graph Learning.

Soheil Kolouri Navid Naderializadeh Gustavo K. Rohde Heiko Hoffmann

Convex Potential Flows: Universal Probability Distributions with Optimal Transport and Convex Optimization.

Chin-Wei Huang Ricky T. Q. Chen Christos Tsirigotis Aaron C. Courville

Shape or Texture: Understanding Discriminative Features in CNNs.

Md. Amirul Islam Matthew Kowal Patrick Esser Sen Jia Björn Ommer Konstantinos G. Derpanis Neil D. B. Bruce

Neurally Augmented ALISTA.

Freya Behrens Jonathan Sauder Peter Jung

Learning from Demonstration with Weakly Supervised Disentanglement.

Yordan Hristov Subramanian Ramamoorthy

On Data-Augmentation and Consistency-Based Semi-Supervised Learning.

Atin Ghosh Alexandre H. Thiéry

Unsupervised Meta-Learning through Latent-Space Interpolation in Generative Models.

Siavash Khodadadeh Sharare Zehtabian Saeed Vahidian Weijia Wang Bill Lin Ladislau Bölöni

Learning N: M Fine-grained Structured Sparse Neural Networks From Scratch.

Aojun Zhou Yukun Ma Junnan Zhu Jianbo Liu Zhijie Zhang Kun Yuan Wenxiu Sun Hongsheng Li

The role of Disentanglement in Generalisation.

Milton Llera Montero Casimir JH Ludwig Rui Ponte Costa Gaurav Malhotra Jeffrey Bowers

Shapley Explanation Networks.

Rui Wang Xiaoqian Wang David I. Inouye

C-Learning: Horizon-Aware Cumulative Accessibility Estimation.

Panteha Naderian Gabriel Loaiza-Ganem Harry J. Braviner Anthony L. Caterini Jesse C. Cresswell Tong Li Animesh Garg

Multi-resolution modeling of a discrete stochastic process identifies causes of cancer.

Adam Uri Yaari Maxwell Sherman Oliver Clarke Priebe Po-Ru Loh Boris Katz Andrei Barbu Bonnie Berger

PC2WF: 3D Wireframe Reconstruction from Raw Point Clouds.

Yujia Liu Stefano D'Aronco Konrad Schindler Jan Dirk Wegner

Universal Weakly Supervised Segmentation by Pixel-to-Segment Contrastive Learning.

Tsung-Wei Ke Jyh-Jing Hwang Stella X. Yu

DINO: A Conditional Energy-Based GAN for Domain Translation.

Konstantinos Vougioukas Stavros Petridis Maja Pantic

HeteroFL: Computation and Communication Efficient Federated Learning for Heterogeneous Clients.

Enmao Diao Jie Ding Vahid Tarokh

AdaSpeech: Adaptive Text to Speech for Custom Voice.

Mingjian Chen Xu Tan Bohan Li Yanqing Liu Tao Qin Sheng Zhao Tie-Yan Liu

Few-Shot Bayesian Optimization with Deep Kernel Surrogates.

Martin Wistuba Josif Grabocka

Simple Augmentation Goes a Long Way: ADRL for DNN Quantization.

Lin Ning Guoyang Chen Weifeng Zhang Xipeng Shen

Into the Wild with AudioScope: Unsupervised Audio-Visual Separation of On-Screen Sounds.

Efthymios Tzinis Scott Wisdom Aren Jansen Shawn Hershey Tal Remez Dan Ellis John R. Hershey

SkipW: Resource Adaptable RNN with Strict Upper Computational Limit.

Tsiry Mayet Anne Lambert Pascal Leguyadec Françoise Le Bolzer François Schnitzler

Pruning Neural Networks at Initialization: Why Are We Missing the Mark?

Jonathan Frankle Gintare Karolina Dziugaite Daniel Roy Michael Carbin

Analyzing the Expressive Power of Graph Neural Networks in a Spectral Perspective.

Muhammet Balcilar Guillaume Renton Pierre Héroux Benoit Gaüzère Sébastien Adam Paul Honeine

On the Origin of Implicit Regularization in Stochastic Gradient Descent.

Samuel L. Smith Benoit Dherin David G. T. Barrett Soham De

Transient Non-stationarity and Generalisation in Deep Reinforcement Learning.

Maximilian Igl Gregory Farquhar Jelena Luketina Wendelin Boehmer Shimon Whiteson

Adversarial score matching and improved sampling for image generation.

Alexia Jolicoeur-Martineau Rémi Piché-Taillefer Ioannis Mitliagkas Remi Tachet des Combes

LiftPool: Bidirectional ConvNet Pooling.

Jiaojiao Zhao Cees G. M. Snoek

Exemplary Natural Images Explain CNN Activations Better than State-of-the-Art Feature Visualization.

Judy Borowski Roland Simon Zimmermann Judith Schepers Robert Geirhos Thomas S. A. Wallis Matthias Bethge Wieland Brendel

Scalable Bayesian Inverse Reinforcement Learning.

Alex James Chan Mihaela van der Schaar

Return-Based Contrastive Representation Learning for Reinforcement Learning.

Guoqing Liu Chuheng Zhang Li Zhao Tao Qin Jinhua Zhu Jian Li Nenghai Yu Tie-Yan Liu

Implicit Gradient Regularization.

David G. T. Barrett Benoit Dherin

Variational Intrinsic Control Revisited.

Taehwan Kwon

Bayesian Context Aggregation for Neural Processes.

Michael Volpp Fabian Flürenbrock Lukas Großberger Christian Daniel Gerhard Neumann

Understanding and Improving Lexical Choice in Non-Autoregressive Translation.

Liang Ding Longyue Wang Xuebo Liu Derek F. Wong Dacheng Tao Zhaopeng Tu

Generalized Variational Continual Learning.

Noel Loo Siddharth Swaroop Richard E. Turner

FedMix: Approximation of Mixup under Mean Augmented Federated Learning.

Tehrim Yoon Sumin Shin Sung Ju Hwang Eunho Yang

Relating by Contrasting: A Data-efficient Framework for Multimodal Generative Models.

Yuge Shi Brooks Paige Philip H. S. Torr N. Siddharth

Rapid Neural Architecture Search by Learning to Generate Graphs from Datasets.

Hayeon Lee Eunyoung Hyung Sung Ju Hwang

Sharper Generalization Bounds for Learning with Gradient-dominated Objective Functions.

Yunwen Lei Yiming Ying

Provable Rich Observation Reinforcement Learning with Combinatorial Latent States.

Dipendra Misra Qinghua Liu Chi Jin John Langford

Learning to Sample with Local and Global Contexts in Experience Replay Buffer.

Youngmin Oh Kimin Lee Jinwoo Shin Eunho Yang Sung Ju Hwang

Gradient Origin Networks.

Sam Bond-Taylor Chris G. Willcocks

Nonseparable Symplectic Neural Networks.

Shiying Xiong Yunjin Tong Xingzhe He Shuqi Yang Cheng Yang Bo Zhu

Revisiting Locally Supervised Learning: an Alternative to End-to-end Training.

Yulin Wang Zanlin Ni Shiji Song Le Yang Gao Huang

Deep Repulsive Clustering of Ordered Data Based on Order-Identity Decomposition.

Seon-Ho Lee Chang-Su Kim

Spatial Dependency Networks: Neural Layers for Improved Generative Image Modeling.

Ðorðe Miladinovic Aleksandar Stanic Stefan Bauer Jürgen Schmidhuber Joachim M. Buhmann

Understanding and Improving Encoder Layer Fusion in Sequence-to-Sequence Learning.

Xuebo Liu Longyue Wang Derek F. Wong Liang Ding Lidia S. Chao Zhaopeng Tu

Reweighting Augmented Samples by Minimizing the Maximal Expected Loss.

Mingyang Yi Lu Hou Lifeng Shang Xin Jiang Qun Liu Zhi-Ming Ma

Identifying Physical Law of Hamiltonian Systems via Meta-Learning.

Seungjun Lee Haesang Yang Woojae Seong

Robust early-learning: Hindering the memorization of noisy labels.

Xiaobo Xia Tongliang Liu Bo Han Chen Gong Nannan Wang Zongyuan Ge Yi Chang

Monte-Carlo Planning and Learning with Language Action Value Estimates.

Youngsoo Jang Seokin Seo Jongmin Lee Kee-Eung Kim

Drop-Bottleneck: Learning Discrete Compressed Representation for Noise-Robust Exploration.

Jaekyeom Kim Minjung Kim Dongyeon Woo Gunhee Kim

DrNAS: Dirichlet Neural Architecture Search.

Xiangning Chen Ruochen Wang Minhao Cheng Xiaocheng Tang Cho-Jui Hsieh

InfoBERT: Improving Robustness of Language Models from An Information Theoretic Perspective.

Boxin Wang Shuohang Wang Yu Cheng Zhe Gan Ruoxi Jia Bo Li Jingjing Liu

Graph Edit Networks.

Benjamin Paassen Daniele Grattarola Daniele Zambon Cesare Alippi Barbara Hammer

Capturing Label Characteristics in VAEs.

Tom Joy Sebastian M. Schmon Philip H. S. Torr Siddharth Narayanaswamy Tom Rainforth

Neural Delay Differential Equations.

Qunxi Zhu Yao Guo Wei Lin

A Better Alternative to Error Feedback for Communication-Efficient Distributed Learning.

Samuel Horváth Peter Richtárik

Group Equivariant Stand-Alone Self-Attention For Vision.

David W. Romero Jean-Baptiste Cordonnier

Risk-Averse Offline Reinforcement Learning.

Núria Armengol Urpí Sebastian Curi Andreas Krause

Bidirectional Variational Inference for Non-Autoregressive Text-to-Speech.

Yoonhyung Lee Joongbo Shin Kyomin Jung

Learning Hyperbolic Representations of Topological Features.

Panagiotis Kyriakis Iordanis Fostiropoulos Paul Bogdan

Lipschitz Recurrent Neural Networks.

N. Benjamin Erichson Omri Azencot Alejandro F. Queiruga Liam Hodgkinson Michael W. Mahoney

Explaining the Efficacy of Counterfactually Augmented Data.

Divyansh Kaushik Amrith Setlur Eduard H. Hovy Zachary Chase Lipton

Refining Deep Generative Models via Discriminator Gradient Flow.

Abdul Fatir Ansari Ming Liang Ang Harold Soh

Layer-adaptive Sparsity for the Magnitude-based Pruning.

Jaeho Lee Sejun Park Sangwoo Mo Sungsoo Ahn Jinwoo Shin

Prototypical Representation Learning for Relation Extraction.

Ning Ding Xiaobin Wang Yao Fu Guangwei Xu Rui Wang Pengjun Xie Ying Shen Fei Huang Hai-Tao Zheng Rui Zhang

Learning Reasoning Paths over Semantic Graphs for Video-grounded Dialogues.

Hung Le Nancy F. Chen Steven C. H. Hoi

When does preconditioning help or hurt generalization?

Shun-ichi Amari Jimmy Ba Roger Baker Grosse Xuechen Li Atsushi Nitanda Taiji Suzuki Denny Wu Ji Xu

Group Equivariant Conditional Neural Processes.

Makoto Kawano Wataru Kumagai Akiyoshi Sannai Yusuke Iwasawa Yutaka Matsuo

PSTNet: Point Spatio-Temporal Convolution on Point Cloud Sequences.

Hehe Fan Xin Yu Yuhang Ding Yi Yang Mohan S. Kankanhalli

Anchor & Transform: Learning Sparse Embeddings for Large Vocabularies.

Paul Pu Liang Manzil Zaheer Yuan Wang Amr Ahmed

Molecule Optimization by Explainable Evolution.

Binghong Chen Tianzhe Wang Chengtao Li Hanjun Dai Le Song

Predicting Inductive Biases of Pre-Trained Models.

Charles Lovering Rohan Jha Tal Linzen Ellie Pavlick

Learning Better Structured Representations Using Low-rank Adaptive Label Smoothing.

Asish Ghoshal Xilun Chen Sonal Gupta Luke Zettlemoyer Yashar Mehdad

Deep Encoder, Shallow Decoder: Reevaluating Non-autoregressive Machine Translation.

Jungo Kasai Nikolaos Pappas Hao Peng James Cross Noah A. Smith

Multi-timescale Representation Learning in LSTM Language Models.

Shivangi Mahto Vy Ai Vo Javier S. Turek Alexander Huth

Adaptive Procedural Task Generation for Hard-Exploration Problems.

Kuan Fang Yuke Zhu Silvio Savarese Li Fei-Fei

Interactive Weak Supervision: Learning Useful Heuristics for Data Labeling.

Benedikt Boecking Willie Neiswanger Eric P. Xing Artur Dubrawski

Extreme Memorization via Scale of Initialization.

Harsh Mehta Ashok Cutkosky Behnam Neyshabur

Prototypical Contrastive Learning of Unsupervised Representations.

Junnan Li Pan Zhou Caiming Xiong Steven C. H. Hoi

Learning from others' mistakes: Avoiding dataset biases without modeling them.

Victor Sanh Thomas Wolf Yonatan Belinkov Alexander M. Rush

LowKey: Leveraging Adversarial Attacks to Protect Social Media Users from Facial Recognition.

Valeriia Cherepanova Micah Goldblum Harrison Foley Shiyuan Duan John P. Dickerson Gavin Taylor Tom Goldstein

WaNet - Imperceptible Warping-based Backdoor Attack.

Tuan Anh Nguyen Anh Tuan Tran

Neural representation and generation for RNA secondary structures.

Zichao Yan William L. Hamilton Mathieu Blanchette

Can a Fruit Fly Learn Word Embeddings?

Yuchen Liang Chaitanya K. Ryali Benjamin Hoover Leopold Grinberg Saket Navlakha Mohammed J. Zaki Dmitry Krotov

RNNLogic: Learning Logic Rules for Reasoning on Knowledge Graphs.

Meng Qu Junkun Chen Louis-Pascal A. C. Xhonneux Yoshua Bengio Jian Tang

Evaluations and Methods for Explanation through Robustness Analysis.

Cheng-Yu Hsieh Chih-Kuan Yeh Xuanqing Liu Pradeep Kumar Ravikumar Seungyeon Kim Sanjiv Kumar Cho-Jui Hsieh

gradSim: Differentiable simulation for system identification and visuomotor control.

J. Krishna Murthy Miles Macklin Florian Golemo Vikram Voleti Linda Petrini Martin Weiss Breandan Considine Jérôme Parent-Lévesque Kevin Xie Kenny Erleben Liam Paull Florian Shkurti Derek Nowrouzezahrai Sanja Fidler

Deployment-Efficient Reinforcement Learning via Model-Based Offline Optimization.

Tatsuya Matsushima Hiroki Furuta Yutaka Matsuo Ofir Nachum Shixiang Gu

Spatio-Temporal Graph Scattering Transform.

Chao Pan Siheng Chen Antonio Ortega

Isotropy in the Contextual Embedding Space: Clusters and Manifolds.

Xingyu Cai Jiaji Huang Yuchen Bian Kenneth Church

Reinforcement Learning with Random Delays.

Yann Bouteiller Simon Ramstedt Giovanni Beltrame Christopher J. Pal Jonathan Binas

Deep Learning meets Projective Clustering.

Alaa Maalouf Harry Lang Daniela Rus Dan Feldman

Dual-mode ASR: Unify and Improve Streaming ASR with Full-context Modeling.

Jiahui Yu Wei Han Anmol Gulati Chung-Cheng Chiu Bo Li Tara N. Sainath Yonghui Wu Ruoming Pang

On Graph Neural Networks versus Graph-Augmented MLPs.

Lei Chen Zhengdao Chen Joan Bruna

NeMo: Neural Mesh Models of Contrastive Features for Robust 3D Pose Estimation.

Angtian Wang Adam Kortylewski Alan L. Yuille

MoVie: Revisiting Modulated Convolutions for Visual Counting and Beyond.

Duy-Kien Nguyen Vedanuj Goswami Xinlei Chen

NOVAS: Non-convex Optimization via Adaptive Stochastic Search for End-to-end Learning and Control.

Ioannis Exarchos Marcus Aloysius Pereira Ziyi Wang Evangelos A. Theodorou

Understanding the effects of data parallelism and sparsity on neural network training.

Namhoon Lee Thalaiyasingam Ajanthan Philip H. S. Torr Martin Jaggi

Planning from Pixels using Inverse Dynamics Models.

Keiran Paster Sheila A. McIlraith Jimmy Ba

Benchmarks for Deep Off-Policy Evaluation.

Justin Fu Mohammad Norouzi Ofir Nachum George Tucker Ziyu Wang Alexander Novikov Mengjiao Yang Michael R. Zhang Yutian Chen Aviral Kumar Cosmin Paduraru Sergey Levine Thomas Paine

BiPointNet: Binary Neural Network for Point Clouds.

Haotong Qin Zhongang Cai Mingyuan Zhang Yifu Ding Haiyu Zhao Shuai Yi Xianglong Liu Hao Su

Meta-Learning of Structured Task Distributions in Humans and Machines.

Sreejan Kumar Ishita Dasgupta Jonathan D. Cohen Nathaniel D. Daw Thomas L. Griffiths

Training independent subnetworks for robust prediction.

Marton Havasi Rodolphe Jenatton Stanislav Fort Jeremiah Zhe Liu Jasper Snoek Balaji Lakshminarayanan Andrew Mingbo Dai Dustin Tran

Better Fine-Tuning by Reducing Representational Collapse.

Armen Aghajanyan Akshat Shrivastava Anchit Gupta Naman Goyal Luke Zettlemoyer Sonal Gupta

Selective Classification Can Magnify Disparities Across Groups.

Erik Jones Shiori Sagawa Pang Wei Koh Ananya Kumar Percy Liang

Zero-shot Synthesis with Group-Supervised Learning.

Yunhao Ge Sami Abu-El-Haija Gan Xin Laurent Itti

Learning Task-General Representations with Generative Neuro-Symbolic Modeling.

Reuben Feinman Brenden M. Lake

BERTology Meets Biology: Interpreting Attention in Protein Language Models.

Jesse Vig Ali Madani Lav R. Varshney Caiming Xiong Richard Socher Nazneen Fatema Rajani

AutoLRS: Automatic Learning-Rate Schedule by Bayesian Optimization on the Fly.

Yuchen Jin Tianyi Zhou Liangyu Zhao Yibo Zhu Chuanxiong Guo Marco Canini Arvind Krishnamurthy

BSQ: Exploring Bit-Level Sparsity for Mixed-Precision Neural Network Quantization.

Huanrui Yang Lin Duan Yiran Chen Hai Li

Economic Hyperparameter Optimization with Blended Search Strategy.

Chi Wang Qingyun Wu Silu Huang Amin Saied

Average-case Acceleration for Bilinear Games and Normal Matrices.

Carles Domingo-Enrich Fabian Pedregosa Damien Scieur

Multi-Prize Lottery Ticket Hypothesis: Finding Accurate Binary Neural Networks by Pruning A Randomly Weighted Network.

James Diffenderfer Bhavya Kailkhura

IsarStep: a Benchmark for High-level Mathematical Reasoning.

Wenda Li Lei Yu Yuhuai Wu Lawrence C. Paulson

Towards Faster and Stabilized GAN Training for High-fidelity Few-shot Image Synthesis.

Bingchen Liu Yizhe Zhu Kunpeng Song Ahmed Elgammal

Genetic Soft Updates for Policy Evolution in Deep Reinforcement Learning.

Enrico Marchesini Davide Corsi Alessandro Farinelli

Distance-Based Regularisation of Deep Networks for Fine-Tuning.

Henry Gouk Timothy M. Hospedales Massimiliano Pontil

Ringing ReLUs: Harmonic Distortion Analysis of Nonlinear Feedforward Networks.

Christian H. X. Ali Mehmeti-Göpel David Hartmann Michael Wand

No Cost Likelihood Manipulation at Test Time for Making Better Mistakes in Deep Networks.

Shyamgopal Karthik Ameya Prabhu Puneet K. Dokania Vineet Gandhi

Efficient Continual Learning with Modular Networks and Task-Driven Priors.

Tom Veniat Ludovic Denoyer Marc'Aurelio Ranzato

Activation-level uncertainty in deep neural networks.

Pablo Morales-Alvarez Daniel Hernández-Lobato Rafael Molina José Miguel Hernández-Lobato

Local Convergence Analysis of Gradient Descent Ascent with Finite Timescale Separation.

Tanner Fiez Lillian J. Ratliff

Scaling the Convex Barrier with Active Sets.

Alessandro De Palma Harkirat S. Behl Rudy Bunel Philip H. S. Torr M. Pawan Kumar

NAS-Bench-ASR: Reproducible Neural Architecture Search for Speech Recognition.

Abhinav Mehrotra Alberto Gil C. P. Ramos Sourav Bhattacharya Lukasz Dudziak Ravichander Vipperla Thomas C. P. Chau Mohamed S. Abdelfattah Samin Ishtiaq Nicholas Donald Lane

PseudoSeg: Designing Pseudo Labels for Semantic Segmentation.

Yuliang Zou Zizhao Zhang Han Zhang Chun-Liang Li Xiao Bian Jia-Bin Huang Tomas Pfister

Symmetry-Aware Actor-Critic for 3D Molecular Design.

Gregor N. C. Simm Robert Pinsler Gábor Csányi José Miguel Hernández-Lobato

Long Live the Lottery: The Existence of Winning Tickets in Lifelong Learning.

Tianlong Chen Zhenyu Zhang Sijia Liu Shiyu Chang Zhangyang Wang

Robust Overfitting may be mitigated by properly learned smoothening.

Tianlong Chen Zhenyu Zhang Sijia Liu Shiyu Chang Zhangyang Wang

Characterizing signal propagation to close the performance gap in unnormalized ResNets.

Andrew Brock Soham De Samuel L. Smith

Learning continuous-time PDEs from sparse data with graph neural networks.

Valerii Iakovlev Markus Heinonen Harri Lähdesmäki

Latent Skill Planning for Exploration and Transfer.

Kevin Xie Homanga Bharadhwaj Danijar Hafner Animesh Garg Florian Shkurti

Uncertainty-aware Active Learning for Optimal Bayesian Classifier.

Guang Zhao Edward R. Dougherty Byung-Jun Yoon Francis J. Alexander Xiaoning Qian

Self-supervised Adversarial Robustness for the Low-label, High-data Regime.

Sven Gowal Po-Sen Huang Aäron van den Oord Timothy A. Mann Pushmeet Kohli

Single-Photon Image Classification.

Thomas Fischbacher Luciano Sbaiz

CcGAN: Continuous Conditional Generative Adversarial Networks for Image Generation.

Xin Ding Yongwei Wang Zuheng Xu William J. Welch Z. Jane Wang

Plan-Based Relaxed Reward Shaping for Goal-Directed Tasks.

Ingmar Schubert Ozgur S. Oguz Marc Toussaint

ANOCE: Analysis of Causal Effects with Multiple Mediators via Constrained Structural Learning.

Hengrui Cai Rui Song Wenbin Lu

Transformer protein language models are unsupervised structure learners.

Roshan Rao Joshua Meier Tom Sercu Sergey Ovchinnikov Alexander Rives

Uncertainty Estimation in Autoregressive Structured Prediction.

Andrey Malinin Mark J. F. Gales

Learning to live with Dale's principle: ANNs with separate excitatory and inhibitory units.

Jonathan Cornford Damjan Kalajdzievski Marco Leite Amélie Lamarquette Dimitri Michael Kullmann Blake Aaron Richards

CT-Net: Channel Tensorization Network for Video Classification.

Kunchang Li Xianhang Li Yali Wang Jun Wang Yu Qiao

On the Universality of Rotation Equivariant Point Cloud Networks.

Nadav Dym Haggai Maron

Universal approximation power of deep residual neural networks via nonlinear control theory.

Paulo Tabuada Bahman Gharesifard

Learning a Latent Search Space for Routing Problems using Variational Autoencoders.

André Hottung Bhanu Bhandari Kevin Tierney

A teacher-student framework to distill future trajectories.

Alexander Neitz Giambattista Parascandolo Bernhard Schölkopf

What they do when in doubt: a study of inductive biases in seq2seq learners.

Eugene Kharitonov Rahma Chaabouni

Group Equivariant Generative Adversarial Networks.

Neel Dey Antong Chen Soheil Ghafurian

CoCon: A Self-Supervised Approach for Controlled Text Generation.

Alvin Chan Yew-Soon Ong Bill Pung Aston Zhang Jie Fu

Cross-Attentional Audio-Visual Fusion for Weakly-Supervised Action Localization.

Jun-Tae Lee Mihir Jain Hyoungwoo Park Sungrack Yun

Robust Curriculum Learning: from clean label detection to noisy label self-correction.

Tianyi Zhou Shengjie Wang Jeff A. Bilmes

In Search of Lost Domain Generalization.

Ishaan Gulrajani David Lopez-Paz

Graph Information Bottleneck for Subgraph Recognition.

Junchi Yu Tingyang Xu Yu Rong Yatao Bian Junzhou Huang Ran He

Online Adversarial Purification based on Self-supervised Learning.

Changhao Shi Chester Holtz Gal Mishne

Learning Deep Features in Instrumental Variable Regression.

Liyuan Xu Yutian Chen Siddarth Srinivasan Nando de Freitas Arnaud Doucet Arthur Gretton

Grounding Physical Concepts of Objects and Events Through Dynamic Visual Reasoning.

Zhenfang Chen Jiayuan Mao Jiajun Wu Kwan-Yee Kenneth Wong Joshua B. Tenenbaum Chuang Gan

Differentiable Segmentation of Sequences.

Erik Scharwächter Jonathan Lennartz Emmanuel Müller

Auto Seg-Loss: Searching Metric Surrogates for Semantic Segmentation.

Hao Li Chenxin Tao Xizhou Zhu Xiaogang Wang Gao Huang Jifeng Dai

Network Pruning That Matters: A Case Study on Retraining Variants.

Duong H. Le Binh-Son Hua

Degree-Quant: Quantization-Aware Training for Graph Neural Networks.

Shyam Anil Tailor Javier Fernández-Marqués Nicholas Donald Lane

Boost then Convolve: Gradient Boosting Meets Graph Neural Networks.

Sergei Ivanov Liudmila Prokhorenkova

Learning Associative Inference Using Fast Weight Memory.

Imanol Schlag Tsendsuren Munkhdalai Jürgen Schmidhuber

Task-Agnostic Morphology Evolution.

Donald Joseph Hejna III Pieter Abbeel Lerrel Pinto

SaliencyMix: A Saliency Guided Data Augmentation Strategy for Better Regularization.

A. F. M. Shahab Uddin Mst. Sirazam Monira Wheemyung Shin TaeChoong Chung Sung-Ho Bae

Differentiable Trust Region Layers for Deep Reinforcement Learning.

Fabian Otto Philipp Becker Ngo Anh Vien Hanna Carolin Maria Ziesche Gerhard Neumann

Discovering Non-monotonic Autoregressive Orderings with Variational Inference.

Xuanlin Li Brandon Trabucco Dong Huk Park Michael Luo Sheng Shen Trevor Darrell Yang Gao

Rethinking Positional Encoding in Language Pre-training.

Guolin Ke Di He Tie-Yan Liu

Improving Relational Regularized Autoencoders with Spherical Sliced Fused Gromov Wasserstein.

Khai Nguyen Son Nguyen Nhat Ho Tung Pham Hung Bui

Calibration of Neural Networks using Splines.

Kartik Gupta Amir Rahimi Thalaiyasingam Ajanthan Thomas Mensink Cristian Sminchisescu Richard Hartley

Exploring Balanced Feature Spaces for Representation Learning.

Bingyi Kang Yu Li Sa Xie Zehuan Yuan Jiashi Feng

UMEC: Unified model and embedding compression for efficient recommendation systems.

Jiayi Shen Haotao Wang Shupeng Gui Jianchao Tan Zhangyang Wang Ji Liu

Adversarially-Trained Deep Nets Transfer Better: Illustration on Image Classification.

Francisco Utrera Evan Kravitz N. Benjamin Erichson Rajiv Khanna Michael W. Mahoney

Learning Task Decomposition with Ordered Memory Policy Network.

Yuchen Lu Yikang Shen Siyuan Zhou Aaron C. Courville Joshua B. Tenenbaum Chuang Gan

ALFWorld: Aligning Text and Embodied Environments for Interactive Learning.

Mohit Shridhar Xingdi Yuan Marc-Alexandre Côté Yonatan Bisk Adam Trischler Matthew J. Hausknecht

SEDONA: Search for Decoupled Neural Networks toward Greedy Block-wise Learning.

Myeongjang Pyeon Jihwan Moon Taeyoung Hahn Gunhee Kim

VA-RED2: Video Adaptive Redundancy Reduction.

Bowen Pan Rameswar Panda Camilo Luciano Fosco Chung-Ching Lin Alex J. Andonian Yue Meng Kate Saenko Aude Oliva Rogério Feris

On InstaHide, Phase Retrieval, and Sparse Matrix Factorization.

Sitan Chen Xiaoxiao Li Zhao Song Danyang Zhuo

Greedy-GQ with Variance Reduction: Finite-time Analysis and Improved Complexity.

Shaocong Ma Ziyi Chen Yi Zhou Shaofeng Zou

HyperGrid Transformers: Towards A Single Model for Multiple Tasks.

Yi Tay Zhe Zhao Dara Bahri Donald Metzler Da-Cheng Juan

Statistical inference for individual fairness.

Subha Maity Songkai Xue Mikhail Yurochkin Yuekai Sun

Towards Robust Neural Networks via Close-loop Control.

Zhuotong Chen Qianxiao Li Zheng Zhang

Measuring Massive Multitask Language Understanding.

Dan Hendrycks Collin Burns Steven Basart Andy Zou Mantas Mazeika Dawn Song Jacob Steinhardt

Kanerva++: Extending the Kanerva Machine With Differentiable, Locally Block Allocated Latent Memory.

Jason Ramapuram Yan Wu Alexandros Kalousis

Aligning AI With Shared Human Values.

Dan Hendrycks Collin Burns Steven Basart Andrew Critch Jerry Li Dawn Song Jacob Steinhardt

Learning Manifold Patch-Based Representations of Man-Made Shapes.

Dmitriy Smirnov Mikhail Bessmeltsev Justin Solomon

Filtered Inner Product Projection for Crosslingual Embedding Alignment.

Vin Sachidananda Ziyi Yang Chenguang Zhu

Progressive Skeletonization: Trimming more fat from a network at initialization.

Pau de Jorge Amartya Sanyal Harkirat S. Behl Philip H. S. Torr Grégory Rogez Puneet K. Dokania

Learning What To Do by Simulating the Past.

David Lindner Rohin Shah Pieter Abbeel Anca D. Dragan

High-Capacity Expert Binary Networks.

Adrian Bulat Brais Martínez Georgios Tzimiropoulos

Fuzzy Tiling Activations: A Simple Approach to Learning Sparse Representations Online.

Yangchen Pan Kirby Banman Martha White

Remembering for the Right Reasons: Explanations Reduce Catastrophic Forgetting.

Sayna Ebrahimi Suzanne Petryk Akash Gokul William Gan Joseph E. Gonzalez Marcus Rohrbach Trevor Darrell

Contrastive Syn-to-Real Generalization.

Wuyang Chen Zhiding Yu Shalini De Mello Sifei Liu Jose M. Alvarez Zhangyang Wang Anima Anandkumar

Incremental few-shot learning via vector quantization in deep embedded space.

Kuilin Chen Chi-Guhn Lee

In-N-Out: Pre-Training and Self-Training using Auxiliary Information for Out-of-Distribution Robustness.

Sang Michael Xie Ananya Kumar Robbie Jones Fereshte Khani Tengyu Ma Percy Liang

Reducing the Computational Cost of Deep Generative Models with Binary Neural Networks.

Thomas Bird Friso H. Kingma David Barber

MALI: A memory efficient and reverse accurate integrator for Neural ODEs.

Juntang Zhuang Nicha C. Dvornek Sekhar Tatikonda James S. Duncan

FedBE: Making Bayesian Model Ensemble Applicable to Federated Learning.

Hong-You Chen Wei-Lun Chao

My Body is a Cage: the Role of Morphology in Graph-Based Incompatible Control.

Vitaly Kurin Maximilian Igl Tim Rocktäschel Wendelin Boehmer Shimon Whiteson

Neural Learning of One-of-Many Solutions for Combinatorial Problems in Structured Output Spaces.

Yatin Nandwani Deepanshu Jindal Mausam Parag Singla

Adaptive Universal Generalized PageRank Graph Neural Network.

Eli Chien Jianhao Peng Pan Li Olgica Milenkovic

Latent Convergent Cross Mapping.

Edward De Brouwer Adam Arany Jaak Simm Yves Moreau

Property Controllable Variational Autoencoder via Invertible Mutual Dependence.

Xiaojie Guo Yuanqi Du Liang Zhao

Semantic Re-tuning with Contrastive Tension.

Fredrik Carlsson Amaru Cuba Gyllensten Evangelia Gogoulou Erik Ylipää Hellqvist Magnus Sahlgren

ResNet After All: Neural ODEs and Their Numerical Solution.

Katharina Ott Prateek Katiyar Philipp Hennig Michael Tiemann

GANs Can Play Lottery Tickets Too.

Xuxi Chen Zhenyu Zhang Yongduo Sui Tianlong Chen

Efficient Conformal Prediction via Cascaded Inference with Expanded Admission.

Adam Fisch Tal Schuster Tommi S. Jaakkola Regina Barzilay

Learning Parametrised Graph Shift Operators.

George Dasoulas Johannes F. Lutzeyer Michalis Vazirgiannis

Disambiguating Symbolic Expressions in Informal Documents.

Dennis Müller Cezary Kaliszyk

Neural networks with late-phase weights.

Johannes von Oswald Seijin Kobayashi João Sacramento Alexander Meulemans Christian Henning Benjamin F. Grewe

Lossless Compression of Structured Convolutional Models via Lifting.

Gustav Sourek Filip Zelezný Ondrej Kuzelka

Uncertainty in Gradient Boosting via Ensembles.

Andrey Malinin Liudmila Prokhorenkova Aleksei Ustimenko

An Unsupervised Deep Learning Approach for Real-World Image Denoising.

Dihan Zheng Sia Huat Tan Xiaowen Zhang Zuoqiang Shi Kaisheng Ma Chenglong Bao

Conformation-Guided Molecular Representation with Hamiltonian Neural Networks.

Ziyao Li Shuwen Yang Guojie Song Lingsheng Cai

Neural ODE Processes.

Alexander Norcliffe Cristian Bodnar Ben Day Jacob Moss Pietro Liò

Multi-Class Uncertainty Calibration via Mutual Information Maximization-based Binning.

Kanil Patel William H. Beluch Bin Yang Michael Pfeiffer Dan Zhang

Effective Distributed Learning with Random Features: Improved Bounds and Algorithms.

Yong Liu Jiankun Liu Shuqiang Wang

On Learning Universal Representations Across Languages.

Xiangpeng Wei Rongxiang Weng Yue Hu Luxi Xing Heng Yu Weihua Luo

FastSpeech 2: Fast and High-Quality End-to-End Text to Speech.

Yi Ren Chenxu Hu Xu Tan Tao Qin Sheng Zhao Zhou Zhao Tie-Yan Liu

Cut out the annotator, keep the cutout: better segmentation with weak supervision.

Sarah M. Hooper Michael Wornow Ying Hang Seah Peter Kellman Hui Xue Frederic Sala Curtis P. Langlotz Christopher Ré

Factorizing Declarative and Procedural Knowledge in Structured, Dynamical Environments.

Anirudh Goyal Alex Lamb Phanideep Gampa Philippe Beaudoin Charles Blundell Sergey Levine Yoshua Bengio Michael Curtis Mozer

Self-Supervised Learning of Compressed Video Representations.

Youngjae Yu Sangho Lee Gunhee Kim Yale Song

Learning to Generate 3D Shapes with Generative Cellular Automata.

Dongsu Zhang Changwoon Choi Jeonghwan Kim Young Min Kim

Initialization and Regularization of Factorized Neural Layers.

Mikhail Khodak Neil A. Tenenholtz Lester Mackey Nicolò Fusi

i-Mix: A Domain-Agnostic Strategy for Contrastive Representation Learning.

Kibok Lee Yian Zhu Kihyuk Sohn Chun-Liang Li Jinwoo Shin Honglak Lee

Trusted Multi-View Classification.

Zongbo Han Changqing Zhang Huazhu Fu Joey Tianyi Zhou

Anatomy of Catastrophic Forgetting: Hidden Representations and Task Semantics.

Vinay Venkatesh Ramasesh Ethan Dyer Maithra Raghu

On Fast Adversarial Robustness Adaptation in Model-Agnostic Meta-Learning.

Ren Wang Kaidi Xu Sijia Liu Pin-Yu Chen Tsui-Wei Weng Chuang Gan Meng Wang

Probing BERT in Hyperbolic Spaces.

Boli Chen Yao Fu Guangwei Xu Pengjun Xie Chuanqi Tan Mosha Chen Liping Jing

Efficient Wasserstein Natural Gradients for Reinforcement Learning.

Ted Moskovitz Michael Arbel Ferenc Huszar Arthur Gretton

Robust Pruning at Initialization.

Soufiane Hayou Jean-Francois Ton Arnaud Doucet Yee Whye Teh

Parameter Efficient Multimodal Transformers for Video Representation Learning.

Sangho Lee Youngjae Yu Gunhee Kim Thomas M. Breuel Jan Kautz Yale Song

Active Contrastive Learning of Audio-Visual Video Representations.

Shuang Ma Zhaoyang Zeng Daniel McDuff Yale Song

Enforcing robust control guarantees within neural network policies.

Priya L. Donti Melrose Roderick Mahyar Fazlyab J. Zico Kolter

Unsupervised Representation Learning for Time Series with Temporal Neighborhood Coding.

Sana Tonekaboni Danny Eytan Anna Goldenberg

Domain-Robust Visual Imitation Learning with Mutual Information Constraints.

Edoardo Cetin Oya Çeliktutan

Theoretical bounds on estimation error for meta-learning.

James Lucas Mengye Ren Irene Raissa Kameni Toniann Pitassi Richard S. Zemel

Towards Impartial Multi-task Learning.

Liyang Liu Yi Li Zhanghui Kuang Jing-Hao Xue Yimin Chen Wenming Yang Qingmin Liao Wayne Zhang

Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data.

Jonathan Pilault Amine Elhattami Christopher J. Pal

Counterfactual Generative Networks.

Axel Sauer Andreas Geiger

IOT: Instance-wise Layer Reordering for Transformer Structures.

Jinhua Zhu Lijun Wu Yingce Xia Shufang Xie Tao Qin Wengang Zhou Houqiang Li Tie-Yan Liu

A statistical theory of cold posteriors in deep neural networks.

Laurence Aitchison

The inductive bias of ReLU networks on orthogonally separable data.

Mary Phuong Christoph H. Lampert

A Unified Approach to Interpreting and Boosting Adversarial Transferability.

Xin Wang Jie Ren Shuyun Lin Xiangming Zhu Yisen Wang Quanshi Zhang

Contextual Transformation Networks for Online Continual Learning.

Quang Pham Chenghao Liu Doyen Sahoo Steven C. H. Hoi

Private Image Reconstruction from System Side Channels Using Generative Models.

Yuanyuan Yuan Shuai Wang Junping Zhang

Model-based micro-data reinforcement learning: what are the crucial model properties and which model to choose?

Balázs Kégl Gabriel Hurtado Albert Thomas

HalentNet: Multimodal Trajectory Forecasting with Hallucinative Intents.

Deyao Zhu Mohamed Zahran Li Erran Li Mohamed Elhoseiny

MiCE: Mixture of Contrastive Experts for Unsupervised Image Clustering.

Tsung Wei Tsai Chongxuan Li Jun Zhu

AdamP: Slowing Down the Slowdown for Momentum Optimizers on Scale-invariant Weights.

Byeongho Heo Sanghyuk Chun Seong Joon Oh Dongyoon Han Sangdoo Yun Gyuwan Kim Youngjung Uh Jung-Woo Ha

Variational State-Space Models for Localisation and Dense 3D Mapping in 6 DoF.

Atanas Mirchev Baris Kayalibay Patrick van der Smagt Justin Bayer

Intrinsic-Extrinsic Convolution and Pooling for Learning on 3D Protein Structures.

Pedro Hermosilla Marco Schäfer Matej Lang Gloria Fackelmann Pere-Pau Vázquez Barbora Kozlíková Michael Krone Tobias Ritschel Timo Ropinski

Robust and Generalizable Visual Representation Learning via Random Convolutions.

Zhenlin Xu Deyi Liu Junlin Yang Colin Raffel Marc Niethammer

Linear Mode Connectivity in Multitask and Continual Learning.

Seyed-Iman Mirzadeh Mehrdad Farajtabar Dilan Görür Razvan Pascanu Hassan Ghasemzadeh

Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual Bounds.

Yihao Feng Ziyang Tang Na Zhang Qiang Liu

Model Patching: Closing the Subgroup Performance Gap with Data Augmentation.

Karan Goel Albert Gu Yixuan Li Christopher Ré

Blending MPC & Value Function Approximation for Efficient Reinforcement Learning.

Mohak Bhardwaj Sanjiban Choudhury Byron Boots

Using latent space regression to analyze and leverage compositionality in GANs.

Lucy Chai Jonas Wulff Phillip Isola

Shape-Texture Debiased Neural Network Training.

Yingwei Li Qihang Yu Mingxing Tan Jieru Mei Peng Tang Wei Shen Alan L. Yuille Cihang Xie

Is Label Smoothing Truly Incompatible with Knowledge Distillation: An Empirical Study.

Zhiqiang Shen Zechun Liu Dejia Xu Zitian Chen Kwang-Ting Cheng Marios Savvides

DC3: A learning method for optimization with hard constraints.

Priya L. Donti David Rolnick J. Zico Kolter

Deep Partition Aggregation: Provable Defenses against General Poisoning Attacks.

Alexander Levine Soheil Feizi

On the geometry of generalization and memorization in deep neural networks.

Cory Stephenson Suchismita Padhy Abhinav Ganesh Yue Hui Hanlin Tang SueYeon Chung

Exploring the Uncertainty Properties of Neural Networks' Implicit Priors in the Infinite-Width Limit.

Ben Adlam Jaehoon Lee Lechao Xiao Jeffrey Pennington Jasper Snoek

Usable Information and Evolution of Optimal Representations During Training.

Michael Kleinman Alessandro Achille Daksh Idnani Jonathan C. Kao

Zero-Cost Proxies for Lightweight NAS.

Mohamed S. Abdelfattah Abhinav Mehrotra Lukasz Dudziak Nicholas Donald Lane

Perceptual Adversarial Robustness: Defense Against Unseen Threat Models.

Cassidy Laidlaw Sahil Singla Soheil Feizi

Enjoy Your Editing: Controllable GANs for Image Editing via Latent Space Navigation.

Peiye Zhuang Oluwasanmi Koyejo Alexander G. Schwing

Noise or Signal: The Role of Image Backgrounds in Object Recognition.

Kai Yuanqing Xiao Logan Engstrom Andrew Ilyas Aleksander Madry

Shapley explainability on the data manifold.

Christopher Frye Damien de Mijolla Tom Begley Laurence Cowton Megan Stanley Ilya Feige

Improving Transformation Invariance in Contrastive Representation Learning.

Adam Foster Rattana Pukdee Tom Rainforth

Learning "What-if" Explanations for Sequential Decision-Making.

Ioana Bica Daniel Jarrett Alihan Hüyük Mihaela van der Schaar

A Trainable Optimal Transport Embedding for Feature Aggregation and its Relationship to Attention.

Grégoire Mialon Dexiong Chen Alexandre d'Aspremont Julien Mairal

Continual learning in recurrent neural networks.

Benjamin Ehret Christian Henning Maria R. Cervera Alexander Meulemans Johannes von Oswald Benjamin F. Grewe

Meta-Learning with Neural Tangent Kernels.

Yufan Zhou Zhenyi Wang Jiayi Xian Changyou Chen Jinhui Xu

Learning Robust State Abstractions for Hidden-Parameter Block MDPs.

Amy Zhang Shagun Sodhani Khimya Khetarpal Joelle Pineau

FedBN: Federated Learning on Non-IID Features via Local Batch Normalization.

Xiaoxiao Li Meirui Jiang Xiaofei Zhang Michael Kamp Qi Dou

Autoregressive Dynamics Models for Offline Policy Evaluation and Optimization.

Michael R. Zhang Thomas Paine Ofir Nachum Cosmin Paduraru George Tucker Ziyu Wang Mohammad Norouzi

Colorization Transformer.

Manoj Kumar Dirk Weissenborn Nal Kalchbrenner

Separation and Concentration in Deep Networks.

John Zarka Florentin Guth Stéphane Mallat

Influence Functions in Deep Learning Are Fragile.

Samyadeep Basu Phillip Pope Soheil Feizi

Training GANs with Stronger Augmentations via Contrastive Discriminator.

Jongheon Jeong Jinwoo Shin

Language-Agnostic Representation Learning of Source Code from Structure and Context.

Daniel Zügner Tobias Kirschstein Michele Catasta Jure Leskovec Stephan Günnemann

Clustering-friendly Representation Learning via Instance Discrimination and Feature Decorrelation.

Yaling Tao Kentaro Takagi Kouta Nakata

Set Prediction without Imposing Structure as Conditional Density Estimation.

David W. Zhang Gertjan J. Burghouts Cees G. M. Snoek

Do not Let Privacy Overbill Utility: Gradient Embedding Perturbation for Private Learning.

Da Yu Huishuai Zhang Wei Chen Tie-Yan Liu

Effective Abstract Reasoning with Dual-Contrast Network.

Tao Zhuo Mohan S. Kankanhalli

Loss Function Discovery for Object Detection via Convergence-Simulation Driven Search.

Peidong Liu Gengwei Zhang Bochao Wang Hang Xu Xiaodan Liang Yong Jiang Zhenguo Li

Learning Accurate Entropy Model with Global Reference for Image Compression.

Yichen Qian Zhiyu Tan Xiuyu Sun Ming Lin Dongyang Li Zhenhong Sun Hao Li Rong Jin

What Makes Instance Discrimination Good for Transfer Learning?

Nanxuan Zhao Zhirong Wu Rynson W. H. Lau Stephen Lin

A unifying view on implicit bias in training linear neural networks.

Chulhee Yun Shankar Krishnan Hossein Mobahi

Representation Learning for Sequence Data with Deep Autoencoding Predictive Components.

Junwen Bai Weiran Wang Yingbo Zhou Caiming Xiong

A Mathematical Exploration of Why Language Models Help Solve Downstream Tasks.

Nikunj Saunshi Sadhika Malladi Sanjeev Arora

Policy-Driven Attack: Learning to Query for Hard-label Black-box Adversarial Examples.

Ziang Yan Yiwen Guo Jian Liang Changshui Zhang

Fast And Slow Learning Of Recurrent Independent Mechanisms.

Kanika Madan Nan Rosemary Ke Anirudh Goyal Bernhard Schölkopf Yoshua Bengio

Direction Matters: On the Implicit Bias of Stochastic Gradient Descent with Moderate Learning Rate.

Jingfeng Wu Difan Zou Vladimir Braverman Quanquan Gu

Learning Safe Multi-agent Control with Decentralized Neural Barrier Certificates.

Zengyi Qin Kaiqing Zhang Yuxiao Chen Jingkai Chen Chuchu Fan

Federated Semi-Supervised Learning with Inter-Client Consistency & Disjoint Learning.

Wonyong Jeong Jaehong Yoon Eunho Yang Sung Ju Hwang

Off-Dynamics Reinforcement Learning: Training for Transfer with Domain Classifiers.

Benjamin Eysenbach Shreyas Chaudhari Swapnil Asawa Sergey Levine Ruslan Salakhutdinov

Neural Architecture Search on ImageNet in Four GPU Hours: A Theoretically Inspired Perspective.

Wuyang Chen Xinyu Gong Zhangyang Wang

Semi-supervised Keypoint Localization.

Olga Moskvyak Frédéric Maire Feras Dayoub Mahsa Baktashmotlagh

Learning to Set Waypoints for Audio-Visual Navigation.

Changan Chen Sagnik Majumder Ziad Al-Halah Ruohan Gao Santhosh Kumar Ramakrishnan Kristen Grauman

Do Wide and Deep Networks Learn the Same Things? Uncovering How Neural Network Representations Vary with Width and Depth.

Thao Nguyen Maithra Raghu Simon Kornblith

What Should Not Be Contrastive in Contrastive Learning.

Tete Xiao Xiaolong Wang Alexei A. Efros Trevor Darrell

A Design Space Study for LISTA and Beyond.

Tianjian Meng Xiaohan Chen Yifan Jiang Zhangyang Wang

Rethinking Soft Labels for Knowledge Distillation: A Bias-Variance Tradeoff Perspective.

Helong Zhou Liangchen Song Jiajie Chen Ye Zhou Guoli Wang Junsong Yuan Qian Zhang

Answering Complex Open-Domain Questions with Multi-Hop Dense Retrieval.

Wenhan Xiong Xiang Lorraine Li Srini Iyer Jingfei Du Patrick S. H. Lewis William Yang Wang Yashar Mehdad Scott Yih Sebastian Riedel Douwe Kiela Barlas Oguz

Hierarchical Reinforcement Learning by Discovering Intrinsic Options.

Jesse Zhang Haonan Yu Wei Xu

Denoising Diffusion Implicit Models.

Jiaming Song Chenlin Meng Stefano Ermon

Sliced Kernelized Stein Discrepancy.

Wenbo Gong Yingzhen Li José Miguel Hernández-Lobato

Intraclass clustering: an implicit learning ability that regularizes DNNs.

Simon Carbonnelle Christophe De Vleeschouwer

Contrastive Learning with Hard Negative Samples.

Joshua David Robinson Ching-Yao Chuang Suvrit Sra Stefanie Jegelka

Discrete Graph Structure Learning for Forecasting Multiple Time Series.

Chao Shang Jie Chen Jinbo Bi

Selectivity considered harmful: evaluating the causal impact of class selectivity in DNNs.

Matthew L. Leavitt Ari S. Morcos

A Block Minifloat Representation for Training Deep Neural Networks.

Sean Fox SeyedRamin Rasoulinezhad Julian Faraone David Boland Philip H. W. Leong

On the Impossibility of Global Convergence in Multi-Loss Optimization.

Alistair Letcher

Offline Model-Based Optimization via Normalized Maximum Likelihood Estimation.

Justin Fu Sergey Levine

Self-supervised Representation Learning with Relative Predictive Coding.

Yao-Hung Hubert Tsai Martin Q. Ma Muqiao Yang Han Zhao Louis-Philippe Morency Ruslan Salakhutdinov

Clairvoyance: A Pipeline Toolkit for Medical Time Series.

Daniel Jarrett Jinsung Yoon Ioana Bica Zhaozhi Qian Ari Ercole Mihaela van der Schaar

A PAC-Bayesian Approach to Generalization Bounds for Graph Neural Networks.

Renjie Liao Raquel Urtasun Richard S. Zemel

Heating up decision boundaries: isocapacitory saturation, adversarial scenarios and generalization bounds.

Bogdan Georgiev Lukas Franken Mayukh Mukherjee

CaPC Learning: Confidential and Private Collaborative Learning.

Christopher A. Choquette-Choo Natalie Dullerud Adam Dziedzic Yunxiang Zhang Somesh Jha Nicolas Papernot Xiao Wang

Incorporating Symmetry into Deep Dynamics Models for Improved Generalization.

Rui Wang Robin Walters Rose Yu

Learning with AMIGo: Adversarially Motivated Intrinsic Goals.

Andres Campero Roberta Raileanu Heinrich Küttler Joshua B. Tenenbaum Tim Rocktäschel Edward Grefenstette

Explaining by Imitating: Understanding Decisions by Interpretable Policy Learning.

Alihan Hüyük Daniel Jarrett Cem Tekin Mihaela van der Schaar

IDF++: Analyzing and Improving Integer Discrete Flows for Lossless Compression.

Rianne van den Berg Alexey A. Gritsenko Mostafa Dehghani Casper Kaae Sønderby Tim Salimans

not-MIWAE: Deep Generative Modelling with Missing not at Random Data.

Niels Bruun Ipsen Pierre-Alexandre Mattei Jes Frellsen

Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization.

Zhenggang Tang Chao Yu Boyuan Chen Huazhe Xu Xiaolong Wang Fei Fang Simon Shaolei Du Yu Wang Yi Wu

Distilling Knowledge from Reader to Retriever for Question Answering.

Gautier Izacard Edouard Grave

Adaptive Extra-Gradient Methods for Min-Max Optimization and Games.

Kimon Antonakopoulos Elena Veronica Belmega Panayotis Mertikopoulos

Training with Quantization Noise for Extreme Model Compression.

Pierre Stock Angela Fan Benjamin Graham Edouard Grave Rémi Gribonval Hervé Jégou Armand Joulin

The Role of Momentum Parameters in the Optimal Convergence of Adaptive Polyak's Heavy-ball Methods.

Wei Tao Sheng Long Gaowei Wu Qing Tao

IEPT: Instance-Level and Episode-Level Pretext Tasks for Few-Shot Learning.

Manli Zhang Jianhong Zhang Zhiwu Lu Tao Xiang Mingyu Ding Songfang Huang

Learning to Deceive Knowledge Graph Augmented Models via Targeted Perturbation.

Mrigank Raman Aaron Chan Siddhant Agarwal Peifeng Wang Hansen Wang Sungchul Kim Ryan A. Rossi Handong Zhao Nedim Lipka Xiang Ren

ChipNet: Budget-Aware Pruning with Heaviside Continuous Approximations.

Rishabh Tiwari Udbhav Bamba Arnav Chavan Deepak K. Gupta

Learning Long-term Visual Dynamics with Region Proposal Interaction Networks.

Haozhi Qi Xiaolong Wang Deepak Pathak Yi Ma Jitendra Malik

Text Generation by Learning from Demonstrations.

Richard Yuanzhe Pang He He

Conditional Generative Modeling via Learning the Latent Space.

Sameera Ramasinghe Kanchana Nisal Ranasinghe Salman H. Khan Nick Barnes Stephen Gould

When Optimizing f-Divergence is Robust with Label Noise.

Jiaheng Wei Yang Liu

Contrastive Learning with Adversarial Perturbations for Conditional Text Generation.

Seanie Lee Dong Bok Lee Sung Ju Hwang

Neural Attention Distillation: Erasing Backdoor Triggers from Deep Neural Networks.

Yige Li Xixiang Lyu Nodens Koren Lingjuan Lyu Bo Li Xingjun Ma

Unbiased Teacher for Semi-Supervised Object Detection.

Yen-Cheng Liu Chih-Yao Ma Zijian He Chia-Wen Kuo Kan Chen Peizhao Zhang Bichen Wu Zsolt Kira Peter Vajda

Efficient Reinforcement Learning in Factored MDPs with Application to Constrained RL.

Xiaoyu Chen Jiachen Hu Lihong Li Liwei Wang

Learning with Instance-Dependent Label Noise: A Sample Sieve Approach.

Hao Cheng Zhaowei Zhu Xingyu Li Yifei Gong Xing Sun Yang Liu

Bag of Tricks for Adversarial Training.

Tianyu Pang Xiao Yang Yinpeng Dong Hang Su Jun Zhu

DynaTune: Dynamic Tensor Program Optimization in Deep Neural Network Compilation.

Minjia Zhang Menghao Li Chi Wang Mingqin Li

The Risks of Invariant Risk Minimization.

Elan Rosenfeld Pradeep Kumar Ravikumar Andrej Risteski

DOP: Off-Policy Multi-Agent Decomposed Policy Gradients.

Yihan Wang Beining Han Tonghan Wang Heng Dong Chongjie Zhang

Generative Time-series Modeling with Fourier Flows.

Ahmed M. Alaa Alex James Chan Mihaela van der Schaar

Neural Spatio-Temporal Point Processes.

Ricky T. Q. Chen Brandon Amos Maximilian Nickel

Contemplating Real-World Object Classification.

Ali Borji

Learning Neural Event Functions for Ordinary Differential Equations.

Ricky T. Q. Chen Brandon Amos Maximilian Nickel

Mastering Atari with Discrete World Models.

Danijar Hafner Timothy P. Lillicrap Mohammad Norouzi Jimmy Ba

Single-Timescale Actor-Critic Provably Finds Globally Optimal Policy.

Zuyue Fu Zhuoran Yang Zhaoran Wang

DeLighT: Deep and Light-weight Transformer.

Sachin Mehta Marjan Ghazvininejad Srinivasan Iyer Luke Zettlemoyer Hannaneh Hajishirzi

Domain Generalization with MixStyle.

Kaiyang Zhou Yongxin Yang Yu Qiao Tao Xiang

Concept Learners for Few-Shot Learning.

Kaidi Cao Maria Brbic Jure Leskovec

Creative Sketch Generation.

Songwei Ge Vedanuj Goswami Larry Zitnick Devi Parikh

Rethinking Embedding Coupling in Pre-trained Language Models.

Hyung Won Chung Thibault Févry Henry Tsai Melvin Johnson Sebastian Ruder

Lifelong Learning of Compositional Structures.

Jorge A. Mendez Eric Eaton

Debiasing Concept-based Explanations with Causal Analysis.

Mohammad Taha Bahadori David Heckerman

Learning to Represent Action Values as a Hypergraph on the Action Vertices.

Arash Tavakoli Mehdi Fatemi Petar Kormushev

Categorical Normalizing Flows via Continuous Transformations.

Phillip Lippe Efstratios Gavves

Achieving Linear Speedup with Partial Worker Participation in Non-IID Federated Learning.

Haibo Yang Minghong Fang Jia Liu

Entropic gradient descent algorithms and wide flat minima.

Fabrizio Pittorino Carlo Lucibello Christoph Feinauer Gabriele Perugini Carlo Baldassi Elizaveta Demyanenko Riccardo Zecchina

Collective Robustness Certificates: Exploiting Interdependence in Graph Neural Networks.

Jan Schuchardt Aleksandar Bojchevski Johannes Klicpera Stephan Günnemann

Efficient Generalized Spherical CNNs.

Oliver J. Cobb Christopher G. R. Wallis Augustine N. Mavor-Parker Augustin Marignier Matthew A. Price Mayeul d'Avezac Jason D. McEwen

Learning explanations that are hard to vary.

Giambattista Parascandolo Alexander Neitz Antonio Orvieto Luigi Gresele Bernhard Schölkopf

Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System.

Jianhong Wang Yuan Zhang Tae-Kyun Kim Yunjie Gu

Physics-aware, probabilistic model order reduction with guaranteed stability.

Sebastian Kaltenbach Phaedon-Stelios Koutsourelakis

Revisiting Hierarchical Approach for Persistent Long-Term Video Prediction.

Wonkwang Lee Whie Jung Han Zhang Ting Chen Jing Yu Koh Thomas E. Huang Hyungsuk Yoon Honglak Lee Seunghoon Hong

RODE: Learning Roles to Decompose Multi-Agent Tasks.

Tonghan Wang Tarun Gupta Anuj Mahajan Bei Peng Shimon Whiteson Chongjie Zhang

Neural gradients are near-lognormal: improved quantized and sparse training.

Brian Chmiel Liad Ben-Uri Moran Shkolnik Elad Hoffer Ron Banner Daniel Soudry

Neural Mechanics: Symmetry and Broken Conservation Laws in Deep Learning Dynamics.

Daniel Kunin Javier Sagastuy-Breña Surya Ganguli Daniel L. K. Yamins Hidenori Tanaka

Neural Thompson Sampling.

Weitong Zhang Dongruo Zhou Lihong Li Quanquan Gu

Continuous Wasserstein-2 Barycenter Estimation without Minimax Optimization.

Alexander Korotin Lingxiao Li Justin Solomon Evgeny Burnaev

Heteroskedastic and Imbalanced Deep Learning with Adaptive Regularization.

Kaidi Cao Yining Chen Junwei Lu Nikos Aréchiga Adrien Gaidon Tengyu Ma

Effective and Efficient Vote Attack on Capsule Networks.

Jindong Gu Baoyuan Wu Volker Tresp

Isometric Propagation Network for Generalized Zero-shot Learning.

Lu Liu Tianyi Zhou Guodong Long Jing Jiang Xuanyi Dong Chengqi Zhang

SEED: Self-supervised Distillation For Visual Representation.

Zhiyuan Fang Jianfeng Wang Lijuan Wang Lei Zhang Yezhou Yang Zicheng Liu

A Learning Theoretic Perspective on Local Explainability.

Jeffrey Li Vaishnavh Nagarajan Gregory Plumb Ameet Talwalkar

Unsupervised Audiovisual Synthesis via Exemplar Autoencoders.

Kangle Deng Aayush Bansal Deva Ramanan

Learning Energy-Based Generative Models via Coarse-to-Fine Expanding and Sampling.

Yang Zhao Jianwen Xie Ping Li

Multi-Time Attention Networks for Irregularly Sampled Time Series.

Satya Narayan Shukla Benjamin M. Marlin

DialoGraph: Incorporating Interpretable Strategy-Graph Networks into Negotiation Dialogues.

Rishabh Joshi Vidhisha Balachandran Shikhar Vashishth Alan W. Black Yulia Tsvetkov

Mirostat: a Neural Text decoding Algorithm that directly controls perplexity.

Sourya Basu Govardana Sachitanandam Ramachandran Nitish Shirish Keskar Lav R. Varshney

Contextual Dropout: An Efficient Sample-Dependent Dropout Module.

Xinjie Fan Shujian Zhang Korawat Tanwisuth Xiaoning Qian Mingyuan Zhou

Proximal Gradient Descent-Ascent: Variable Convergence under KŁ Geometry.

Ziyi Chen Yi Zhou Tengyu Xu Yingbin Liang

Protecting DNNs from Theft using an Ensemble of Diverse Models.

Sanjay Kariyappa Atul Prakash Moinuddin K. Qureshi

Large Associative Memory Problem in Neurobiology and Machine Learning.

Dmitry Krotov John J. Hopfield

Efficient Transformers in Reinforcement Learning using Actor-Learner Distillation.

Emilio Parisotto Ruslan Salakhutdinov

Linear Convergent Decentralized Optimization with Compression.

Xiaorui Liu Yao Li Rongrong Wang Jiliang Tang Ming Yan

On the Dynamics of Training Attention Models.

Haoye Lu Yongyi Mao Amiya Nayak

Adaptive Federated Optimization.

Sashank J. Reddi Zachary Charles Manzil Zaheer Zachary Garrett Keith Rush Jakub Konecný Sanjiv Kumar Hugh Brendan McMahan

Improved Estimation of Concentration Under ℓp-Norm Distance Metrics Using Half Spaces.

Jack Prescott Xiao Zhang David Evans

INT: An Inequality Benchmark for Evaluating Generalization in Theorem Proving.

Yuhuai Wu Albert Jiang Jimmy Ba Roger Baker Grosse

A Critique of Self-Expressive Deep Subspace Clustering.

Benjamin David Haeffele Chong You René Vidal

Learning to Recombine and Resample Data For Compositional Generalization.

Ekin Akyürek Afra Feyza Akyürek Jacob Andreas

You Only Need Adversarial Supervision for Semantic Image Synthesis.

Edgar Schönfeld Vadim Sushko Dan Zhang Juergen Gall Bernt Schiele Anna Khoreva

Overparameterisation and worst-case generalisation: friend or foe?

Aditya Krishna Menon Ankit Singh Rawat Sanjiv Kumar

Calibration tests beyond classification.

David Widmann Fredrik Lindsten Dave Zachariah

On the Transfer of Disentangled Representations in Realistic Settings.

Andrea Dittadi Frederik Träuble Francesco Locatello Manuel Wuthrich Vaibhav Agrawal Ole Winther Stefan Bauer Bernhard Schölkopf

Deep Neural Tangent Kernel and Laplace Kernel Have the Same RKHS.

Lin Chen Sheng Xu

Tilted Empirical Risk Minimization.

Tian Li Ahmad Beirami Maziar Sanjabi Virginia Smith

Revisiting Few-sample BERT Fine-tuning.

Tianyi Zhang Felix Wu Arzoo Katiyar Kilian Q. Weinberger Yoav Artzi

Ask Your Humans: Using Human Instructions to Improve Generalization in Reinforcement Learning.

Valerie Chen Abhinav Gupta Kenneth Marino

SSD: A Unified Framework for Self-Supervised Outlier Detection.

Vikash Sehwag Mung Chiang Prateek Mittal

Auxiliary Task Update Decomposition: the Good, the Bad and the neutral.

Lucio M. Dery Yann N. Dauphin David Grangier

Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval.

Lee Xiong Chenyan Xiong Ye Li Kwok-Fung Tang Jialin Liu Paul N. Bennett Junaid Ahmed Arnold Overwijk

Partitioned Learned Bloom Filters.

Kapil Vaidya Eric Knorr Michael Mitzenmacher Tim Kraska

Rank the Episodes: A Simple Approach for Exploration in Procedurally-Generated Environments.

Daochen Zha Wenye Ma Lei Yuan Xia Hu Ji Liu

Federated Learning via Posterior Averaging: A New Perspective and Practical Algorithms.

Maruan Al-Shedivat Jennifer Gillenwater Eric P. Xing Afshin Rostamizadeh

LEAF: A Learnable Frontend for Audio Classification.

Neil Zeghidour Olivier Teboul Félix de Chaumont Quitry Marco Tagliasacchi

Monotonic Kronecker-Factored Lattice.

William Taylor Bakst Nobuyuki Morioka Erez Louidor

Tomographic Auto-Encoder: Unsupervised Bayesian Recovery of Corrupted Data.

Francesco Tonolini Pablo Garcia Moreno Andreas C. Damianou Roderick Murray-Smith

Vulnerability-Aware Poisoning Mechanism for Online RL with Unknown Dynamics.

Yanchao Sun Da Huo Furong Huang

Wasserstein-2 Generative Networks.

Alexander Korotin Vage Egiazarian Arip Asadulaev Alexander Safin Evgeny Burnaev

Emergent Road Rules In Multi-Agent Driving Environments.

Avik Pal Jonah Philion Yuan-Hong Liao Sanja Fidler

Generative Language-Grounded Policy in Vision-and-Language Navigation with Bayes' Rule.

Shuhei Kurita Kyunghyun Cho

Understanding the failure modes of out-of-distribution generalization.

Vaishnavh Nagarajan Anders Andreassen Behnam Neyshabur

Uncertainty Estimation and Calibration with Finite-State Probabilistic RNNs.

Cheng Wang Carolin Lawrence Mathias Niepert

Hopfield Networks is All You Need.

Hubert Ramsauer Bernhard Schäfl Johannes Lehner Philipp Seidl Michael Widrich Lukas Gruber Markus Holzleitner Thomas Adler David P. Kreil Michael K. Kopp Günter Klambauer Johannes Brandstetter Sepp Hochreiter

Interpreting Knowledge Graph Relation Representation from Word Embeddings.

Carl Allen Ivana Balazevic Timothy M. Hospedales

The Importance of Pessimism in Fixed-Dataset Policy Optimization.

Jacob Buckman Carles Gelada Marc G. Bellemare

Accelerating Convergence of Replica Exchange Stochastic Gradient MCMC via Variance Reduction.

Wei Deng Qi Feng Georgios Karagiannis Guang Lin Faming Liang

Representation Balancing Offline Model-based Reinforcement Learning.

Byung-Jun Lee Jongmin Lee Kee-Eung Kim

FairBatch: Batch Selection for Model Fairness.

Yuji Roh Kangwook Lee Steven Euijong Whang Changho Suh

Inductive Representation Learning in Temporal Networks via Causal Anonymous Walks.

Yanbang Wang Yen-Yu Chang Yunyu Liu Jure Leskovec Pan Li

DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial Estimation.

Alexandre Ramé Matthieu Cord

Efficient Inference of Flexible Interaction in Spiking-neuron Networks.

Feng Zhou Yixuan Zhang Jun Zhu

Early Stopping in Deep Networks: Double Descent and How to Eliminate it.

Reinhard Heckel Fatih Furkan Yilmaz

Graph Coarsening with Neural Networks.

Chen Cai Dingkang Wang Yusu Wang

Deep Equals Shallow for ReLU Networks in Kernel Regimes.

Alberto Bietti Francis R. Bach

Optimal Conversion of Conventional Artificial Neural Networks to Spiking Neural Networks.

Shikuang Deng Shi Gu

Are wider nets better given the same number of parameters?

Anna Golubeva Guy Gur-Ari Behnam Neyshabur

DARTS-: Robustly Stepping out of Performance Collapse Without Indicators.

Xiangxiang Chu Xiaoxing Wang Bo Zhang Shun Lu Xiaolin Wei Junchi Yan

Adversarially Guided Actor-Critic.

Yannis Flet-Berliac Johan Ferret Olivier Pietquin Philippe Preux Matthieu Geist

Balancing Constraints and Rewards with Meta-Gradient D4PG.

Dan A. Calian Daniel J. Mankowitz Tom Zahavy Zhongwen Xu Junhyuk Oh Nir Levine Timothy A. Mann

Auxiliary Learning by Implicit Differentiation.

Aviv Navon Idan Achituve Haggai Maron Gal Chechik Ethan Fetaya

Fully Unsupervised Diversity Denoising with Convolutional Variational Autoencoders.

Mangal Prakash Alexander Krull Florian Jug

Distributed Momentum for Byzantine-resilient Stochastic Gradient Descent.

El Mahdi El Mhamdi Rachid Guerraoui Sébastien Rouault

Large-width functional asymptotics for deep Gaussian neural networks.

Daniele Bracale Stefano Favaro Sandra Fortini Stefano Peluchetti

Generalized Multimodal ELBO.

Thomas M. Sutter Imant Daunhawer Julia E. Vogt

Targeted Attack against Deep Neural Networks via Flipping Limited Weight Bits.

Jiawang Bai Baoyuan Wu Yong Zhang Yiming Li Zhifeng Li Shu-Tao Xia

Convex Regularization behind Neural Reconstruction.

Arda Sahiner Morteza Mardani Batu Ozturkler Mert Pilanci John M. Pauly

Efficient Certified Defenses Against Patch Attacks on Image Classifiers.

Jan Hendrik Metzen Maksym Yatsura

Learning Neural Generative Dynamics for Molecular Conformation Generation.

Minkai Xu Shitong Luo Yoshua Bengio Jian Peng Jian Tang

Individually Fair Rankings.

Amanda Bower Hamid Eftekhari Mikhail Yurochkin Yuekai Sun

Hierarchical Autoregressive Modeling for Neural Video Compression.

Ruihan Yang Yibo Yang Joseph Marino Stephan Mandt

Optimizing Memory Placement using Evolutionary Graph Reinforcement Learning.

Shauharda Khadka Estelle Aflalo Mattias Marder Avrech Ben-David Santiago Miret Shie Mannor Tamir Hazan Hanlin Tang Somdeb Majumdar

Robust Reinforcement Learning on State Observations with Learned Optimal Adversary.

Huan Zhang Hongge Chen Duane S. Boning Cho-Jui Hsieh

Auction Learning as a Two-Player Game.

Jad Rahme Samy Jelassi S. Matthew Weinberg

How Much Over-parameterization Is Sufficient to Learn Deep ReLU Networks?

Zixiang Chen Yuan Cao Difan Zou Quanquan Gu

A Diffusion Theory For Deep Learning Dynamics: Stochastic Gradient Descent Exponentially Favors Flat Minima.

Zeke Xie Issei Sato Masashi Sugiyama

Evaluation of Similarity-based Explanations.

Kazuaki Hanawa Sho Yokoi Satoshi Hara Kentaro Inui

Open Question Answering over Tables and Text.

Wenhu Chen Ming-Wei Chang Eva Schlinger William Yang Wang William W. Cohen

The Unreasonable Effectiveness of Patches in Deep Convolutional Kernels Methods.

Louis Thiry Michael Arbel Eugene Belilovsky Edouard Oyallon

Integrating Categorical Semantics into Unsupervised Domain Translation.

Samuel Lavoie-Marchildon Faruk Ahmed Aaron C. Courville

Self-supervised Learning from a Multi-view Perspective.

Yao-Hung Hubert Tsai Yue Wu Ruslan Salakhutdinov Louis-Philippe Morency

Fair Mixup: Fairness via Interpolation.

Ching-Yao Chuang Youssef Mroueh

On the Universality of the Double Descent Peak in Ridgeless Regression.

David Holzmüller

Mind the Gap when Conditioning Amortised Inference in Sequential Latent-Variable Models.

Justin Bayer Maximilian Soelch Atanas Mirchev Baris Kayalibay Patrick van der Smagt

Removing Undesirable Feature Contributions Using Out-of-Distribution Data.

Saehyung Lee Changhwa Park Hyungyu Lee Jihun Yi Jonghyun Lee Sungroh Yoon

Meta-learning Symmetries by Reparameterization.

Allan Zhou Tom Knowles Chelsea Finn

Interpretable Models for Granger Causality Using Self-explaining Neural Networks.

Ricards Marcinkevics Julia E. Vogt

How to Find Your Friendly Neighborhood: Graph Attention Design with Self-Supervision.

Dongkwan Kim Alice Oh

For self-supervised learning, Rationality implies generalization, provably.

Yamini Bansal Gal Kaplun Boaz Barak

A Temporal Kernel Approach for Deep Learning with Continuous-time Information.

Da Xu Chuanwei Ruan Evren Körpeoglu Sushant Kumar Kannan Achan

Improve Object Detection with Feature-based Knowledge Distillation: Towards Accurate and Efficient Detectors.

Linfeng Zhang Kaisheng Ma

Conservative Safety Critics for Exploration.

Homanga Bharadhwaj Aviral Kumar Nicholas Rhinehart Sergey Levine Florian Shkurti Animesh Garg

GraphCodeBERT: Pre-training Code Representations with Data Flow.

Daya Guo Shuo Ren Shuai Lu Zhangyin Feng Duyu Tang Shujie Liu Long Zhou Nan Duan Alexey Svyatkovskiy Shengyu Fu Michele Tufano Shao Kun Deng Colin B. Clement Dawn Drain Neel Sundaresan Jian Yin Daxin Jiang Ming Zhou

No MCMC for me: Amortized sampling for fast and stable training of energy-based models.

Will Sussman Grathwohl Jacob Jin Kelly Milad Hashemi Mohammad Norouzi Kevin Swersky David Duvenaud

BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction.

Yuhang Li Ruihao Gong Xu Tan Yang Yang Peng Hu Qi Zhang Fengwei Yu Wei Wang Shi Gu

Predicting Classification Accuracy When Adding New Unobserved Classes.

Yuli Slavutsky Yuval Benjamini

Estimating and Evaluating Regression Predictive Uncertainty in Deep Object Detectors.

Ali Harakeh Steven L. Waslander

Learning the Pareto Front with Hypernetworks.

Aviv Navon Aviv Shamsian Ethan Fetaya Gal Chechik

Projected Latent Markov Chain Monte Carlo: Conditional Sampling of Normalizing Flows.

Chris Cannella Mohammadreza Soltani Vahid Tarokh

The Recurrent Neural Tangent Kernel.

Sina Alemohammad Zichao Wang Randall Balestriero Richard G. Baraniuk

MODALS: Modality-agnostic Automated Data Augmentation in the Latent Space.

Tsz-Him Cheung Dit-Yan Yeung

Impact of Representation Learning in Linear Bandits.

Jiaqi Yang Wei Hu Jason D. Lee Simon Shaolei Du

EEC: Learning to Encode and Regenerate Images for Continual Learning.

Ali Ayub Alan R. Wagner

What Can You Learn From Your Muscles? Learning Visual Representation from Human Interactions.

Kiana Ehsani Daniel Gordon Thomas Hai Dang Nguyen Roozbeh Mottaghi Ali Farhadi

Improving VAEs' Robustness to Adversarial Attack.

Matthew Willetts Alexander Camuto Tom Rainforth Stephen J. Roberts Christopher C. Holmes

The Deep Bootstrap Framework: Good Online Learners are Good Offline Generalizers.

Preetum Nakkiran Behnam Neyshabur Hanie Sedghi

C-Learning: Learning to Achieve Goals via Recursive Classification.

Benjamin Eysenbach Ruslan Salakhutdinov Sergey Levine

Control-Aware Representations for Model-based Reinforcement Learning.

Brandon Cui Yinlam Chow Mohammad Ghavamzadeh

Scaling Symbolic Methods using Gradients for Neural Model Explanation.

Subham Sekhar Sahoo Subhashini Venugopalan Li Li Rishabh Singh Patrick Riley

Empirical or Invariant Risk Minimization? A Sample Complexity Perspective.

Kartik Ahuja Jun Wang Amit Dhurandhar Karthikeyan Shanmugam Kush R. Varshney

CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and Transfer Learning.

Ossama Ahmed Frederik Träuble Anirudh Goyal Alexander Neitz Manuel Wuthrich Yoshua Bengio Bernhard Schölkopf Stefan Bauer

Gradient Descent on Neural Networks Typically Occurs at the Edge of Stability.

Jeremy M. Cohen Simran Kaur Yuanzhi Li J. Zico Kolter Ameet Talwalkar

The geometry of integration in text classification RNNs.

Kyle Aitken Vinay Venkatesh Ramasesh Ankush Garg Yuan Cao David Sussillo Niru Maheswaranathan

On the Bottleneck of Graph Neural Networks and its Practical Implications.

Uri Alon Eran Yahav

On the Critical Role of Conventions in Adaptive Human-AI Collaboration.

Andy Shih Arjun Sawhney Jovana Kondic Stefano Ermon Dorsa Sadigh

CopulaGNN: Towards Integrating Representational and Correlational Roles of Graphs in Graph Neural Networks.

Jiaqi Ma Bo Chang Xuefei Zhang Qiaozhu Mei

Learning perturbation sets for robust machine learning.

Eric Wong J. Zico Kolter

Primal Wasserstein Imitation Learning.

Robert Dadashi Léonard Hussenot Matthieu Geist Olivier Pietquin

A Universal Representation Transformer Layer for Few-Shot Image Classification.

Lu Liu William L. Hamilton Guodong Long Jing Jiang Hugo Larochelle

MoPro: Webly Supervised Learning with Momentum Prototypes.

Junnan Li Caiming Xiong Steven C. H. Hoi

Signatory: differentiable computations of the signature and logsignature transforms, on both CPU and GPU.

Patrick Kidger Terry J. Lyons

Diverse Video Generation using a Gaussian Process Trigger.

Gaurav Shrivastava Abhinav Shrivastava

Graph Traversal with Tensor Functionals: A Meta-Algorithm for Scalable Learning.

Elan Sopher Markowitz Keshav Balasubramanian Mehrnoosh Mirtaheri Sami Abu-El-Haija Bryan Perozzi Greg Ver Steeg Aram Galstyan

Optimism in Reinforcement Learning with Generalized Linear Function Approximation.

Yining Wang Ruosong Wang Simon Shaolei Du Akshay Krishnamurthy

Deberta: decoding-Enhanced Bert with Disentangled Attention.

Pengcheng He Xiaodong Liu Jianfeng Gao Weizhu Chen

Witches' Brew: Industrial Scale Data Poisoning via Gradient Matching.

Jonas Geiping Liam H. Fowl W. Ronny Huang Wojciech Czaja Gavin Taylor Michael Moeller Tom Goldstein

Variational Information Bottleneck for Effective Low-Resource Fine-Tuning.

Rabeeh Karimi Mahabadi Yonatan Belinkov James Henderson

On the Stability of Fine-tuning BERT: Misconceptions, Explanations, and Strong Baselines.

Marius Mosbach Maksym Andriushchenko Dietrich Klakow

Computational Separation Between Convolutional and Fully-Connected Networks.

Eran Malach Shai Shalev-Shwartz

Probabilistic Numeric Convolutional Neural Networks.

Marc Anton Finzi Roberto Bondesan Max Welling

FairFil: Contrastive Neural Debiasing Method for Pretrained Text Encoders.

Pengyu Cheng Weituo Hao Siyang Yuan Shijing Si Lawrence Carin

MixKD: Towards Efficient Distillation of Large-scale Language Models.

Kevin J. Liang Weituo Hao Dinghan Shen Yufan Zhou Weizhu Chen Changyou Chen Lawrence Carin

Teaching with Commentaries.

Aniruddh Raghu Maithra Raghu Simon Kornblith David Duvenaud Geoffrey E. Hinton

CoDA: Contrast-enhanced and Diversity-promoting Data Augmentation for Natural Language Understanding.

Yanru Qu Dinghan Shen Yelong Shen Sandra Sajeev Weizhu Chen Jiawei Han

Fantastic Four: Differentiable and Efficient Bounds on Singular Values of Convolution Layers.

Sahil Singla Soheil Feizi

Negative Data Augmentation.

Abhishek Sinha Kumar Ayush Jiaming Song Burak Uzkent Hongxia Jin Stefano Ermon

Scalable Transfer Learning with Expert Models.

Joan Puigcerver Carlos Riquelme Ruiz Basil Mustafa Cédric Renggli André Susano Pinto Sylvain Gelly Daniel Keysers Neil Houlsby

Viewmaker Networks: Learning Views for Unsupervised Representation Learning.

Alex Tamkin Mike Wu Noah D. Goodman

A Wigner-Eckart Theorem for Group Equivariant Convolution Kernels.

Leon Lang Maurice Weiler

Learning A Minimax Optimizer: A Pilot Study.

Jiayi Shen Xiaohan Chen Howard Heaton Tianlong Chen Jialin Liu Wotao Yin Zhangyang Wang

Meta Back-Translation.

Hieu Pham Xinyi Wang Yiming Yang Graham Neubig

Optimal Regularization can Mitigate Double Descent.

Preetum Nakkiran Prayaag Venkat Sham M. Kakade Tengyu Ma

Net-DNF: Effective Deep Modeling of Tabular Data.

Liran Katzir Gal Elidan Ran El-Yaniv

MultiModalQA: complex question answering over text, tables and images.

Alon Talmor Ori Yoran Amnon Catav Dan Lahav Yizhong Wang Akari Asai Gabriel Ilharco Hannaneh Hajishirzi Jonathan Berant

AdaGCN: Adaboosting Graph Convolutional Networks into Deep Models.

Ke Sun Zhanxing Zhu Zhouchen Lin

Few-Shot Learning via Learning the Representation, Provably.

Simon Shaolei Du Wei Hu Sham M. Kakade Jason D. Lee Qi Lei

Wandering within a world: Online contextualized few-shot learning.

Mengye Ren Michael Louis Iuzzolino Michael Curtis Mozer Richard S. Zemel

WrapNet: Neural Net Inference with Ultra-Low-Precision Arithmetic.

Renkun Ni Hong-Min Chu Oscar Castañeda Ping-Yeh Chiang Christoph Studer Tom Goldstein

Nearest Neighbor Machine Translation.

Urvashi Khandelwal Angela Fan Dan Jurafsky Luke Zettlemoyer Mike Lewis

Knowledge distillation via softmax regression representation learning.

Jing Yang Brais Martínez Adrian Bulat Georgios Tzimiropoulos

Deep Networks and the Multiple Manifold Problem.

Sam Buchanan Dar Gilboa John Wright

Empirical Analysis of Unlabeled Entity Problem in Named Entity Recognition.

Yangming Li Lemao Liu Shuming Shi

Practical Massively Parallel Monte-Carlo Tree Search Applied to Molecular Design.

Xiufeng Yang Tanuj Kr Aasawat Kazuki Yoshizoe

Neural Pruning via Growing Regularization.

Huan Wang Can Qin Yulun Zhang Yun Fu

Mixed-Features Vectors and Subspace Splitting.

Alejandro Pimentel-Alarcón Daniel L. Pimentel-Alarcón

Taking Notes on the Fly Helps Language Pre-Training.

Qiyu Wu Chen Xing Yatao Li Guolin Ke Di He Tie-Yan Liu

Explainable Deep One-Class Classification.

Philipp Liznerski Lukas Ruff Robert A. Vandermeulen Billy Joe Franks Marius Kloft Klaus-Robert Müller

Revisiting Dynamic Convolution via Matrix Decomposition.

Yunsheng Li Yinpeng Chen Xiyang Dai Mengchen Liu Dongdong Chen Ye Yu Lu Yuan Zicheng Liu Mei Chen Nuno Vasconcelos

RMSprop converges with proper hyper-parameter.

Naichen Shi Dawei Li Mingyi Hong Ruoyu Sun

Gauge Equivariant Mesh CNNs: Anisotropic convolutions on geometric graphs.

Pim de Haan Maurice Weiler Taco Cohen Max Welling

MARS: Markov Molecular Sampling for Multi-objective Drug Discovery.

Yutong Xie Chence Shi Hao Zhou Yuwei Yang Weinan Zhang Yong Yu Lei Li

Quantifying Differences in Reward Functions.

Adam Gleave Michael Dennis Shane Legg Stuart Russell Jan Leike

Stabilized Medical Image Attacks.

Gege Qi Lijun Gong Yibing Song Kai Ma Yefeng Zheng

Memory Optimization for Deep Networks.

Aashaka Shah Chao-Yuan Wu Jayashree Mohan Vijay Chidambaram Philipp Krähenbühl

Neural Topic Model via Optimal Transport.

He Zhao Dinh Phung Viet Huynh Trung Le Wray L. Buntine

Identifying nonlinear dynamical systems with multiple time scales and long-range dependencies.

Dominik Schmidt Georgia Koppe Zahra Monfared Max Beutelspacher Daniel Durstewitz

Self-supervised Visual Reinforcement Learning with Object-centric Representations.

Andrii Zadaianchuk Maximilian Seitzer Georg Martius

Retrieval-Augmented Generation for Code Summarization via Hybrid GNN.

Shangqing Liu Yu Chen Xiaofei Xie Jing Kai Siow Yang Liu

On Self-Supervised Image Representations for GAN Evaluation.

Stanislav Morozov Andrey Voynov Artem Babenko

Fidelity-based Deep Adiabatic Scheduling.

Eli Ovits Lior Wolf

Fast Geometric Projections for Local Robustness Certification.

Aymeric Fromherz Klas Leino Matt Fredrikson Bryan Parno Corina S. Pasareanu

Meta-GMVAE: Mixture of Gaussian VAE for Unsupervised Meta-Learning.

Dong Bok Lee Dongchan Min Seanie Lee Sung Ju Hwang

Mind the Pad - CNNs Can Develop Blind Spots.

Bilal Alsallakh Narine Kokhlikyan Vivek Miglani Jun Yuan Orion Reblitz-Richardson

LambdaNetworks: Modeling long-range Interactions without Attention.

Irwan Bello

Orthogonalizing Convolutional Layers with the Cayley Transform.

Asher Trockman J. Zico Kolter

A Panda? No, It's a Sloth: Slowdown Attacks on Adaptive Multi-Exit Neural Network Inference.

Sanghyun Hong Yigitcan Kaya Ionut-Vlad Modoranu Tudor Dumitras

Neural Approximate Sufficient Statistics for Implicit Models.

Yanzhi Chen Dinghuai Zhang Michael U. Gutmann Aaron C. Courville Zhanxing Zhu

Generalization bounds via distillation.

Daniel Hsu Ziwei Ji Matus Telgarsky Lan Wang

Disentangled Recurrent Wasserstein Autoencoder.

Jun Han Martin Renqiang Min Ligong Han Li Erran Li Xuan Zhang

Sequential Density Ratio Estimation for Simultaneous Optimization of Speed and Accuracy.

Akinori F. Ebihara Taiki Miyagawa Kazuyuki Sakurai Hitoshi Imaoka

Uncertainty Sets for Image Classifiers using Conformal Prediction.

Anastasios Nikolas Angelopoulos Stephen Bates Michael I. Jordan Jitendra Malik

The Intrinsic Dimension of Images and Its Impact on Learning.

Phillip Pope Chen Zhu Ahmed Abdelkader Micah Goldblum Tom Goldstein

Recurrent Independent Mechanisms.

Anirudh Goyal Alex Lamb Jordan Hoffmann Shagun Sodhani Sergey Levine Yoshua Bengio Bernhard Schölkopf

A Gradient Flow Framework For Analyzing Network Pruning.

Ekdeep Singh Lubana Robert P. Dick

Random Feature Attention.

Hao Peng Nikolaos Pappas Dani Yogatama Roy Schwartz Noah A. Smith Lingpeng Kong

Practical Real Time Recurrent Learning with a Sparse Approximation.

Jacob Menick Erich Elsen Utku Evci Simon Osindero Karen Simonyan Alex Graves

HW-NAS-Bench: Hardware-Aware Neural Architecture Search Benchmark.

Chaojian Li Zhongzhi Yu Yonggan Fu Yongan Zhang Yang Zhao Haoran You Qixuan Yu Yue Wang Cong Hao Yingyan Lin

Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels.

Denis Yarats Ilya Kostrikov Rob Fergus

Multivariate Probabilistic Time Series Forecasting via Conditioned Normalizing Flows.

Kashif Rasul Abdul-Saboor Sheikh Ingmar Schuster Urs M. Bergmann Roland Vollgraf

Undistillable: Making A Nasty Teacher That CANNOT teach students.

Haoyu Ma Tianlong Chen Ting-Kuei Hu Chenyu You Xiaohui Xie Zhangyang Wang

Behavioral Cloning from Noisy Demonstrations.

Fumihiro Sasaki Ryota Yamashina

Learning from Protein Structure with Geometric Vector Perceptrons.

Bowen Jing Stephan Eismann Patricia Suriana Raphael John Lamarre Townshend Ron O. Dror

DeepAveragers: Offline Reinforcement Learning By Solving Derived Non-Parametric MDPs.

Aayam Kumar Shrestha Stefan Lee Prasad Tadepalli Alan Fern

Async-RED: A Provably Convergent Asynchronous Block Parallel Stochastic Method using Deep Denoising Priors.

Yu Sun Jiaming Liu Yiran Sun Brendt Wohlberg Ulugbek Kamilov

Distributional Sliced-Wasserstein and Applications to Generative Modeling.

Khai Nguyen Nhat Ho Tung Pham Hung Bui

Beyond Fully-Connected Layers with Quaternions: Parameterization of Hypercomplex Multiplications with 1/n Parameters.

Aston Zhang Yi Tay Shuai Zhang Alvin Chan Anh Tuan Luu Siu Cheung Hui Jie Fu

Mathematical Reasoning via Self-supervised Skip-tree Training.

Markus Norman Rabe Dennis Lee Kshitij Bansal Christian Szegedy

Generalization in data-driven models of primary visual cortex.

Konstantin-Klemens Lurz Mohammad Bashiri Konstantin Willeke Akshay Jagadish Eric Wang Edgar Y. Walker Santiago A. Cadena Taliah Muhammad Erick Cobos Andreas S. Tolias Alexander S. Ecker Fabian H. Sinz

Implicit Convex Regularizers of CNN Architectures: Convex Optimization of Two- and Three-Layer Networks in Polynomial Time.

Tolga Ergen Mert Pilanci

On Statistical Bias In Active Learning: How and When to Fix It.

Sebastian Farquhar Yarin Gal Tom Rainforth

Unsupervised Object Keypoint Learning using Local Spatial Predictability.

Anand Gopalakrishnan Sjoerd van Steenkiste Jürgen Schmidhuber

Differentially Private Learning Needs Better Features (or Much More Data).

Florian Tramèr Dan Boneh

Long-tailed Recognition by Routing Diverse Distribution-Aware Experts.

Xudong Wang Long Lian Zhongqi Miao Ziwei Liu Stella X. Yu

Grounded Language Learning Fast and Slow.

Felix Hill Olivier Tieleman Tamara von Glehn Nathaniel Wong Hamza Merzic Stephen Clark

The Traveling Observer Model: Multi-task Learning Through Spatial Variable Embeddings.

Elliot Meyerson Risto Miikkulainen

Learning Incompressible Fluid Dynamics from Scratch - Towards Fast, Differentiable Fluid Models that Generalize.

Nils Wandel Michael Weinmann Reinhard Klein

Winning the L2RPN Challenge: Power Grid Management via Semi-Markov Afterstate Actor-Critic.

Deunsol Yoon Sunghoon Hong Byung-Jun Lee Kee-Eung Kim

Support-set bottlenecks for video-text representation learning.

Mandela Patrick Po-Yao Huang Yuki Markus Asano Florian Metze Alexander G. Hauptmann João F. Henriques Andrea Vedaldi

Implicit Normalizing Flows.

Cheng Lu Jianfei Chen Chongxuan Li Qiuhao Wang Jun Zhu

PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable Physics.

Zhiao Huang Yuanming Hu Tao Du Siyuan Zhou Hao Su Joshua B. Tenenbaum Chuang Gan

Influence Estimation for Generative Adversarial Networks.

Naoyuki Terashita Hiroki Ohashi Yuichi Nonaka Takashi Kanemaru

Emergent Symbols through Binding in External Memory.

Taylor Whittington Webb Ishan Sinha Jonathan D. Cohen

Correcting experience replay for multi-agent communication.

Sanjeevan Ahilan Peter Dayan

How Benign is Benign Overfitting ?

Amartya Sanyal Puneet K. Dokania Varun Kanade Philip H. S. Torr

Structured Prediction as Translation between Augmented Natural Languages.

Giovanni Paolini Ben Athiwaratkun Jason Krone Jie Ma Alessandro Achille Rishita Anubhai Cícero Nogueira dos Santos Bing Xiang Stefano Soatto

On the Theory of Implicit Deep Learning: Global Convergence with Implicit Layers.

Kenji Kawaguchi

Towards Robustness Against Natural Language Word Substitutions.

Xinshuai Dong Anh Tuan Luu Rongrong Ji Hong Liu

Minimum Width for Universal Approximation.

Sejun Park Chulhee Yun Jaeho Lee Jinwoo Shin

Regularization Matters in Policy Optimization - An Empirical Study on Continuous Control.

Zhuang Liu Xuanlin Li Bingyi Kang Trevor Darrell

Predicting Infectiousness for Proactive Contact Tracing.

Yoshua Bengio Prateek Gupta Tegan Maharaj Nasim Rahaman Martin Weiss Tristan Deleu Eilif Benjamin Müller Meng Qu Victor Schmidt Pierre-Luc St-Charles Hannah Alsdurf Olexa Bilaniuk David L. Buckeridge Gaétan Marceau-Caron Pierre Luc Carrier Joumana Ghosn Satya Ortiz-Gagne Christopher J. Pal Irina Rish Bernhard Schölkopf Abhinav Sharma Jian Tang Andrew Williams

Are Neural Rankers still Outperformed by Gradient Boosted Decision Trees?

Zhen Qin Le Yan Honglei Zhuang Yi Tay Rama Kumar Pasumarthi Xuanhui Wang Michael Bendersky Marc Najork

Topology-Aware Segmentation Using Discrete Morse Theory.

Xiaoling Hu Yusu Wang Fuxin Li Dimitris Samaras Chao Chen

Contrastive Divergence Learning is a Time Reversal Adversarial Game.

Omer Yair Tomer Michaeli

GAN "Steerability" without optimization.

Nurit Spingarn Ron Banner Tomer Michaeli

Tent: Fully Test-Time Adaptation by Entropy Minimization.

Dequan Wang Evan Shelhamer Shaoteng Liu Bruno A. Olshausen Trevor Darrell

Deep Neural Network Fingerprinting by Conferrable Adversarial Examples.

Nils Lukas Yuxuan Zhang Florian Kerschbaum

Interpreting Graph Neural Networks for NLP With Differentiable Edge Masking.

Michael Sejr Schlichtkrull Nicola De Cao Ivan Titov

Regularized Inverse Reinforcement Learning.

Wonseok Jeon Chen-Yang Su Paul Barde Thang Doan Derek Nowrouzezahrai Joelle Pineau

Graph Convolution with Low-rank Learnable Local Filters.

Xiuyuan Cheng Zichen Miao Qiang Qiu

Locally Free Weight Sharing for Network Width Search.

Xiu Su Shan You Tao Huang Fei Wang Chen Qian Changshui Zhang Chang Xu

Learning Mesh-Based Simulation with Graph Networks.

Tobias Pfaff Meire Fortunato Alvaro Sanchez-Gonzalez Peter W. Battaglia

Unlearnable Examples: Making Personal Data Unexploitable.

Hanxun Huang Xingjun Ma Sarah Monazam Erfani James Bailey Yisen Wang

What are the Statistical Limits of Offline RL with Linear Function Approximation?

Ruosong Wang Dean P. Foster Sham M. Kakade

Improving Adversarial Robustness via Channel-wise Activation Suppressing.

Yang Bai Yuyuan Zeng Yong Jiang Shu-Tao Xia Xingjun Ma Yisen Wang

BUSTLE: Bottom-Up Program Synthesis Through Learning-Guided Exploration.

Augustus Odena Kensen Shi David Bieber Rishabh Singh Charles Sutton Hanjun Dai

UPDeT: Universal Multi-agent RL via Policy Decoupling with Transformers.

Siyi Hu Fengda Zhu Xiaojun Chang Xiaodan Liang

A Good Image Generator Is What You Need for High-Resolution Video Synthesis.

Yu Tian Jian Ren Menglei Chai Kyle Olszewski Xi Peng Dimitris N. Metaxas Sergey Tulyakov

Watch-And-Help: A Challenge for Social Perception and Human-AI Collaboration.

Xavier Puig Tianmin Shu Shuang Li Zilin Wang Yuan-Hong Liao Joshua B. Tenenbaum Sanja Fidler Antonio Torralba

Data-Efficient Reinforcement Learning with Self-Predictive Representations.

Max Schwarzer Ankesh Anand Rishab Goel R. Devon Hjelm Aaron C. Courville Philip Bachman

Very Deep VAEs Generalize Autoregressive Models and Can Outperform Them on Images.

Rewon Child

PMI-Masking: Principled masking of correlated spans.

Yoav Levine Barak Lenz Opher Lieber Omri Abend Kevin Leyton-Brown Moshe Tennenholtz Yoav Shoham

Sharpness-aware Minimization for Efficiently Improving Generalization.

Pierre Foret Ariel Kleiner Hossein Mobahi Behnam Neyshabur

Self-Supervised Policy Adaptation during Deployment.

Nicklas Hansen Rishabh Jangir Yu Sun Guillem Alenyà Pieter Abbeel Alexei A. Efros Lerrel Pinto Xiaolong Wang

Large Scale Image Completion via Co-Modulated Generative Adversarial Networks.

Shengyu Zhao Jonathan Cui Yilun Sheng Yue Dong Xiao Liang Eric I-Chao Chang Yan Xu

Individually Fair Gradient Boosting.

Alexander Vargo Fan Zhang Mikhail Yurochkin Yuekai Sun

Dataset Inference: Ownership Resolution in Machine Learning.

Pratyush Maini Mohammad Yaghini Nicolas Papernot

How Does Mixup Help With Robustness and Generalization?

Linjun Zhang Zhun Deng Kenji Kawaguchi Amirata Ghorbani James Zou

Benefit of deep learning with non-convex noisy gradient descent: Provable excess risk bound and superiority to kernel methods.

Taiji Suzuki Shunta Akiyama

Mutual Information State Intrinsic Control.

Rui Zhao Yang Gao Pieter Abbeel Volker Tresp Wei Xu

Information Laundering for Model Privacy.

Xinran Wang Yu Xiang Jun Gao Jie Ding

Learning with Feature-Dependent Label Noise: A Progressive Approach.

Yikai Zhang Songzhu Zheng Pengxiang Wu Mayank Goswami Chao Chen

DDPNOpt: Differential Dynamic Programming Neural Optimizer.

Guan-Horng Liu Tianrong Chen Evangelos A. Theodorou

Long-tail learning via logit adjustment.

Aditya Krishna Menon Sadeep Jayasumana Ankit Singh Rawat Himanshu Jain Andreas Veit Sanjiv Kumar

Understanding the role of importance weighting for deep learning.

Da Xu Yuting Ye Chuanwei Ruan

Iterative Empirical Game Solving via Single Policy Best Response.

Max Olan Smith Thomas Anthony Michael P. Wellman

Systematic generalisation with group invariant predictions.

Faruk Ahmed Yoshua Bengio Harm van Seijen Aaron C. Courville

Autoregressive Entity Retrieval.

Nicola De Cao Gautier Izacard Sebastian Riedel Fabio Petroni

Deciphering and Optimizing Multi-Task Learning: a Random Matrix Approach.

Malik Tiomoko Hafiz Tiomoko Ali Romain Couillet

Learning-based Support Estimation in Sublinear Time.

Talya Eden Piotr Indyk Shyam Narayanan Ronitt Rubinfeld Sandeep Silwal Tal Wagner

Geometry-Aware Gradient Algorithms for Neural Architecture Search.

Liam Li Mikhail Khodak Nina Balcan Ameet Talwalkar

VAEBM: A Symbiosis between Variational Autoencoders and Energy-based Models.

Zhisheng Xiao Karsten Kreis Jan Kautz Arash Vahdat

Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning.

Rishabh Agarwal Marlos C. Machado Pablo Samuel Castro Marc G. Bellemare

Noise against noise: stochastic label noise helps combat inherent label noise.

Pengfei Chen Guangyong Chen Junjie Ye Jingwei Zhao Pheng-Ann Heng

Model-Based Visual Planning with Self-Supervised Functional Distances.

Stephen Tian Suraj Nair Frederik Ebert Sudeep Dasari Benjamin Eysenbach Chelsea Finn Sergey Levine

Discovering a set of policies for the worst case reward.

Tom Zahavy André Barreto Daniel J. Mankowitz Shaobo Hou Brendan O'Donoghue Iurii Kemaev Satinder Singh

Expressive Power of Invariant and Equivariant Graph Neural Networks.

Waiss Azizian Marc Lelarge

Learning a Latent Simplex in Input Sparsity Time.

Ainesh Bakshi Chiranjib Bhattacharyya Ravi Kannan David P. Woodruff Samson Zhou

CPT: Efficient Deep Neural Network Training via Cyclic Precision.

Yonggan Fu Han Guo Meng Li Xin Yang Yining Ding Vikas Chandra Yingyan Lin

Gradient Vaccine: Investigating and Improving Multi-task Optimization in Massively Multilingual Models.

Zirui Wang Yulia Tsvetkov Orhan Firat Yuan Cao

Dynamic Tensor Rematerialization.

Marisa Kirisame Steven Lyubomirsky Altan Haan Jennifer Brennan Mike He Jared Roesch Tianqi Chen Zachary Tatlock

Graph-Based Continual Learning.

Binh Tang David S. Matteson

Sparse Quantized Spectral Clustering.

Zhenyu Liao Romain Couillet Michael W. Mahoney

Coupled Oscillatory Recurrent Neural Network (coRNN): An accurate and (gradient) stable architecture for learning long time dependencies.

T. Konstantin Rusch Siddhartha Mishra

Iterated learning for emergent systematicity in VQA.

Ankit Vani Max Schwarzer Yuchen Lu Eeshan Dhekane Aaron C. Courville

Why Are Convolutional Nets More Sample-Efficient than Fully-Connected Nets?

Zhiyuan Li Yi Zhang Sanjeev Arora

Gradient Projection Memory for Continual Learning.

Gobinda Saha Isha Garg Kaushik Roy

MONGOOSE: A Learnable LSH Framework for Efficient Neural Network Training.

Beidi Chen Zichang Liu Binghui Peng Zhaozhuo Xu Jonathan Lingjie Li Tri Dao Zhao Song Anshumali Shrivastava Christopher Ré

Improved Autoregressive Modeling with Distribution Smoothing.

Chenlin Meng Jiaming Song Yang Song Shengjia Zhao Stefano Ermon

Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions.

Zhengxian Lin Kin-Ho Lam Alan Fern

How Neural Networks Extrapolate: From Feedforward to Graph Neural Networks.

Keyulu Xu Mozhi Zhang Jingling Li Simon Shaolei Du Ken-ichi Kawarabayashi Stefanie Jegelka

Image GANs meet Differentiable Rendering for Inverse Graphics and Interpretable 3D Neural Rendering.

Yuxuan Zhang Wenzheng Chen Huan Ling Jun Gao Yinan Zhang Antonio Torralba Sanja Fidler

Share or Not? Learning to Schedule Language-Specific Capacity for Multilingual Translation.

Biao Zhang Ankur Bapna Rico Sennrich Orhan Firat

Score-Based Generative Modeling through Stochastic Differential Equations.

Yang Song Jascha Sohl-Dickstein Diederik P. Kingma Abhishek Kumar Stefano Ermon Ben Poole

Self-training For Few-shot Transfer Across Extreme Task Differences.

Cheng Perng Phoo Bharath Hariharan

Towards Nonlinear Disentanglement in Natural Data with Temporal Sparse Coding.

David A. Klindt Lukas Schott Yash Sharma Ivan Ustyuzhaninov Wieland Brendel Matthias Bethge Dylan M. Paiton

Complex Query Answering with Neural Link Predictors.

Erik Arakelyan Daniel Daza Pasquale Minervini Michael Cochez

Augmenting Physical Models with Deep Networks for Complex Dynamics Forecasting.

Yuan Yin Vincent Le Guen Jérémie Donà Emmanuel de Bézenac Ibrahim Ayed Nicolas Thome Patrick Gallinari

EigenGame: PCA as a Nash Equilibrium.

Ian M. Gemp Brian McWilliams Claire Vernade Thore Graepel

Deformable DETR: Deformable Transformers for End-to-End Object Detection.

Xizhou Zhu Weijie Su Lewei Lu Bin Li Xiaogang Wang Jifeng Dai

Growing Efficient Deep Networks by Structured Continuous Sparsification.

Xin Yuan Pedro Henrique Pamplona Savarese Michael Maire

Evolving Reinforcement Learning Algorithms.

John D. Co-Reyes Yingjie Miao Daiyi Peng Esteban Real Quoc V. Le Sergey Levine Honglak Lee Aleksandra Faust

SMiRL: Surprise Minimizing Reinforcement Learning in Unstable Environments.

Glen Berseth Daniel Geng Coline Manon Devin Nicholas Rhinehart Chelsea Finn Dinesh Jayaraman Sergey Levine

On the mapping between Hopfield networks and Restricted Boltzmann Machines.

Matthew Smart Anton Zilman

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.

Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai Thomas Unterthiner Mostafa Dehghani Matthias Minderer Georg Heigold Sylvain Gelly Jakob Uszkoreit Neil Houlsby

DiffWave: A Versatile Diffusion Model for Audio Synthesis.

Zhifeng Kong Wei Ping Jiaji Huang Kexin Zhao Bryan Catanzaro

Neural Synthesis of Binaural Speech From Mono Audio.

Alexander Richard Dejan Markovic Israel D. Gebru Steven Krenn Gladstone Alexander Butler Fernando De la Torre Yaser Sheikh

Rethinking the Role of Gradient-based Attribution Methods for Model Interpretability.

Suraj Srinivas François Fleuret

VCNet and Functional Targeted Regularization For Learning Causal Effects of Continuous Treatments.

Lizhen Nie Mao Ye Qiang Liu Dan Nicolae

Do 2D GANs Know 3D Shape? Unsupervised 3D Shape Reconstruction from 2D Image GANs.

Xingang Pan Bo Dai Ziwei Liu Chen Change Loy Ping Luo

Learning Invariant Representations for Reinforcement Learning without Reconstruction.

Amy Zhang Rowan Thomas McAllister Roberto Calandra Yarin Gal Sergey Levine

Parrot: Data-Driven Behavioral Priors for Reinforcement Learning.

Avi Singh Huihan Liu Gaoyue Zhou Albert Yu Nicholas Rhinehart Sergey Levine

Human-Level Performance in No-Press Diplomacy via Equilibrium Search.

Jonathan Gray Adam Lerer Anton Bakhtin Noam Brown

Learning Cross-Domain Correspondence for Control with Dynamics Cycle-Consistency.

Qiang Zhang Tete Xiao Alexei A. Efros Lerrel Pinto Xiaolong Wang

A Distributional Approach to Controlled Text Generation.

Muhammad Khalifa Hady Elsahar Marc Dymetman

Rethinking Architecture Selection in Differentiable NAS.

Ruochen Wang Minhao Cheng Xiangning Chen Xiaocheng Tang Cho-Jui Hsieh

Dataset Condensation with Gradient Matching.

Bo Zhao Konda Reddy Mopuri Hakan Bilen

End-to-end Adversarial Text-to-Speech.

Jeff Donahue Sander Dieleman Mikolaj Binkowski Erich Elsen Karen Simonyan

SenSeI: Sensitive Set Invariance for Enforcing Individual Fairness.

Mikhail Yurochkin Yuekai Sun

Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity.

Jang-Hyun Kim Wonho Choo Hosan Jeong Hyun Oh Song

Geometry-aware Instance-reweighted Adversarial Training.

Jingfeng Zhang Jianing Zhu Gang Niu Bo Han Masashi Sugiyama Mohan S. Kankanhalli

Federated Learning Based on Dynamic Regularization.

Durmus Alp Emre Acar Yue Zhao Ramon Matas Navarro Matthew Mattina Paul N. Whatmough Venkatesh Saligrama

When Do Curricula Work?

Xiaoxia Wu Ethan Dyer Behnam Neyshabur

Getting a CLUE: A Method for Explaining Uncertainty Estimates.

Javier Antorán Umang Bhatt Tameem Adel Adrian Weller José Miguel Hernández-Lobato

Rethinking Attention with Performers.

Krzysztof Marcin Choromanski Valerii Likhosherstov David Dohan Xingyou Song Andreea Gane Tamás Sarlós Peter Hawkins Jared Quincy Davis Afroz Mohiuddin Lukasz Kaiser David Benjamin Belanger Lucy J. Colwell Adrian Weller

Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient Estimator.

Max B. Paulus Chris J. Maddison Andreas Krause

Global Convergence of Three-layer Neural Networks in the Mean Field Regime.

Huy Tuan Pham Phan-Minh Nguyen

Learning Generalizable Visual Representations via Interactive Gameplay.

Luca Weihs Aniruddha Kembhavi Kiana Ehsani Sarah M. Pratt Winson Han Alvaro Herrasti Eric Kolve Dustin Schwenk Roozbeh Mottaghi Ali Farhadi

Randomized Automatic Differentiation.

Deniz Oktay Nick McGreivy Joshua Aduol Alex Beatson Ryan P. Adams

Scalable Learning and MAP Inference for Nonsymmetric Determinantal Point Processes.

Mike Gartrell Insu Han Elvis Dohmatob Jennifer Gillenwater Victor-Emmanuel Brunel

Free Lunch for Few-shot Learning: Distribution Calibration.

Shuo Yang Lu Liu Min Xu

Optimal Rates for Averaged Stochastic Gradient Descent under Neural Tangent Kernel Regime.

Atsushi Nitanda Taiji Suzuki

Deep symbolic regression: Recovering mathematical expressions from data via risk-seeking policy gradients.

Brenden K. Petersen Mikel Landajuela Larma T. Nathan Mundhenk Cláudio Prata Santiago Sookyung Kim Joanne Taery Kim

Learning to Reach Goals via Iterated Supervised Learning.

Dibya Ghosh Abhishek Gupta Ashwin Reddy Justin Fu Coline Manon Devin Benjamin Eysenbach Sergey Levine

Theoretical Analysis of Self-Training with Deep Networks on Unlabeled Data.

Colin Wei Kendrick Shen Yining Chen Tengyu Ma

What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study.

Marcin Andrychowicz Anton Raichuk Piotr Stanczyk Manu Orsini Sertan Girgin Raphaël Marinier Léonard Hussenot Matthieu Geist Olivier Pietquin Marcin Michalski Sylvain Gelly Olivier Bachem