ICLR 2020论文列表 - 8th International Conference on Learning Representations, ICLR 2020, Addis Ababa, Ethiopia, April 26-30, 2020.| 数据学习 (DataLearner)

ICLR 2020 论文列表

8th International Conference on Learning Representations, ICLR 2020, Addis Ababa, Ethiopia, April 26-30, 2020.

Federated Learning with Matched Averaging.

Hongyi Wang Mikhail Yurochkin Yuekai Sun Dimitris S. Papailiopoulos Yasaman Khazaeni

Differentiable Reasoning over a Virtual Knowledge Base.

Bhuwan Dhingra Manzil Zaheer Vidhisha Balachandran Graham Neubig Ruslan Salakhutdinov William W. Cohen

Adversarial Training and Provable Defenses: Bridging the Gap.

Mislav Balunovic Martin T. Vechev

Gradient Descent Maximizes the Margin of Homogeneous Neural Networks.

Kaifeng Lyu Jian Li

Convolutional Conditional Neural Processes.

Jonathan Gordon Wessel P. Bruinsma Andrew Y. K. Foong James Requeima Yann Dubois Richard E. Turner

Meta-Learning with Warped Gradient Descent.

Sebastian Flennerhag Andrei A. Rusu Razvan Pascanu Francesco Visin Hujun Yin Raia Hadsell

SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference.

Lasse Espeholt Raphaël Marinier Piotr Stanczyk Ke Wang Marcin Michalski

High Fidelity Speech Synthesis with Adversarial Networks.

Mikolaj Binkowski Jeff Donahue Sander Dieleman Aidan Clark Erich Elsen Norman Casagrande Luis C. Cobo Karen Simonyan

A Generalized Training Approach for Multiagent Learning.

Paul Muller Shayegan Omidshafiei Mark Rowland Karl Tuyls Julien Pérolat Siqi Liu Daniel Hennes Luke Marris Marc Lanctot Edward Hughes Zhe Wang Guy Lever Nicolas Heess Thore Graepel Rémi Munos

Building Deep Equivariant Capsule Networks.

Sai Raam Venkataraman S. Balasubramanian R. Raghunatha Sarma

Restricting the Flow: Information Bottlenecks for Attribution.

Karl Schulz Leon Sixt Federico Tombari Tim Landgraf

Intrinsically Motivated Discovery of Diverse Patterns in Self-Organizing Systems.

Chris Reinke Mayalen Etcheverry Pierre-Yves Oudeyer

Causal Discovery with Reinforcement Learning.

Shengyu Zhu Ignavier Ng Zhitang Chen

Rotation-invariant clustering of neuronal responses in primary visual cortex.

Ivan Ustyuzhaninov Santiago A. Cadena Emmanouil Froudarakis Paul G. Fahey Edgar Y. Walker Erick Cobos Jacob Reimer Fabian H. Sinz Andreas S. Tolias Matthias Bethge Alexander S. Ecker

Reformer: The Efficient Transformer.

Nikita Kitaev Lukasz Kaiser Anselm Levskaya

Target-Embedding Autoencoders for Supervised Representation Learning.

Daniel Jarrett Mihaela van der Schaar

Watch the Unobserved: A Simple Approach to Parallelizing Monte Carlo Tree Search.

Anji Liu Jianshu Chen Mingze Yu Yu Zhai Xuewen Zhou Ji Liu

RNA Secondary Structure Prediction By Learning Unrolled Algorithms.

Xinshi Chen Yu Li Ramzan Umarov Xin Gao Le Song

Learning to Balance: Bayesian Meta-Learning for Imbalanced and Out-of-distribution Tasks.

Haebeom Lee Hayeon Lee Donghyun Na Saehoon Kim Minseop Park Eunho Yang Sung Ju Hwang

Fast Task Inference with Variational Intrinsic Successor Features.

Steven Hansen Will Dabney André Barreto David Warde-Farley Tom Van de Wiele Volodymyr Mnih

Implementation Matters in Deep RL: A Case Study on PPO and TRPO.

Logan Engstrom Andrew Ilyas Shibani Santurkar Dimitris Tsipras Firdaus Janoos Larry Rudolph Aleksander Madry

A Closer Look at Deep Policy Gradients.

Andrew Ilyas Logan Engstrom Shibani Santurkar Dimitris Tsipras Firdaus Janoos Larry Rudolph Aleksander Madry

Understanding and Robustifying Differentiable Architecture Search.

Arber Zela Thomas Elsken Tonmoy Saikia Yassine Marrakchi Thomas Brox Frank Hutter

Deep Batch Active Learning by Diverse, Uncertain Gradient Lower Bounds.

Jordan T. Ash Chicheng Zhang Akshay Krishnamurthy John Langford Alekh Agarwal

Geometric Analysis of Nonconvex Optimization Landscapes for Overcomplete Learning.

Qing Qu Yuexiang Zhai Xiao Li Yuqian Zhang Zhihui Zhu

A Theory of Usable Information under Computational Constraints.

Yilun Xu Shengjia Zhao Jiaming Song Russell Stewart Stefano Ermon

Mathematical Reasoning in Latent Space.

Dennis Lee Christian Szegedy Markus N. Rabe Sarah M. Loos Kshitij Bansal

Meta-Q-Learning.

Rasool Fakoor Pratik Chaudhari Stefano Soatto Alexander J. Smola

Comparing Rewinding and Fine-tuning in Neural Network Pruning.

Alex Renda Jonathan Frankle Michael Carbin

Harnessing Structures for Value-Based Planning and Reinforcement Learning.

Yuzhe Yang Guo Zhang Zhi Xu Dina Katabi

GraphZoom: A Multi-level Spectral Approach for Accurate and Scalable Graph Embedding.

Chenhui Deng Zhiqiang Zhao Yongyu Wang Zhiru Zhang Zhuo Feng

Optimal Strategies Against Generative Attacks.

Roy Mor Erez Peterfreund Matan Gavish Amir Globerson

Dynamics-Aware Unsupervised Discovery of Skills.

Archit Sharma Shixiang Gu Sergey Levine Vikash Kumar Karol Hausman

Your classifier is secretly an energy based model and you should treat it like one.

Will Grathwohl Kuan-Chieh Wang Jörn-Henrik Jacobsen David Duvenaud Mohammad Norouzi Kevin Swersky

Cyclical Stochastic Gradient MCMC for Bayesian Deep Learning.

Ruqi Zhang Chunyuan Li Jianyi Zhang Changyou Chen Andrew Gordon Wilson

Mirror-Generative Neural Machine Translation.

Zaixiang Zheng Hao Zhou Shujian Huang Lei Li Xin-Yu Dai Jiajun Chen

Learning Hierarchical Discrete Linguistic Units from Visually-Grounded Speech.

David Harwath Wei-Ning Hsu James R. Glass

Mogrifier LSTM.

Gábor Melis Tomás Kociský Phil Blunsom

Posterior sampling for multi-agent reinforcement learning: solving extensive games with imperfect information.

Yichi Zhou Jialian Li Jun Zhu

Why Gradient Clipping Accelerates Training: A Theoretical Justification for Adaptivity.

Jingzhao Zhang Tianxing He Suvrit Sra Ali Jadbabaie

Neural Network Branching for Neural Network Verification.

Jingyue Lu M. Pawan Kumar

Contrastive Learning of Structured World Models.

Thomas N. Kipf Elise van der Pol Max Welling

Data-dependent Gaussian Prior Objective for Language Generation.

Zuchao Li Rui Wang Kehai Chen Masao Utiyama Eiichiro Sumita Zhuosheng Zhang Hai Zhao

On the Convergence of FedAvg on Non-IID Data.

Xiang Li Kaixuan Huang Wenhao Yang Shusen Wang Zhihua Zhang

Principled Weight Initialization for Hypernetworks.

Oscar Chang Lampros Flokas Hod Lipson

GenDICE: Generalized Offline Estimation of Stationary Values.

Ruiyi Zhang Bo Dai Lihong Li Dale Schuurmans

BackPACK: Packing more into Backprop.

Felix Dangel Frederik Kunstner Philipp Hennig

CATER: A diagnostic dataset for Compositional Actions & TEmporal Reasoning.

Rohit Girdhar Deva Ramanan

Geom-GCN: Geometric Graph Convolutional Networks.

Hongbin Pei Bingzhe Wei Kevin Chen-Chuan Chang Yu Lei Bo Yang

An Exponential Learning Rate Schedule for Deep Learning.

Zhiyuan Li Sanjeev Arora

Progressive Learning and Disentanglement of Hierarchical Representations.

Zhiyuan Li Jaideep Vitthal Murkute Prashnna Kumar Gyawali Linwei Wang

Reconstructing continuous distributions of 3D protein structure from cryo-EM images.

Ellen D. Zhong Tristan Bepler Joseph H. Davis Bonnie Berger

Generalization of Two-layer Neural Networks: An Asymptotic Viewpoint.

Jimmy Ba Murat A. Erdogdu Taiji Suzuki Denny Wu Tianzong Zhang

Depth-Width Trade-offs for ReLU Networks via Sharkovsky's Theorem.

Vaggos Chatziafratis Sai Ganesh Nagarajan Ioannis Panageas Xiao Wang

Energy-based models for atomic-resolution protein conformations.

Yilun Du Joshua Meier Jerry Ma Rob Fergus Alexander Rives

A Mutual Information Maximization Perspective of Language Representation Learning.

Lingpeng Kong Cyprien de Masson d'Autume Lei Yu Wang Ling Zihang Dai Dani Yogatama

Unbiased Contrastive Divergence Algorithm for Training Energy-Based Latent Variable Models.

Yixuan Qiu Lingsong Zhang Xiao Wang

Making Sense of Reinforcement Learning and Probabilistic Inference.

Brendan O'Donoghue Ian Osband Catalin Ionescu

Deep Learning For Symbolic Mathematics.

Guillaume Lample François Charton

SUMO: Unbiased Estimation of Log Marginal Probability for Latent Variable Models.

Yucen Luo Alex Beatson Mohammad Norouzi Jun Zhu David Duvenaud Ryan P. Adams Ricky T. Q. Chen

DeepSphere: a graph-based spherical CNN.

Michaël Defferrard Martino Milani Frédérick Gusset Nathanaël Perraudin

Neural Arithmetic Units.

Andreas Madsen Alexander Rosenberg Johansen

Truth or backpropaganda? An empirical investigation of deep learning theory.

Micah Goldblum Jonas Geiping Avi Schwarzschild Michael Moeller Tom Goldstein

Drawing Early-Bird Tickets: Toward More Efficient Training of Deep Networks.

Haoran You Chaojian Li Pengfei Xu Yonggan Fu Yue Wang Xiaohan Chen Richard G. Baraniuk Zhangyang Wang Yingyan Lin

Improving Generalization in Meta Reinforcement Learning using Learned Objectives.

Louis Kirsch Sjoerd van Steenkiste Jürgen Schmidhuber

Kaleidoscope: An Efficient, Learnable Representation For All Structured Linear Maps.

Tri Dao Nimit Sharad Sohoni Albert Gu Matthew Eichhorn Amit Blonder Megan Leszczynski Atri Rudra Christopher Ré

Disentanglement by Nonlinear ICA with General Incompressible-flow Networks (GIN).

Peter Sorrenson Carsten Rother Ullrich Köthe

At Stability's Edge: How to Adjust Hyperparameters to Preserve Minima Selection in Asynchronous Training of Neural Networks?

Niv Giladi Mor Shpigel Nacson Elad Hoffer Daniel Soudry

Compression based bound for non-compressed network: unified generalization error analysis of large compressible deep neural network.

Taiji Suzuki Hiroshi Abe Tomoaki Nishimura

Explanation by Progressive Exaggeration.

Sumedha Singla Brian Pollack Junxiang Chen Kayhan Batmanghelich

Directional Message Passing for Molecular Graphs.

Johannes Klicpera Janek Groß Stephan Günnemann

Learning from Rules Generalizing Labeled Exemplars.

Abhijeet Awasthi Sabyasachi Ghosh Rasna Goyal Sunita Sarawagi

Training individually fair ML models with sensitive subspace robustness.

Mikhail Yurochkin Amanda Bower Yuekai Sun

What Can Neural Networks Reason About?

Keyulu Xu Jingling Li Mozhi Zhang Simon S. Du Ken-ichi Kawarabayashi Stefanie Jegelka

word2ket: Space-efficient Word Embeddings inspired by Quantum Entanglement.

Aliakbar Panahi Seyran Saeedi Tomasz Arodz

Towards Hierarchical Importance Attribution: Explaining Compositional Semantics for Neural Sequence Models.

Xisen Jin Zhongyu Wei Junyi Du Xiangyang Xue Xiang Ren

Spectral Embedding of Regularized Block Models.

Nathan de Lara Thomas Bonald

Maximum Likelihood Constraint Inference for Inverse Reinforcement Learning.

Dexter R. R. Scobee S. Shankar Sastry

Meta-Learning Acquisition Functions for Transfer Learning in Bayesian Optimization.

Michael Volpp Lukas P. Fröhlich Kirsten Fischer Andreas Doerr Stefan Falkner Frank Hutter Christian Daniel

The Ingredients of Real World Robotic Reinforcement Learning.

Henry Zhu Justin Yu Abhishek Gupta Dhruv Shah Kristian Hartikainen Avi Singh Vikash Kumar Sergey Levine

Scaling Autoregressive Video Models.

Dirk Weissenborn Oscar Täckström Jakob Uszkoreit

Differentiation of Blackbox Combinatorial Solvers.

Marin Vlastelica Pogancic Anselm Paulus Vít Musil Georg Martius Michal Rolínek

Harnessing the Power of Infinitely Wide Deep Nets on Small-data Tasks.

Sanjeev Arora Simon S. Du Zhiyuan Li Ruslan Salakhutdinov Ruosong Wang Dingli Yu

The intriguing role of module criticality in the generalization of deep networks.

Niladri S. Chatterji Behnam Neyshabur Hanie Sedghi

Self-labelling via simultaneous clustering and representation learning.

Yuki Markus Asano Christian Rupprecht Andrea Vedaldi

Neural Tangents: Fast and Easy Infinite Neural Networks in Python.

Roman Novak Lechao Xiao Jiri Hron Jaehoon Lee Alexander A. Alemi Jascha Sohl-Dickstein Samuel S. Schoenholz

Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue.

Byeongchang Kim Jaewoo Ahn Gunhee Kim

Measuring the Reliability of Reinforcement Learning Algorithms.

Stephanie C. Y. Chan Samuel Fishman Anoop Korattikara John F. Canny Sergio Guadarrama

Stable Rank Normalization for Improved Generalization in Neural Networks and GANs.

Amartya Sanyal Philip H. S. Torr Puneet K. Dokania

Disagreement-Regularized Imitation Learning.

Kianté Brantley Wen Sun Mikael Henaff

Model Based Reinforcement Learning for Atari.

Lukasz Kaiser Mohammad Babaeizadeh Piotr Milos Blazej Osinski Roy H. Campbell Konrad Czechowski Dumitru Erhan Chelsea Finn Piotr Kozakowski Sergey Levine Afroz Mohiuddin Ryan Sepassi George Tucker Henryk Michalewski

Understanding Why Neural Networks Generalize Well Through GSNR of Parameters.

Jinlong Liu Yunzhi Bai Guoqing Jiang Ting Chen Huayan Wang

A Latent Morphology Model for Open-Vocabulary Neural Machine Translation.

Duygu Ataman Wilker Aziz Alexandra Birch

And the Bit Goes Down: Revisiting the Quantization of Neural Networks.

Pierre Stock Armand Joulin Rémi Gribonval Benjamin Graham Hervé Jégou

Kernelized Wasserstein Natural Gradient.

Michael Arbel Arthur Gretton Wuchen Li Guido Montúfar

FreeLB: Enhanced Adversarial Training for Natural Language Understanding.

Chen Zhu Yu Cheng Zhe Gan Siqi Sun Tom Goldstein Jingjing Liu

Behaviour Suite for Reinforcement Learning.

Ian Osband Yotam Doron Matteo Hessel John Aslanides Eren Sezener Andre Saraiva Katrina McKinney Tor Lattimore Csaba Szepesvári Satinder Singh Benjamin Van Roy Richard S. Sutton David Silver Hado van Hasselt

Strategies for Pre-training Graph Neural Networks.

Weihua Hu Bowen Liu Joseph Gomes Marinka Zitnik Percy Liang Vijay S. Pande Jure Leskovec

NAS-Bench-201: Extending the Scope of Reproducible Neural Architecture Search.

Xuanyi Dong Yi Yang

Emergent Tool Use From Multi-Agent Autocurricula.

Bowen Baker Ingmar Kanitscheider Todor M. Markov Yi Wu Glenn Powell Bob McGrew Igor Mordatch

A Probabilistic Formulation of Unsupervised Text Style Transfer.

Junxian He Xinyi Wang Graham Neubig Taylor Berg-Kirkpatrick

Dream to Control: Learning Behaviors by Latent Imagination.

Danijar Hafner Timothy P. Lillicrap Jimmy Ba Mohammad Norouzi

Real or Not Real, that is the Question.

Yuanbo Xiangli Yubin Deng Bo Dai Chen Change Loy Dahua Lin

Neural Symbolic Reader: Scalable Integration of Distributed and Symbolic Representations for Reading Comprehension.

Xinyun Chen Chen Liang Adams Wei Yu Denny Zhou Dawn Song Quoc V. Le

Network Deconvolution.

Chengxi Ye Matthew Evanusa Hua He Anton Mitrokhin Tom Goldstein James A. Yorke Cornelia Fermüller Yiannis Aloimonos

Simplified Action Decoder for Deep Multi-Agent Reinforcement Learning.

Hengyuan Hu Jakob N. Foerster

Is a Good Representation Sufficient for Sample Efficient Reinforcement Learning?

Simon S. Du Sham M. Kakade Ruosong Wang Lin F. Yang

Learning The Difference That Makes A Difference With Counterfactually-Augmented Data.

Divyansh Kaushik Eduard H. Hovy Zachary Chase Lipton

Asymptotics of Wide Networks from Feynman Diagrams.

Ethan Dyer Guy Gur-Ari

Symplectic Recurrent Neural Networks.

Zhengdao Chen Jianyu Zhang Martín Arjovsky Léon Bottou

Learning to Plan in High Dimensions via Neural Exploration-Exploitation Trees.

Binghong Chen Bo Dai Qinjie Lin Guo Ye Han Liu Le Song

Disentangling neural mechanisms for perceptual grouping.

Junkyung Kim Drew Linsley Kalpit Thakkar Thomas Serre

ALBERT: A Lite BERT for Self-supervised Learning of Language Representations.

Zhenzhong Lan Mingda Chen Sebastian Goodman Kevin Gimpel Piyush Sharma Radu Soricut

The Break-Even Point on Optimization Trajectories of Deep Neural Networks.

Stanislaw Jastrzebski Maciej Szymczak Stanislav Fort Devansh Arpit Jacek Tabor Kyunghyun Cho Krzysztof J. Geras

The Logical Expressiveness of Graph Neural Networks.

Pablo Barceló Egor V. Kostylev Mikaël Monet Jorge Pérez Juan L. Reutter Juan Pablo Silva

CLEVRER: Collision Events for Video Representation and Reasoning.

Kexin Yi Chuang Gan Yunzhu Li Pushmeet Kohli Jiajun Wu Antonio Torralba Joshua B. Tenenbaum

Learning Compositional Koopman Operators for Model-Based Control.

Yunzhu Li Hao He Jiajun Wu Dina Katabi Antonio Torralba

Doubly Robust Bias Reduction in Infinite Horizon Off-Policy Estimation.

Ziyang Tang Yihao Feng Lihong Li Dengyong Zhou Qiang Liu

Deep neuroethology of a virtual rodent.

Josh Merel Diego Aldarondo Jesse Marshall Yuval Tassa Greg Wayne Bence Olveczky

Emergence of functional and structural properties of the head direction system by optimization of recurrent neural networks.

Christopher J. Cueva Peter Y. Wang Matthew Chin Xue-Xin Wei

Duration-of-Stay Storage Assignment under Uncertainty.

Michael Lingzhi Li Elliott Wolf Daniel Wintz

Inductive Matrix Completion Based on Graph Neural Networks.

Muhan Zhang Yixin Chen

Conditional Learning of Fair Representations.

Han Zhao Amanda Coston Tameem Adel Geoffrey J. Gordon

Gradientless Descent: High-Dimensional Zeroth-Order Optimization.

Daniel Golovin John Karro Greg Kochanski Chansoo Lee Xingyou Song Qiuyi (Richard) Zhang

Estimating counterfactual treatment outcomes over time through adversarially balanced representations.

Ioana Bica Ahmed M. Alaa James Jordon Mihaela van der Schaar

CoPhy: Counterfactual Learning of Physical Dynamics.

Fabien Baradel Natalia Neverova Julien Mille Greg Mori Christian Wolf

Hamiltonian Generative Networks.

Peter Toth Danilo J. Rezende Andrew Jaegle Sébastien Racanière Aleksandar Botev Irina Higgins

How much Position Information Do Convolutional Neural Networks Encode?

Md. Amirul Islam Sen Jia Neil D. B. Bruce

Sliced Cramer Synaptic Consolidation for Preserving Deeply Learned Representations.

Soheil Kolouri Nicholas A. Ketz Andrea Soltoggio Praveen K. Pilly

Hoppity: Learning Graph Transformations to Detect and Fix Bugs in Programs.

Elizabeth Dinella Hanjun Dai Ziyang Li Mayur Naik Le Song Ke Wang

Influence-Based Multi-Agent Exploration.

Tonghan Wang Jianhao Wang Yi Wu Chongjie Zhang

Meta-Learning without Memorization.

Mingzhang Yin George Tucker Mingyuan Zhou Sergey Levine Chelsea Finn

Finite Depth and Width Corrections to the Neural Tangent Kernel.

Boris Hanin Mihai Nica

Ridge Regression: Structure, Cross-Validation, and Sketching.

Sifan Liu Edgar Dobriban

Cross-Domain Few-Shot Classification via Learned Feature-Wise Transformation.

Hung-Yu Tseng Hsin-Ying Lee Jia-Bin Huang Ming-Hsuan Yang

DDSP: Differentiable Digital Signal Processing.

Jesse H. Engel Lamtharn Hantrakul Chenjie Gu Adam Roberts

Encoding word order in complex embeddings.

Benyou Wang Donghao Zhao Christina Lioma Qiuchi Li Peng Zhang Jakob Grue Simonsen

Enhancing Adversarial Defense by k-Winners-Take-All.

Chang Xiao Peilin Zhong Changxi Zheng

Online and stochastic optimization beyond Lipschitz continuity: A Riemannian approach.

Kimon Antonakopoulos Elena Veronica Belmega Panayotis Mertikopoulos

PC-DARTS: Partial Channel Connections for Memory-Efficient Architecture Search.

Yuhui Xu Lingxi Xie Xiaopeng Zhang Xin Chen Guo-Jun Qi Qi Tian Hongkai Xiong

Tranquil Clouds: Neural Networks for Learning Temporally Coherent Features in Point Clouds.

Lukas Prantl Nuttapong Chentanez Stefan Jeschke Nils Thuerey

Neural Machine Translation with Universal Visual Representation.

Zhuosheng Zhang Kehai Chen Rui Wang Masao Utiyama Eiichiro Sumita Zuchao Li Hai Zhao

White Noise Analysis of Neural Networks.

Ali Borji Sikun Lin

Skip Connections Matter: On the Transferability of Adversarial Examples Generated with ResNets.

Dongxian Wu Yisen Wang Shu-Tao Xia James Bailey Xingjun Ma

A Signal Propagation Perspective for Pruning Neural Networks at Initialization.

Namhoon Lee Thalaiyasingam Ajanthan Stephen Gould Philip H. S. Torr

Intensity-Free Learning of Temporal Point Processes.

Oleksandr Shchur Marin Bilos Stephan Günnemann

Learning to Control PDEs with Differentiable Physics.

Philipp Holl Nils Thuerey Vladlen Koltun

Estimating Gradients for Discrete Random Variables by Sampling without Replacement.

Wouter Kool Herke van Hoof Max Welling

Defending Against Physically Realizable Attacks on Image Classification.

Tong Wu Liang Tong Yevgeniy Vorobeychik

On Robustness of Neural Ordinary Differential Equations.

Hanshu Yan Jiawei Du Vincent Y. F. Tan Jiashi Feng

InfoGraph: Unsupervised and Semi-supervised Graph-Level Representation Learning via Mutual Information Maximization.

Fan-Yun Sun Jordan Hoffmann Vikas Verma Jian Tang

Multi-Scale Representation Learning for Spatial Feature Distributions using Grid Cells.

Gengchen Mai Krzysztof Janowicz Bo Yan Rui Zhu Ling Cai Ni Lao

Graph Neural Networks Exponentially Lose Expressive Power for Node Classification.

Kenta Oono Taiji Suzuki

Sparse Coding with Gated Learned ISTA.

Kailun Wu Yiwen Guo Ziang Li Changshui Zhang

Program Guided Agent.

Shao-Hua Sun Te-Lin Wu Joseph J. Lim

Pay Attention to Features, Transfer Learn Faster CNNs.

Kafeng Wang Xitong Gao Yiren Zhao Xingjian Li Dejing Dou Cheng-Zhong Xu

Gradients as Features for Deep Representation Learning.

Fangzhou Mu Yingyu Liang Yin Li

Monotonic Multihead Attention.

Xutai Ma Juan Miguel Pino James Cross Liezl Puzon Jiatao Gu

Massively Multilingual Sparse Word Representations.

Gábor Berend

Query-efficient Meta Attack to Deep Neural Networks.

Jiawei Du Hu Zhang Joey Tianyi Zhou Yi Yang Jiashi Feng

Breaking Certified Defenses: Semantic Adversarial Examples with Spoofed robustness Certificates.

Amin Ghiasi Ali Shafahi Tom Goldstein

Enabling Deep Spiking Neural Networks with Hybrid Conversion and Spike Timing Dependent Backpropagation.

Nitin Rathi Gopalakrishnan Srinivasan Priyadarshini Panda Kaushik Roy

How to 0wn the NAS in Your Spare Time.

Sanghyun Hong Michael Davinroy Yigitcan Kaya Dana Dachman-Soled Tudor Dumitras

The Shape of Data: Intrinsic Distance for Data Distributions.

Anton Tsitsulin Marina Munkhoeva Davide Mottin Panagiotis Karras Alexander M. Bronstein Ivan V. Oseledets Emmanuel Müller

Understanding Generalization in Recurrent Neural Networks.

Zhuozhuo Tu Fengxiang He Dacheng Tao

Conservative Uncertainty Estimation By Fitting Prior Networks.

Kamil Ciosek Vincent Fortuin Ryota Tomioka Katja Hofmann Richard E. Turner

NAS-Bench-1Shot1: Benchmarking and Dissecting One-shot Neural Architecture Search.

Arber Zela Julien Siems Frank Hutter

Learning to Coordinate Manipulation Skills via Skill Behavior Diversification.

Youngwoon Lee Jingyun Yang Joseph J. Lim

Robust Subspace Recovery Layer for Unsupervised Anomaly Detection.

Chieh-Hsin Lai Dongmian Zou Gilad Lerman

Learning Nearly Decomposable Value Functions Via Communication Minimization.

Tonghan Wang Jianhao Wang Chongyi Zheng Chongjie Zhang

Extreme Classification via Adversarial Softmax Approximation.

Robert Bamler Stephan Mandt

Information Geometry of Orthogonal Initializations and Training.

Piotr Aleksander Sokól Il Memming Park

Mixed Precision DNNs: All you need is a good parametrization.

Stefan Uhlich Lukas Mauch Fabien Cardinaux Kazuki Yoshiyama Javier Alonso García Stephen Tiedemann Thomas Kemp Akira Nakamura

Co-Attentive Equivariant Neural Networks: Focusing Equivariance On Transformations Co-Occurring in Data.

David W. Romero Mark Hoogendoorn

Deep Orientation Uncertainty Learning based on a Bingham Loss.

Igor Gilitschenski Roshni Sahoo Wilko Schwarting Alexander Amini Sertac Karaman Daniela Rus

Critical initialisation in continuous approximations of binary neural networks.

George Stamatescu Federica Gerace Carlo Lucibello Ian G. Fuss Langford B. White

Sub-policy Adaptation for Hierarchical Reinforcement Learning.

Alexander C. Li Carlos Florensa Ignasi Clavera Pieter Abbeel

Episodic Reinforcement Learning with Associative Memory.

Guangxiang Zhu Zichuan Lin Guangwen Yang Chongjie Zhang

Pitfalls of In-Domain Uncertainty Estimation and Ensembling in Deep Learning.

Arsenii Ashukha Alexander Lyzhov Dmitry Molchanov Dmitry P. Vetrov

DiffTaichi: Differentiable Programming for Physical Simulation.

Yuanming Hu Luke Anderson Tzu-Mao Li Qi Sun Nathan Carr Jonathan Ragan-Kelley Frédo Durand

Domain Adaptive Multibranch Networks.

Róger Bermúdez-Chacón Mathieu Salzmann Pascal Fua

Prediction Poisoning: Towards Defenses Against DNN Model Stealing Attacks.

Tribhuvanesh Orekondy Bernt Schiele Mario Fritz

SCALOR: Generative World Models with Scalable Object Representations.

Jindong Jiang Sepehr Janghorbani Gerard de Melo Sungjin Ahn

Neural tangent kernels, transportation mappings, and universal approximation.

Ziwei Ji Matus Telgarsky Ruicheng Xian

Learning to Move with Affordance Maps.

William Qi Ravi Teja Mullapudi Saurabh Gupta Deva Ramanan

Differentiable learning of numerical rules in knowledge graphs.

Po-Wei Wang Daria Stepanova Csaba Domokos J. Zico Kolter

Consistency Regularization for Generative Adversarial Networks.

Han Zhang Zizhao Zhang Augustus Odena Honglak Lee

On Generalization Error Bounds of Noisy Gradient Methods for Non-Convex Learning.

Jian Li Xuanyuan Luo Mingda Qiao

Scale-Equivariant Steerable Networks.

Ivan Sosnovik Michal Szmaja Arnold W. M. Smeulders

Classification-Based Anomaly Detection for General Data.

Liron Bergman Yedid Hoshen

Unrestricted Adversarial Examples via Semantic Manipulation.

Anand Bhattad Min Jin Chong Kaizhao Liang Bo Li David A. Forsyth

Discriminative Particle Filter Reinforcement Learning for Complex Partial observations.

Xiao Ma Péter Karkus David Hsu Wee Sun Lee Nan Ye

Learning to Group: A Bottom-Up Framework for 3D Part Discovery in Unseen Categories.

Tiange Luo Kaichun Mo Zhiao Huang Jiarui Xu Siyu Hu Liwei Wang Hao Su

State Alignment-based Imitation Learning.

Fangchen Liu Zhan Ling Tongzhou Mu Hao Su

Lipschitz constant estimation of Neural Networks via sparse polynomial optimization.

Fabian Latorre Gómez Paul Rolland Volkan Cevher

Effect of Activation Functions on the Training of Overparametrized Neural Nets.

Abhishek Panigrahi Abhishek Shetty Navin Goyal

Provable Filter Pruning for Efficient Neural Networks.

Lucas Liebenwein Cenk Baykal Harry Lang Dan Feldman Daniela Rus

End to End Trainable Active Contours via Differentiable Rendering.

Shir Gur Tal Shaharabany Lior Wolf

Compositional Language Continual Learning.

Yuanpeng Li Liang Zhao Kenneth Church Mohamed Elhoseiny

Adversarial Lipschitz Regularization.

Dávid Terjék

A Function Space View of Bounded Norm Infinite Width ReLU Nets: The Multivariate Case.

Greg Ongie Rebecca Willett Daniel Soudry Nathan Srebro

Lite Transformer with Long-Short Range Attention.

Zhanghao Wu Zhijian Liu Ji Lin Yujun Lin Song Han

Mutual Information Gradient Estimation for Representation Learning.

Liangjian Wen Yiji Zhou Lirong He Mingyuan Zhou Zenglin Xu

Regularizing activations in neural networks via distribution matching with the Wasserstein metric.

Taejong Joo Donggu Kang Byunghoon Kim

Transferring Optimality Across Data Distributions via Homotopy Methods.

Matilde Gargiani Andrea Zanelli Quoc Tran-Dinh Moritz Diehl Frank Hutter

Latent Normalizing Flows for Many-to-Many Cross-Domain Mappings.

Shweta Mahajan Iryna Gurevych Stefan Roth

Dynamic Model Pruning with Feedback.

Tao Lin Sebastian U. Stich Luis Barba Daniil Dmitriev Martin Jaggi

On the interaction between supervision and self-play in emergent communication.

Ryan Lowe Abhinav Gupta Jakob N. Foerster Douwe Kiela Joelle Pineau

A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms.

Yoshua Bengio Tristan Deleu Nasim Rahaman Nan Rosemary Ke Sébastien Lachapelle Olexa Bilaniuk Anirudh Goyal Christopher J. Pal

Expected Information Maximization: Using the I-Projection for Mixture Density Estimation.

Philipp Becker Oleg Arenz Gerhard Neumann

Deep Audio Priors Emerge From Harmonic Convolutional Networks.

Zhoutong Zhang Yunyun Wang Chuang Gan Jiajun Wu Joshua B. Tenenbaum Antonio Torralba William T. Freeman

A closer look at the approximation capabilities of neural networks.

Kai Fong Ernest Chong

Residual Energy-Based Models for Text Generation.

Yuntian Deng Anton Bakhtin Myle Ott Arthur Szlam Marc'Aurelio Ranzato

AtomNAS: Fine-Grained End-to-End Neural Architecture Search.

Jieru Mei Yingwei Li Xiaochen Lian Xiaojie Jin Linjie Yang Alan L. Yuille Jianchao Yang

AugMix: A Simple Data Processing Method to Improve Robustness and Uncertainty.

Dan Hendrycks Norman Mu Ekin Dogus Cubuk Barret Zoph Justin Gilmer Balaji Lakshminarayanan

Memory-Based Graph Networks.

Amir Hosein Khas Ahmadi Kaveh Hassani Parsa Moradi Leo Lee Quaid Morris

Variational Template Machine for Data-to-Text Generation.

Rong Ye Wenxian Shi Hao Zhou Zhongyu Wei Lei Li

Phase Transitions for the Information Bottleneck in Representation Learning.

Tailin Wu Ian S. Fischer

Continual learning with hypernetworks.

Johannes von Oswald Christian Henning João Sacramento Benjamin F. Grewe

Permutation Equivariant Models for Compositional Generalization in Language.

Jonathan Gordon David Lopez-Paz Marco Baroni Diane Bouchacourt

Training binary neural networks with real-to-binary convolutions.

Brais Martínez Jing Yang Adrian Bulat Georgios Tzimiropoulos

StructBERT: Incorporating Language Structures into Pre-training for Deep Language Understanding.

Wei Wang Bin Bi Ming Yan Chen Wu Jiangnan Xia Zuyi Bao Liwei Peng Luo Si

Smooth markets: A basic mechanism for organizing gradient-based learners.

David Balduzzi Wojciech M. Czarnecki Tom Anthony Ian M. Gemp Edward Hughes Joel Z. Leibo Georgios Piliouras Thore Graepel

Fair Resource Allocation in Federated Learning.

Tian Li Maziar Sanjabi Ahmad Beirami Virginia Smith

Never Give Up: Learning Directed Exploration Strategies.

Adrià Puigdomènech Badia Pablo Sprechmann Alex Vitvitskyi Zhaohan Daniel Guo Bilal Piot Steven Kapturowski Olivier Tieleman Martín Arjovsky Alexander Pritzel Andrew Bolt Charles Blundell

AdvectiveNet: An Eulerian-Lagrangian Fluidic Reservoir for Point Cloud Processing.

Xingzhe He Helen Lu Cao Bo Zhu

You CAN Teach an Old Dog New Tricks! On Training Knowledge Graph Embeddings.

Daniel Ruffinelli Samuel Broscheit Rainer Gemulla

Functional Regularisation for Continual Learning with Gaussian Processes.

Michalis K. Titsias Jonathan Schwarz Alexander G. de G. Matthews Razvan Pascanu Yee Whye Teh

Dynamics-Aware Embeddings.

William F. Whitney Rajat Agarwal Kyunghyun Cho Abhinav Gupta

RaPP: Novelty Detection with Reconstruction along Projection Pathway.

Ki Hyun Kim Sangwoo Shim Yongsub Lim Jongseob Jeon Jeongwoo Choi Byungchan Kim Andre S. Yoon

Hypermodels for Exploration.

Vikranth Dwaracherla Xiuyuan Lu Morteza Ibrahimi Ian Osband Zheng Wen Benjamin Van Roy

Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies.

Sungryull Sohn Hyunjae Woo Jongwook Choi Honglak Lee

BayesOpt Adversarial Attack.

Binxin Ru Adam D. Cobb Arno Blaas Yarin Gal

Model-based reinforcement learning for biological sequence design.

Christof Angermüller David Dohan David Belanger Ramya Deshpande Kevin Murphy Lucy J. Colwell

BinaryDuo: Reducing Gradient Mismatch in Binary Activation Network by Coupling Binary Activations.

Hyungjun Kim Kyungsu Kim Jinseok Kim Jae-Joon Kim

Mixed-curvature Variational Autoencoders.

Ondrej Skopek Octavian-Eugen Ganea Gary Bécigneul

Demystifying Inter-Class Disentanglement.

Aviv Gabbay Yedid Hoshen

Understanding the Limitations of Conditional Generative Models.

Ethan Fetaya Jörn-Henrik Jacobsen Will Grathwohl Richard S. Zemel

Keep Doing What Worked: Behavior Modelling Priors for Offline Reinforcement Learning.

Noah Y. Siegel Jost Tobias Springenberg Felix Berkenkamp Abbas Abdolmaleki Michael Neunert Thomas Lampe Roland Hafner Nicolas Heess Martin A. Riedmiller

Empirical Bayes Transductive Meta-Learning with Synthetic Gradients.

Shell Xu Hu Pablo Garcia Moreno Yang Xiao Xi Shen Guillaume Obozinski Neil D. Lawrence Andreas C. Damianou

Spike-based causal inference for weight alignment.

Jordan Guerguiev Konrad P. Körding Blake A. Richards

Lookahead: A Far-sighted Alternative of Magnitude-based Pruning.

Sejun Park Jaeho Lee Sangwoo Mo Jinwoo Shin

VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning.

Luisa M. Zintgraf Kyriacos Shiarlis Maximilian Igl Sebastian Schulze Yarin Gal Katja Hofmann Shimon Whiteson

Making Efficient Use of Demonstrations to Solve Hard Exploration Problems.

Çaglar Gülçehre Tom Le Paine Bobak Shahriari Misha Denil Matt Hoffman Hubert Soyer Richard Tanburn Steven Kapturowski Neil C. Rabinowitz Duncan Williams Gabriel Barth-Maron Ziyu Wang Nando de Freitas Worlds Team

Meta-learning curiosity algorithms.

Ferran Alet Martin F. Schneider Tomás Lozano-Pérez Leslie Pack Kaelbling

vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations.

Alexei Baevski Steffen Schneider Michael Auli

Infinite-horizon Off-Policy Policy Evaluation with Multiple Behavior Policies.

Xinyun Chen Lu Wang Yizhe Hang Heng Ge Hongyuan Zha

MMA Training: Direct Input Space Margin Maximization through Adversarial Training.

Gavin Weiguang Ding Yash Sharma Kry Yik Chau Lui Ruitong Huang

Incorporating BERT into Neural Machine Translation.

Jinhua Zhu Yingce Xia Lijun Wu Di He Tao Qin Wengang Zhou Houqiang Li Tie-Yan Liu

Structured Object-Aware Physics Prediction for Video Modeling and Planning.

Jannik Kossen Karl Stelzner Marcel Hussing Claas Voelcker Kristian Kersting

Learning-Augmented Data Stream Algorithms.

Tanqiu Jiang Yi Li Honghao Lin Yisong Ruan David P. Woodruff

On the Relationship between Self-Attention and Convolutional Layers.

Jean-Baptiste Cordonnier Andreas Loukas Martin Jaggi

SpikeGrad: An ANN-equivalent Computation Model for Implementing Backpropagation with Spikes.

Johannes C. Thiele Olivier Bichler Antoine Dupret

Gradient $\ell_1$ Regularization for Quantization Robustness.

Milad Alizadeh Arash Behboodi Mart van Baalen Christos Louizos Tijmen Blankevoort Max Welling

Toward Evaluating Robustness of Deep Reinforcement Learning with Continuous Control.

Tsui-Wei Weng Krishnamurthy (Dj) Dvijotham Jonathan Uesato Kai Xiao Sven Gowal Robert Stanforth Pushmeet Kohli

Decentralized Deep Learning with Arbitrary Communication Compression.

Anastasia Koloskova Tao Lin Sebastian U. Stich Martin Jaggi

Training Generative Adversarial Networks from Incomplete Observations using Factorised Discriminators.

Daniel Stoller Sebastian Ewert Simon Dixon

Combining Q-Learning and Search with Amortized Value Estimates.

Jessica B. Hamrick Victor Bapst Alvaro Sanchez-Gonzalez Tobias Pfaff Theophane Weber Lars Buesing Peter W. Battaglia

Infinite-Horizon Differentiable Model Predictive Control.

Sebastian East Marco Gallieri Jonathan Masci Jan Koutník Mark Cannon

Projection-Based Constrained Policy Optimization.

Tsung-Yen Yang Justinian Rosca Karthik Narasimhan Peter J. Ramadge

You Only Train Once: Loss-Conditional Training of Deep Networks.

Alexey Dosovitskiy Josip Djolonga

GraphSAINT: Graph Sampling Based Inductive Learning Method.

Hanqing Zeng Hongkuan Zhou Ajitesh Srivastava Rajgopal Kannan Viktor K. Prasanna

Efficient Probabilistic Logic Reasoning with Graph Neural Networks.

Yuyu Zhang Xinshi Chen Yuan Yang Arun Ramamurthy Bo Li Yuan Qi Le Song

Low-dimensional statistical manifold embedding of directed graphs.

Thorben Funke Tian Guo Alen Lancic Nino Antulov-Fantulin

RIDE: Rewarding Impact-Driven Exploration for Procedurally-Generated Environments.

Roberta Raileanu Tim Rocktäschel

SPACE: Unsupervised Object-Oriented Scene Representation via Spatial Attention and Decomposition.

Zhixuan Lin Yi-Fu Wu Skand Vishwanath Peri Weihao Sun Gautam Singh Fei Deng Jindong Jiang Sungjin Ahn

Cross-Lingual Ability of Multilingual BERT: An Empirical Study.

Karthikeyan K Zihan Wang Stephen Mayhew Dan Roth

Reducing Transformer Depth on Demand with Structured Dropout.

Angela Fan Edouard Grave Armand Joulin

Neural Outlier Rejection for Self-Supervised Keypoint Learning.

Jiexiong Tang Hanme Kim Vitor Guizilini Sudeep Pillai Rares Ambrus

B-Spline CNNs on Lie groups.

Erik J. Bekkers

Quantifying Point-Prediction Uncertainty in Neural Networks via Residual Estimation with an I/O Kernel.

Xin Qiu Elliot Meyerson Risto Miikkulainen

EMPIR: Ensembles of Mixed Precision Deep Networks for Increased Robustness Against Adversarial Attacks.

Sanchari Sen Balaraman Ravindran Anand Raghunathan

Learning To Explore Using Active Neural SLAM.

Devendra Singh Chaplot Dhiraj Gandhi Saurabh Gupta Abhinav Gupta Ruslan Salakhutdinov

Understanding and Improving Information Transfer in Multi-Task Learning.

Sen Wu Hongyang R. Zhang Christopher Ré

A Stochastic Derivative Free Optimization Method with Momentum.

Eduard Gorbunov Adel Bibi Ozan Sener El Houcine Bergou Peter Richtárik

Compressive Transformers for Long-Range Sequence Modelling.

Jack W. Rae Anna Potapenko Siddhant M. Jayakumar Chloe Hillier Timothy P. Lillicrap

Reinforced Genetic Algorithm Learning for Optimizing Computation Graphs.

Aditya Paliwal Felix Gimeno Vinod Nair Yujia Li Miles Lubin Pushmeet Kohli Oriol Vinyals

Lagrangian Fluid Simulation with Continuous Convolutions.

Benjamin Ummenhofer Lukas Prantl Nils Thuerey Vladlen Koltun

Learning to Guide Random Search.

Ozan Sener Vladlen Koltun

Robust anomaly detection and backdoor attack detection via differential privacy.

Min Du Ruoxi Jia Dawn Song

Deep probabilistic subsampling for task-adaptive compressed sensing.

Iris A. M. Huijben Bastiaan S. Veeling Ruud J. G. van Sloun

Learning Robust Representations via Multi-View Information Bottleneck.

Marco Federici Anjan Dutta Patrick Forré Nate Kushman Zeynep Akata

Batch-shaping for learning conditional channel gated networks.

Babak Ehteshami Bejnordi Tijmen Blankevoort Max Welling

Inductive and Unsupervised Representation Learning on Graph Structured Objects.

Lichen Wang Bo Zong Qianqian Ma Wei Cheng Jingchao Ni Wenchao Yu Yanchi Liu Dongjin Song Haifeng Chen Yun Fu

U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation.

Junho Kim Minjae Kim Hyeonwoo Kang Kwanghee Lee

Masked Based Unsupervised Content Transfer.

Ron Mokady Sagie Benaim Lior Wolf Amit Bermano

DropEdge: Towards Deep Graph Convolutional Networks on Node Classification.

Yu Rong Wenbing Huang Tingyang Xu Junzhou Huang

Why Not to Use Zero Imputation? Correcting Sparsity Bias in Training Neural Networks.

Joonyoung Yi Juhyuk Lee Kwang Joon Kim Sung Ju Hwang Eunho Yang

Probability Calibration for Knowledge Graph Embedding Models.

Pedro Tabacof Luca Costabello

On the Equivalence between Positional Node Embeddings and Structural Graph Representations.

Balasubramaniam Srinivasan Bruno Ribeiro

Neural Epitome Search for Architecture-Agnostic Network Compression.

Daquan Zhou Xiaojie Jin Qibin Hou Kaixin Wang Jianchao Yang Jiashi Feng

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs.

Ruochi Zhang Yuesong Zou Jian Ma

A Neural Dirichlet Process Mixture Model for Task-Free Continual Learning.

Soochan Lee Junsoo Ha Dongsu Zhang Gunhee Kim

On Solving Minimax Optimization Locally: A Follow-the-Ridge Approach.

Yuanhao Wang Guodong Zhang Jimmy Ba

Distributionally Robust Neural Networks.

Shiori Sagawa Pang Wei Koh Tatsunori B. Hashimoto Percy Liang

Kernel of CycleGAN as a principal homogeneous space.

Nikita Moriakov Jonas Adler Jonas Teuwen

Don't Use Large Mini-batches, Use Local SGD.

Tao Lin Sebastian U. Stich Kumar Kshitij Patel Martin Jaggi

Provable robustness against all adversarial $l_p$-perturbations for $p\geq 1$.

Francesco Croce Matthias Hein

On Universal Equivariant Set Networks.

Nimrod Segol Yaron Lipman

Tensor Decompositions for Temporal Knowledge Base Completion.

Timothée Lacroix Guillaume Obozinski Nicolas Usunier

Network Randomization: A Simple Technique for Generalization in Deep Reinforcement Learning.

Kimin Lee Kibok Lee Jinwoo Shin Honglak Lee

Robustness Verification for Transformers.

Zhouxing Shi Huan Zhang Kai-Wei Chang Minlie Huang Cho-Jui Hsieh

Fantastic Generalization Measures and Where to Find Them.

Yiding Jiang Behnam Neyshabur Hossein Mobahi Dilip Krishnan Samy Bengio

Nesterov Accelerated Gradient and Scale Invariance for Adversarial Attacks.

Jiadong Lin Chuanbiao Song Kun He Liwei Wang John E. Hopcroft

Weakly Supervised Disentanglement with Guarantees.

Rui Shu Yining Chen Abhishek Kumar Stefano Ermon Ben Poole

Discrepancy Ratio: Evaluating Model Performance When Even Experts Disagree on the Truth.

Igor Lovchinsky Alon Daks Israel Malkin Pouya Samangouei Ardavan Saeedi Yang Liu Swami Sankaranarayanan Tomer Gafner Ben Sternlieb Patrick Maher Nathan Silberman

Abductive Commonsense Reasoning.

Chandra Bhagavatula Ronan Le Bras Chaitanya Malaviya Keisuke Sakaguchi Ari Holtzman Hannah Rashkin Doug Downey Wen-tau Yih Yejin Choi

Variance Reduction With Sparse Gradients.

Melih Elibol Lihua Lei Michael I. Jordan

BlockSwap: Fisher-guided Block Substitution for Network Compression on a Budget.

Jack Turner Elliot J. Crowley Michael F. P. O'Boyle Amos J. Storkey Gavin Gray

Learning transport cost from subset correspondence.

Ruishan Liu Akshay Balsubramani James Zou

Rényi Fair Inference.

Sina Baharlouei Maher Nouiehed Ahmad Beirami Meisam Razaviyayn

Meta Dropout: Learning to Perturb Latent Features for Generalization.

Haebeom Lee Taewook Nam Eunho Yang Sung Ju Hwang

Adversarial AutoAugment.

Xinyu Zhang Qiang Wang Jian Zhang Zhao Zhong

State-only Imitation with Transition Dynamics Mismatch.

Tanmay Gangwani Jian Peng

Measuring and Improving the Use of Graph Information in Graph Neural Networks.

Yifan Hou Jian Zhang James Cheng Kaili Ma Richard T. B. Ma Hongzhi Chen Ming-Chang Yang

Universal Approximation with Certified Networks.

Maximilian Baader Matthew Mirman Martin T. Vechev

Explain Your Move: Understanding Agent Actions Using Specific and Relevant Feature Attribution.

Nikaash Puri Sukriti Verma Piyush Gupta Dhruv Kayastha Shripad Deshmukh Balaji Krishnamurthy Sameer Singh

Deep Symbolic Superoptimization Without Human Knowledge.

Hui Shi Yang Zhang Xinyun Chen Yuandong Tian Jishen Zhao

Sample Efficient Policy Gradient Methods with Recursive Variance Reduction.

Pan Xu Felicia Gao Quanquan Gu

Certified Defenses for Adversarial Patches.

Ping-Yeh Chiang Renkun Ni Ahmed Abdelkader Chen Zhu Christoph Studer Tom Goldstein

Contrastive Representation Distillation.

Yonglong Tian Dilip Krishnan Phillip Isola

A Framework for robustness Certification of Smoothed Classifiers using F-Divergences.

Krishnamurthy (Dj) Dvijotham Jamie Hayes Borja Balle J. Zico Kolter Chongli Qin András György Kai Xiao Sven Gowal Pushmeet Kohli

Padé Activation Units: End-to-end Learning of Flexible Activation Functions in Deep Networks.

Alejandro Molina Patrick Schramowski Kristian Kersting

Learning to Retrieve Reasoning Paths over Wikipedia Graph for Question Answering.

Akari Asai Kazuma Hashimoto Hannaneh Hajishirzi Richard Socher Caiming Xiong

A Baseline for Few-Shot Image Classification.

Guneet Singh Dhillon Pratik Chaudhari Avinash Ravichandran Stefano Soatto

Abstract Diagrammatic Reasoning with Multiplex Graph Networks.

Duo Wang Mateja Jamnik Pietro Liò

Environmental drivers of systematicity and generalization in a situated agent.

Felix Hill Andrew K. Lampinen Rosalia Schneider Stephen Clark Matthew M. Botvinick James L. McClelland Adam Santoro

ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators.

Kevin Clark Minh-Thang Luong Quoc V. Le Christopher D. Manning

Evolutionary Population Curriculum for Scaling Multi-Agent Reinforcement Learning.

Qian Long Zihan Zhou Abhinav Gupta Fei Fang Yi Wu Xiaolong Wang

Thinking While Moving: Deep Reinforcement Learning with Concurrent Control.

Ted Xiao Eric Jang Dmitry Kalashnikov Sergey Levine Julian Ibarz Karol Hausman Alexander Herzog

Jacobian Adversarially Regularized Networks for Robustness.

Alvin Chan Yi Tay Yew-Soon Ong Jie Fu

Towards Verified Robustness under Text Deletion Interventions.

Johannes Welbl Po-Sen Huang Robert Stanforth Sven Gowal Krishnamurthy (Dj) Dvijotham Martin Szummer Pushmeet Kohli

RGBD-GAN: Unsupervised 3D Representation Learning From Natural Image Datasets via RGBD Image Synthesis.

Atsuhiro Noguchi Tatsuya Harada

Provable Benefit of Orthogonal Initialization in Optimizing Deep Linear Networks.

Wei Hu Lechao Xiao Jeffrey Pennington

Plug and Play Language Models: A Simple Approach to Controlled Text Generation.

Sumanth Dathathri Andrea Madotto Janice Lan Jane Hung Eric Frank Piero Molino Jason Yosinski Rosanne Liu

Rethinking the Hyperparameters for Fine-tuning.

Hao Li Pratik Chaudhari Hao Yang Michael Lam Avinash Ravichandran Rahul Bhotika Stefano Soatto

Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings.

Hongyu Ren Weihua Hu Jure Leskovec

Implementing Inductive bias for different navigation tasks through diverse RNN attrractors.

Tie Xu Omri Barak

PCMC-Net: Feature-based Pairwise Choice Markov Chains.

Alix Lhéritier

Multi-Agent Interactions Modeling with Correlated Policies.

Minghuan Liu Ming Zhou Weinan Zhang Yuzheng Zhuang Jun Wang Wulong Liu Yong Yu

Once-for-All: Train One Network and Specialize it for Efficient Deployment.

Han Cai Chuang Gan Tianzhe Wang Zhekai Zhang Song Han

Generalized Convolutional Forest Networks for Domain Generalization and Visual Recognition.

Jongbin Ryu Gitaek Kwon Ming-Hsuan Yang Jongwoo Lim

SNODE: Spectral Discretization of Neural ODEs for System Identification.

Alessio Quaglino Marco Gallieri Jonathan Masci Jan Koutník

Guiding Program Synthesis by Learning to Generate Examples.

Larissa Laich Pavol Bielik Martin T. Vechev

Fast Neural Network Adaptation via Parameter Remapping and Architecture Search.

Jiemin Fang Yuzhu Sun Kangjian Peng Qian Zhang Yuan Li Wenyu Liu Xinggang Wang

Exploratory Not Explanatory: Counterfactual Analysis of Saliency Maps for Deep Reinforcement Learning.

Akanksha Atrey Kaleigh Clary David D. Jensen

Meta-Learning Deep Energy-Based Memory Models.

Sergey Bartunov Jack W. Rae Simon Osindero Timothy P. Lillicrap

Graph Convolutional Reinforcement Learning.

Jiechuan Jiang Chen Dun Tiejun Huang Zongqing Lu

The Curious Case of Neural Text Degeneration.

Ari Holtzman Jan Buys Li Du Maxwell Forbes Yejin Choi

Multilingual Alignment of Contextual Word Representations.

Steven Cao Nikita Kitaev Dan Klein

The Gambler's Problem and Beyond.

Baoxiang Wang Shuai Li Jiajin Li Siu On Chan

GraphAF: a Flow-based Autoregressive Model for Molecular Graph Generation.

Chence Shi Minkai Xu Zhaocheng Zhu Weinan Zhang Ming Zhang Jian Tang

Double Neural Counterfactual Regret Minimization.

Hui Li Kailiang Hu Shaohua Zhang Yuan Qi Le Song

Neural Policy Gradient Methods: Global Optimality and Rates of Convergence.

Lingxiao Wang Qi Cai Zhuoran Yang Zhaoran Wang

Triple Wins: Boosting Accuracy, Robustness and Efficiency Together by Enabling Input-Adaptive Inference.

Ting-Kuei Hu Tianlong Chen Haotao Wang Zhangyang Wang

Dynamic Sparse Training: Find Efficient Sparse Network From Scratch With Trainable Masked Layers.

Junjie Liu Zhe Xu Runbin Shi Ray C. C. Cheung Hayden Kwok-Hay So

Beyond Linearization: On Quadratic and Higher-Order Approximation of Wide Neural Networks.

Yu Bai Jason D. Lee

Deep Graph Matching Consensus.

Matthias Fey Jan Eric Lenssen Christopher Morris Jonathan Masci Nils M. Kriege

Self-Supervised Learning of Appliance Usage.

Chen-Yu Hsu Abbas Zeitoun Guang-He Lee Dina Katabi Tommi S. Jaakkola

Quantum Algorithms for Deep Convolutional Neural Networks.

Iordanis Kerenidis Jonas Landman Anupam Prakash

Understanding l4-based Dictionary Learning: Interpretation, Stability, and Robustness.

Yuexiang Zhai Hermish Mehta Zhengyuan Zhou Yi Ma

Symplectic ODE-Net: Learning Hamiltonian Dynamics with Control.

Yaofeng Desmond Zhong Biswadip Dey Amit Chakraborty

Controlling generative models with continuous factors of variations.

Antoine Plumerault Hervé Le Borgne Céline Hudelot

Simple and Effective Regularization Methods for Training on Noisily Labeled Data with Generalization Guarantee.

Wei Hu Zhiyuan Li Dingli Yu

Unsupervised Clustering using Pseudo-semi-supervised Learning.

Divam Gupta Ramachandran Ramjee Nipun Kwatra Muthian Sivathanu

PairNorm: Tackling Oversmoothing in GNNs.

Lingxiao Zhao Leman Akoglu

Black-box Off-policy Estimation for Infinite-Horizon Reinforcement Learning.

Ali Mousavi Lihong Li Qiang Liu Denny Zhou

Empirical Studies on the Properties of Linear Regions in Deep Neural Networks.

Xiao Zhang Dongrui Wu

SNOW: Subscribing to Knowledge via Channel Pooling for Transfer & Lifelong Learning of Convolutional Neural Networks.

Chungkuk Yoo Bumsoo Kang Minsik Cho

Smoothness and Stability in GANs.

Casey Chu Kentaro Minami Kenji Fukumizu

Adaptive Correlated Monte Carlo for Contextual Categorical Sequence Generation.

Xinjie Fan Yizhe Zhang Zhendong Wang Mingyuan Zhou

On Bonus Based Exploration Methods In The Arcade Learning Environment.

Adrien Ali Taïga William Fedus Marlos C. Machado Aaron C. Courville Marc G. Bellemare

IMPACT: Importance Weighted Asynchronous Architectures with Clipped Target Networks.

Michael Luo Jiahao Yao Richard Liaw Eric Liang Ion Stoica

HiLLoC: lossless image compression with hierarchical latent variable models.

James Townsend Thomas Bird Julius Kunze David Barber

Physics-aware Difference Graph Networks for Sparsely-Observed Dynamics.

Sungyong Seo Chuizheng Meng Yan Liu

Polylogarithmic width suffices for gradient descent to achieve arbitrarily small test error with shallow ReLU networks.

Ziwei Ji Matus Telgarsky

Learning representations for binary-classification without backpropagation.

Mathias Lechner

Frequency-based Search-control in Dyna.

Yangchen Pan Jincheng Mei Amir-massoud Farahmand

Towards Stable and Efficient Training of Verifiably Robust Neural Networks.

Huan Zhang Hongge Chen Chaowei Xiao Sven Gowal Robert Stanforth Bo Li Duane S. Boning Cho-Jui Hsieh

Iterative energy-based projection on a normal data manifold for anomaly localization.

David Dehaene Oriel Frigo Sébastien Combrexelle Pierre Eline

Towards neural networks that provably know when they don't know.

Alexander Meinke Matthias Hein

BatchEnsemble: an Alternative Approach to Efficient Ensemble and Lifelong Learning.

Yeming Wen Dustin Tran Jimmy Ba

Inductive representation learning on temporal graphs.

Da Xu Chuanwei Ruan Evren Körpeoglu Sushant Kumar Kannan Achan

Generative Models for Effective ML on Private, Decentralized Datasets.

Sean Augenstein H. Brendan McMahan Daniel Ramage Swaroop Ramaswamy Peter Kairouz Mingqing Chen Rajiv Mathews Blaise Agüera y Arcas

Picking Winning Tickets Before Training by Preserving Gradient Flow.

Chaoqi Wang Guodong Zhang Roger B. Grosse

Curriculum Loss: Robust Learning and Generalization against Label Corruption.

Yueming Lyu Ivor W. Tsang

Uncertainty-guided Continual Learning with Bayesian Neural Networks.

Sayna Ebrahimi Mohamed Elhoseiny Trevor Darrell Marcus Rohrbach

Training Recurrent Neural Networks Online by Learning Explicit State Variables.

Somjit Nath Vincent Liu Alan Chan Xin Li Adam White Martha White

Cross-lingual Alignment vs Joint Training: A Comparative Study and A Simple Unified Framework.

Zirui Wang Jiateng Xie Ruochen Xu Yiming Yang Graham Neubig Jaime G. Carbonell

Robust Reinforcement Learning for Continuous Control with Model Misspecification.

Daniel J. Mankowitz Nir Levine Rae Jeong Abbas Abdolmaleki Jost Tobias Springenberg Yuanyuan Shi Jackie Kay Todd Hester Timothy A. Mann Martin A. Riedmiller

Decoupling Representation and Classifier for Long-Tailed Recognition.

Bingyi Kang Saining Xie Marcus Rohrbach Zhicheng Yan Albert Gordo Jiashi Feng Yannis Kalantidis

Learning from Unlabelled Videos Using Contrastive Predictive Neural 3D Mapping.

Adam W. Harley Shrinidhi Kowshika Lakshmikanth Fangyu Li Xian Zhou Hsiao-Yu Fish Tung Katerina Fragkiadaki

From Inference to Generation: End-to-end Fully Self-supervised Generation of Human Face from Speech.

Hyeong-Seok Choi Changdae Park Kyogu Lee

LambdaNet: Probabilistic Type Inference using Graph Neural Networks.

Jiayi Wei Maruth Goyal Greg Durrett Isil Dillig

Model-Augmented Actor-Critic: Backpropagating through Paths.

Ignasi Clavera Yao Fu Pieter Abbeel

Variational Autoencoders for Highly Multivariate Spatial Point Processes Intensities.

Baichuan Yuan Xiaowei Wang Jianxin Ma Chang Zhou Andrea L. Bertozzi Hongxia Yang

Denoising and Regularization via Exploiting the Structural Bias of Convolutional Generators.

Reinhard Heckel Mahdi Soltanolkotabi

Revisiting Self-Training for Neural Sequence Generation.

Junxian He Jiatao Gu Jiajun Shen Marc'Aurelio Ranzato

Towards a Deep Network Architecture for Structured Smoothness.

Haroun Habeeb Oluwasanmi Koyejo

On the Global Convergence of Training Deep Linear ResNets.

Difan Zou Philip M. Long Quanquan Gu

A Closer Look at the Optimization Landscapes of Generative Adversarial Networks.

Hugo Berard Gauthier Gidel Amjad Almahairi Pascal Vincent Simon Lacoste-Julien

Biologically inspired sleep algorithm for increased generalization and adversarial robustness in deep neural networks.

Timothy Tadros Giri P. Krishnan Ramyaa Ramyaa Maxim Bazhenov

Distributed Bandit Learning: Near-Optimal Regret with Efficient Communication.

Yuanhao Wang Jiachen Hu Xiaoyu Chen Liwei Wang

Shifted and Squeezed 8-bit Floating Point format for Low-Precision Training of Deep Neural Networks.

Léopold Cambier Anahita Bhiwandiwalla Ting Gong Oguz H. Elibol Mehran Nekuii Hanlin Tang

Intriguing Properties of Adversarial Training at Scale.

Cihang Xie Alan L. Yuille

Deep Double Descent: Where Bigger Models and More Data Hurt.

Preetum Nakkiran Gal Kaplun Yamini Bansal Tristan Yang Boaz Barak Ilya Sutskever

Decoding As Dynamic Programming For Recurrent Autoregressive Models.

Najam Zaidi Trevor Cohn Gholamreza Haffari

Synthesizing Programmatic Policies that Inductively Generalize.

Jeevana Priya Inala Osbert Bastani Zenna Tavares Armando Solar-Lezama

Transformer-XH: Multi-Evidence Reasoning with eXtra Hop Attention.

Chen Zhao Chenyan Xiong Corby Rosset Xia Song Paul N. Bennett Saurabh Tiwary

Generalization through Memorization: Nearest Neighbor Language Models.

Urvashi Khandelwal Omer Levy Dan Jurafsky Luke Zettlemoyer Mike Lewis

Single Episode Policy Transfer in Reinforcement Learning.

Jiachen Yang Brenden K. Petersen Hongyuan Zha Daniel M. Faissol

Towards Stabilizing Batch Statistics in Backward Propagation of Batch Normalization.

Junjie Yan Ruosi Wan Xiangyu Zhang Wei Zhang Yichen Wei Jian Sun

NeurQuRI: Neural Question Requirement Inspector for Answerability Prediction in Machine Reading Comprehension.

Seohyun Back Sai Chetan Chinthakindi Akhil Kedia Haejun Lee Jaegul Choo

The Early Phase of Neural Network Training.

Jonathan Frankle David J. Schwab Ari S. Morcos

RNNs Incrementally Evolving on an Equilibrium Manifold: A Panacea for Vanishing and Exploding Gradients?

Anil Kag Ziming Zhang Venkatesh Saligrama

Extreme Tensoring for Low-Memory Preconditioning.

Xinyi Chen Naman Agarwal Elad Hazan Cyril Zhang Yi Zhang

Non-Autoregressive Dialog State Tracking.

Hung Le Richard Socher Steven C. H. Hoi

Bayesian Meta Sampling for Fast Uncertainty Adaptation.

Zhenyi Wang Yang Zhao Ping Yu Ruiyi Zhang Changyou Chen

Economy Statistical Recurrent Units For Inferring Nonlinear Granger Causality.

Saurabh Khanna Vincent Y. F. Tan

MEMO: A Deep Network for Flexible Combination of Episodic Memories.

Andrea Banino Adrià Puigdomènech Badia Raphael Köster Martin J. Chadwick Vinícius Flores Zambaldi Demis Hassabis Caswell Barry Matthew M. Botvinick Dharshan Kumaran Charles Blundell

Probabilistic Connection Importance Inference and Lossless Compression of Deep Neural Networks.

Xin Xing Long Sha Pengyu Hong Zuofeng Shang Jun S. Liu

Coherent Gradients: An Approach to Understanding Generalization in Gradient Descent-based Optimization.

Satrajit Chatterjee

Jelly Bean World: A Testbed for Never-Ending Learning.

Emmanouil Antonios Platanios Abulhair Saparov Tom M. Mitchell

Learning from Explanations with Neural Execution Tree.

Ziqi Wang Yujia Qin Wenxuan Zhou Jun Yan Qinyuan Ye Leonardo Neves Zhiyuan Liu Xiang Ren

Discovering Motor Programs by Recomposing Demonstrations.

Tanmay Shankar Shubham Tulsiani Lerrel Pinto Abhinav Gupta

Convergence of Gradient Methods on Bilinear Zero-Sum Games.

Guojun Zhang Yaoliang Yu

Composing Task-Agnostic Policies with Deep Reinforcement Learning.

Ahmed Hussain Qureshi Jacob J. Johnson Yuzhe Qin Taylor Henderson Byron Boots Michael C. Yip

The Local Elasticity of Neural Networks.

Hangfeng He Weijie J. Su

Gradient-Based Neural DAG Learning.

Sébastien Lachapelle Philippe Brouillard Tristan Deleu Simon Lacoste-Julien

Composition-based Multi-Relational Graph Convolutional Networks.

Shikhar Vashishth Soumya Sanyal Vikram Nitin Partha P. Talukdar

Capsules with Inverted Dot-Product Attention Routing.

Yao-Hung Hubert Tsai Nitish Srivastava Hanlin Goh Ruslan Salakhutdinov

FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary.

Yingzhen Yang Jiahui Yu Nebojsa Jojic Jun Huan Thomas S. Huang

On the Need for Topology-Aware Generative Models for Manifold-Based Defenses.

Uyeong Jang Susmit Jha Somesh Jha

Neural Execution of Graph Algorithms.

Petar Velickovic Rex Ying Matilde Padovano Raia Hadsell Charles Blundell

BERTScore: Evaluating Text Generation with BERT.

Tianyi Zhang Varsha Kishore Felix Wu Kilian Q. Weinberger Yoav Artzi

Augmenting Non-Collaborative Dialog Systems with Explicit Semantic and Strategic Dialog History.

Yiheng Zhou Yulia Tsvetkov Alan W. Black Zhou Yu

Prediction, Consistency, Curvature: Representation Learning for Locally-Linear Control.

Nir Levine Yinlam Chow Rui Shu Ang Li Mohammad Ghavamzadeh Hung Bui

Graph Constrained Reinforcement Learning for Natural Language Action Spaces.

Prithviraj Ammanabrolu Matthew J. Hausknecht

Towards Fast Adaptation of Neural Architectures with Meta Learning.

Dongze Lian Yin Zheng Yintao Xu Yanxiong Lu Leyu Lin Peilin Zhao Junzhou Huang Shenghua Gao

Variational Hetero-Encoder Randomized GANs for Joint Image-Text Modeling.

Hao Zhang Bo Chen Long Tian Zhengjue Wang Mingyuan Zhou

Higher-Order Function Networks for Learning Composable 3D Object Representations.

Eric Mitchell Selim Engin Volkan Isler Daniel D. Lee

Neural Module Networks for Reasoning over Text.

Nitish Gupta Kevin Lin Dan Roth Sameer Singh Matt Gardner

Improved memory in recurrent neural networks with sequential non-normal dynamics.

A. Emin Orhan Xaq Pitkow

Learn to Explain Efficiently via Neural Logic Inductive Learning.

Yuan Yang Le Song

Improving Neural Language Generation with Spectrum Control.

Lingxiao Wang Jing Huang Kevin Huang Ziniu Hu Guangtao Wang Quanquan Gu

Span Recovery for Deep Neural Networks with Applications to Input Obfuscation.

Rajesh Jayaram David P. Woodruff Qiuyi Zhang

Oblique Decision Trees from Derivatives of ReLU Networks.

Guang-He Lee Tommi S. Jaakkola

Precision Gating: Improving Neural Network Efficiency with Dynamic Dual-Precision Activations.

Yichi Zhang Ritchie Zhao Weizhe Hua Nayun Xu G. Edward Suh Zhiru Zhang

PAC Confidence Sets for Deep Neural Networks via Calibrated Prediction.

Sangdon Park Osbert Bastani Nikolai Matni Insup Lee

DD-PPO: Learning Near-Perfect PointGoal Navigators from 2.5 Billion Frames.

Erik Wijmans Abhishek Kadian Ari Morcos Stefan Lee Irfan Essa Devi Parikh Manolis Savva Dhruv Batra

Learning to Learn by Zeroth-Order Oracle.

Yangjun Ruan Yuanhao Xiong Sashank J. Reddi Sanjiv Kumar Cho-Jui Hsieh

MetaPix: Few-Shot Video Retargeting.

Jessica Lee Deva Ramanan Rohit Girdhar

SlowMo: Improving Communication-Efficient Distributed SGD with Slow Momentum.

Jianyu Wang Vinayak Tantia Nicolas Ballas Michael G. Rabbat

Pseudo-LiDAR++: Accurate Depth for 3D Object Detection in Autonomous Driving.

Yurong You Yan Wang Wei-Lun Chao Divyansh Garg Geoff Pleiss Bharath Hariharan Mark E. Campbell Kilian Q. Weinberger

Four Things Everyone Should Know to Improve Batch Normalization.

Cecilia Summers Michael J. Dinneen

Learning to solve the credit assignment problem.

Benjamin James Lansdell Prashanth Ravi Prakash Konrad Paul Körding

Sampling-Free Learning of Bayesian Quantized Neural Networks.

Jiahao Su Milan Cvitkovic Furong Huang

DeFINE: Deep Factorized Input Token Embeddings for Neural Sequence Modeling.

Sachin Mehta Rik Koncel-Kedziorski Mohammad Rastegari Hannaneh Hajishirzi

DBA: Distributed Backdoor Attacks against Federated Learning.

Chulin Xie Keli Huang Pin-Yu Chen Bo Li

Fast is better than free: Revisiting adversarial training.

Eric Wong Leslie Rice J. Zico Kolter

Thieves on Sesame Street! Model Extraction of BERT-based APIs.

Kalpesh Krishna Gaurav Singh Tomar Ankur P. Parikh Nicolas Papernot Mohit Iyyer

Understanding Knowledge Distillation in Non-autoregressive Machine Translation.

Chunting Zhou Jiatao Gu Graham Neubig

Locality and Compositionality in Zero-Shot Learning.

Tristan Sylvain Linda Petrini R. Devon Hjelm

Recurrent neural circuits for contour detection.

Drew Linsley Junkyung Kim Alekh Ashok Thomas Serre

Chameleon: Adaptive Code Optimization for Expedited Deep Neural Network Compilation.

Byung Hoon Ahn Prannoy Pilligundla Amir Yazdanbakhsh Hadi Esmaeilzadeh

Intrinsic Motivation for Encouraging Synergistic Behavior.

Rohan Chitnis Shubham Tulsiani Saurabh Gupta Abhinav Gupta

RaCT: Toward Amortized Ranking-Critical Training For Collaborative Filtering.

Sam Lobel Chunyuan Li Jianfeng Gao Lawrence Carin

Sign-OPT: A Query-Efficient Hard-label Adversarial Attack.

Minhao Cheng Simranjit Singh Patrick H. Chen Pin-Yu Chen Sijia Liu Cho-Jui Hsieh

Playing the lottery with rewards and multiple languages: lottery tickets in RL and NLP.

Haonan Yu Sergey Edunov Yuandong Tian Ari S. Morcos

Learning Space Partitions for Nearest Neighbor Search.

Yihe Dong Piotr Indyk Ilya P. Razenshteyn Tal Wagner

DeepV2D: Video to Depth with Differentiable Structure from Motion.

Zachary Teed Jia Deng

Towards Better Understanding of Adaptive Gradient Algorithms in Generative Adversarial Nets.

Mingrui Liu Youssef Mroueh Jerret Ross Wei Zhang Xiaodong Cui Payel Das Tianbao Yang

Robust And Interpretable Blind Image Denoising Via Bias-Free Convolutional Neural Networks.

Sreyas Mohan Zahra Kadkhodaie Eero P. Simoncelli Carlos Fernandez-Granda

CM3: Cooperative Multi-goal Multi-stage Multi-agent Reinforcement Learning.

Jiachen Yang Alireza Nakhaei David Isele Kikuo Fujimura Hongyuan Zha

Deep Imitative Models for Flexible Inference, Planning, and Control.

Nicholas Rhinehart Rowan McAllister Sergey Levine

Pre-training Tasks for Embedding-based Large-scale Retrieval.

Wei-Cheng Chang Felix X. Yu Yin-Wen Chang Yiming Yang Sanjiv Kumar

Are Transformers universal approximators of sequence-to-sequence functions?

Chulhee Yun Srinadh Bhojanapalli Ankit Singh Rawat Sashank J. Reddi Sanjiv Kumar

Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples.

Eleni Triantafillou Tyler Zhu Vincent Dumoulin Pascal Lamblin Utku Evci Kelvin Xu Ross Goroshin Carles Gelada Kevin Swersky Pierre-Antoine Manzagol Hugo Larochelle

One-Shot Pruning of Recurrent Neural Networks by Jacobian Spectrum Evaluation.

Matthew Shunshi Zhang Bradly C. Stadie

Differentially Private Meta-Learning.

Jeffrey Li Mikhail Khodak Sebastian Caldas Ameet Talwalkar

Bridging Mode Connectivity in Loss Landscapes and Adversarial Robustness.

Pu Zhao Pin-Yu Chen Payel Das Karthikeyan Natesan Ramamurthy Xue Lin

Overlearning Reveals Sensitive Attributes.

Congzheng Song Vitaly Shmatikov

Adversarially robust transfer learning.

Ali Shafahi Parsa Saadatpanah Chen Zhu Amin Ghiasi Christoph Studer David W. Jacobs Tom Goldstein

Learning to Link.

Maria-Florina Balcan Travis Dick Manuel Lang

Detecting Extrapolation with Local Ensembles.

David Madras James Atwood Alexander D'Amour

Global Relational Models of Source Code.

Vincent J. Hellendoorn Charles Sutton Rishabh Singh Petros Maniatis David Bieber

Selection via Proxy: Efficient Data Selection for Deep Learning.

Cody Coleman Christopher Yeh Stephen Mussmann Baharan Mirzasoleiman Peter Bailis Percy Liang Jure Leskovec Matei Zaharia

Short and Sparse Deconvolution - A Geometric Approach.

Yenson Lau Qing Qu Han-Wen Kuo Pengcheng Zhou Yuqian Zhang John Wright

Stochastic Weight Averaging in Parallel: Large-Batch Training That Generalizes Well.

Vipul Gupta Santiago Akle Serrano Dennis DeCoste

Adjustable Real-time Style Transfer.

Mohammad Babaeizadeh Golnaz Ghiasi

Unpaired Point Cloud Completion on Real Scans using Adversarial Training.

Xuelin Chen Baoquan Chen Niloy J. Mitra

Efficient Riemannian Optimization on the Stiefel Manifold via the Cayley Transform.

Jun Li Fuxin Li Sinisa Todorovic

AMRL: Aggregated Memory For Reinforcement Learning.

Jacob Beck Kamil Ciosek Sam Devlin Sebastian Tschiatschek Cheng Zhang Katja Hofmann

Scalable Model Compression by Entropy Penalized Reparameterization.

Deniz Oktay Johannes Ballé Saurabh Singh Abhinav Shrivastava

Dynamic Time Lag Regression: Predicting What & When.

Mandar Chandorkar Cyril Furtlehner Bala Poduval Enrico Camporeale Michèle Sebag

Semi-Supervised Generative Modeling for Controllable Speech Synthesis.

Raza Habib Soroosh Mariooryad Matt Shannon Eric Battenberg R. J. Skerry-Ryan Daisy Stanton David Kao Tom Bagby

Neural Text Generation With Unlikelihood Training.

Sean Welleck Ilia Kulikov Stephen Roller Emily Dinan Kyunghyun Cho Jason Weston

Pure and Spurious Critical Points: a Geometric Study of Linear Networks.

Matthew Trager Kathlén Kohn Joan Bruna

Learning Heuristics for Quantified Boolean Formulas through Reinforcement Learning.

Gil Lederman Markus N. Rabe Sanjit Seshia Edward A. Lee

CAQL: Continuous Action Q-Learning.

Moonkyung Ryu Yinlam Chow Ross Anderson Christian Tjandraatmadja Craig Boutilier

Adaptive Structural Fingerprints for Graph Attention Networks.

Kai Zhang Yaokang Zhu Jun Wang Jie Zhang

ReMixMatch: Semi-Supervised Learning with Distribution Matching and Augmentation Anchoring.

David Berthelot Nicholas Carlini Ekin D. Cubuk Alex Kurakin Kihyuk Sohn Han Zhang Colin Raffel

Identity Crisis: Memorization and Generalization Under Extreme Overparameterization.

Chiyuan Zhang Samy Bengio Moritz Hardt Michael C. Mozer Yoram Singer

Improved Sample Complexities for Deep Neural Networks and Robust Classification via an All-Layer Margin.

Colin Wei Tengyu Ma

Augmenting Genetic Algorithms with Deep Neural Networks for Exploring the Chemical Space.

AkshatKumar Nigam Pascal Friederich Mario Krenn Alán Aspuru-Guzik

Rapid Learning or Feature Reuse? Towards Understanding the Effectiveness of MAML.

Aniruddh Raghu Maithra Raghu Samy Bengio Oriol Vinyals

Imitation Learning via Off-Policy Distribution Matching.

Ilya Kostrikov Ofir Nachum Jonathan Tompson

Reanalysis of Variance Reduced Temporal Difference Learning.

Tengyu Xu Zhe Wang Yi Zhou Yingbin Liang

Minimizing FLOPs to Learn Efficient Sparse Representations.

Biswajit Paria Chih-Kuan Yeh Ian En-Hsu Yen Ning Xu Pradeep Ravikumar Barnabás Póczos

Budgeted Training: Rethinking Deep Neural Network Training Under Resource Constraints.

Mengtian Li Ersin Yumer Deva Ramanan

Deep Semi-Supervised Anomaly Detection.

Lukas Ruff Robert A. Vandermeulen Nico Görnitz Alexander Binder Emmanuel Müller Klaus-Robert Müller Marius Kloft

Sign Bits Are All You Need for Black-Box Attacks.

Abdullah Al-Dujaili Una-May O'Reilly

Reinforced active learning for image segmentation.

Arantxa Casanova Pedro O. Pinheiro Negar Rostamzadeh Christopher J. Pal

On the "steerability" of generative adversarial networks.

Ali Jahanian Lucy Chai Phillip Isola

Learned Step Size quantization.

Steven K. Esser Jeffrey L. McKinstry Deepika Bablani Rathinakumar Appuswamy Dharmendra S. Modha

Stochastic Conditional Generative Networks with Basis Decomposition.

Ze Wang Xiuyuan Cheng Guillermo Sapiro Qiang Qiu

Language GANs Falling Short.

Massimo Caccia Lucas Caccia William Fedus Hugo Larochelle Joelle Pineau Laurent Charlin

GENESIS: Generative Scene Inference and Sampling with Object-Centric Latent Representations.

Martin Engelcke Adam R. Kosiorek Oiwi Parker Jones Ingmar Posner

Understanding the Limitations of Variational Mutual Information Estimators.

Jiaming Song Stefano Ermon

Feature Interaction Interpretability: A Case for Explaining Ad-Recommendation Systems via Neural Interaction Detection.

Michael Tsang Dehua Cheng Hanpeng Liu Xue Feng Eric Zhou Yan Liu

Unsupervised Model Selection for Variational Disentangled Representation Learning.

Sunny Duan Loic Matthey Andre Saraiva Nick Watters Chris Burgess Alexander Lerchner Irina Higgins

A Theoretical Analysis of the Number of Shots in Few-Shot Learning.

Tianshi Cao Marc T. Law Sanja Fidler

Dynamical Distance Learning for Semi-Supervised and Unsupervised Skill Discovery.

Kristian Hartikainen Xinyang Geng Tuomas Haarnoja Sergey Levine

On the Variance of the Adaptive Learning Rate and Beyond.

Liyuan Liu Haoming Jiang Pengcheng He Weizhu Chen Xiaodong Liu Jianfeng Gao Jiawei Han

Quantifying the Cost of Reliable Photo Authentication via High-Performance Learned Lossy Representations.

Pawel Korus Nasir D. Memon

Option Discovery using Deep Skill Chaining.

Akhil Bagaria George Konidaris

V4D: 4D Convolutional Neural Networks for Video-level Representation Learning.

Shiwen Zhang Sheng Guo Weilin Huang Matthew R. Scott Limin Wang

Learning to Represent Programs with Property Signatures.

Augustus Odena Charles Sutton

Generative Ratio Matching Networks.

Akash Srivastava Kai Xu Michael U. Gutmann Charles Sutton

In Search for a SAT-friendly Binarized Neural Network Architecture.

Nina Narodytska Hongce Zhang Aarti Gupta Toby Walsh

Actor-Critic Provably Finds Nash Equilibria of Linear-Quadratic Mean-Field Games.

Zuyue Fu Zhuoran Yang Yongxin Chen Zhaoran Wang

The asymptotic spectrum of the Hessian of DNN throughout training.

Arthur Jacot Franck Gabriel Clément Hongler

Tree-Structured Attention with Hierarchical Accumulation.

Xuan-Phi Nguyen Shafiq R. Joty Steven C. H. Hoi Richard Socher

Deep 3D Pan via local adaptive "t-shaped" convolutions with global and local adaptive dilations.

Juan Luis Gonzalez Bello Munchurl Kim

Low-Resource Knowledge-Grounded Dialogue Generation.

Xueliang Zhao Wei Wu Chongyang Tao Can Xu Dongyan Zhao Rui Yan

A Target-Agnostic Attack on Deep Models: Exploiting Security Vulnerabilities of Transfer Learning.

Shahbaz Rezaei Xin Liu

On Computation and Generalization of Generative Adversarial Imitation Learning.

Minshuo Chen Yizhou Wang Tianyi Liu Zhuoran Yang Xingguo Li Zhaoran Wang Tuo Zhao

Few-Shot Learning on graphs via super-Classes based on Graph spectral Measures.

Jatin Chauhan Deepak Nathani Manohar Kaul

Multiplicative Interactions and Where to Find Them.

Siddhant M. Jayakumar Wojciech M. Czarnecki Jacob Menick Jonathan Schwarz Jack W. Rae Simon Osindero Yee Whye Teh Tim Harley Razvan Pascanu

Continual Learning with Bayesian Neural Networks for Non-Stationary Data.

Richard Kurle Botond Cseke Alexej Klushyn Patrick van der Smagt Stephan Günnemann

SAdam: A Variant of Adam for Strongly Convex Functions.

Guanghui Wang Shiyin Lu Quan Cheng Weiwei Tu Lijun Zhang

Generalization bounds for deep convolutional neural networks.

Philip M. Long Hanie Sedghi

A Fair Comparison of Graph Neural Networks for Graph Classification.

Federico Errica Marco Podda Davide Bacciu Alessio Micheli

Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents.

Christian Rupprecht Cyril Ibrahim Christopher J. Pal

Computation Reallocation for Object Detection.

Feng Liang Chen Lin Ronghao Guo Ming Sun Wei Wu Junjie Yan Wanli Ouyang

From Variational to Deterministic Autoencoders.

Partha Ghosh Mehdi S. M. Sajjadi Antonio Vergari Michael J. Black Bernhard Schölkopf

Adversarially Robust Representations with Smooth Encoders.

A. Taylan Cemgil Sumedh Ghaisas Krishnamurthy (Dj) Dvijotham Pushmeet Kohli

AssembleNet: Searching for Multi-Stream Neural Connectivity in Video Architectures.

Michael S. Ryoo A. J. Piergiovanni Mingxing Tan Anelia Angelova

ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning.

Weihao Yu Zihang Jiang Yanfei Dong Jiashi Feng

Order Learning and Its Application to Age Estimation.

Kyungsun Lim Nyeong-Ho Shin Young-Yoon Lee Chang-Su Kim

Efficient and Information-Preserving Future Frame Prediction and Beyond.

Wei Yu Yichao Lu Steve Easterbrook Sanja Fidler

NAS evaluation is frustratingly hard.

Antoine Yang Pedro M. Esperança Fabio Maria Carlucci

CLN2INV: Learning Loop Invariants with Continuous Logic Networks.

Gabriel Ryan Justin Wong Jianan Yao Ronghui Gu Suman Jana

Scalable Neural Methods for Reasoning With a Symbolic Knowledge Base.

William W. Cohen Haitian Sun R. Alex Hofer Matthew Siegler

A Constructive Prediction of the Generalization Error Across Scales.

Jonathan S. Rosenfeld Amir Rosenfeld Yonatan Belinkov Nir Shavit

An Inductive Bias for Distances: Neural Nets that Respect the Triangle Inequality.

Silviu Pitis Harris Chan Kiarash Jamali Jimmy Ba

Physics-as-Inverse-Graphics: Unsupervised Physical Parameter Estimation from Video.

Miguel Jaques Michael Burke Timothy M. Hospedales

Counterfactuals uncover the modular structure of deep generative models.

Michel Besserve Arash Mehrjou Rémy Sun Bernhard Schölkopf

Gap-Aware Mitigation of Gradient Staleness.

Saar Barkai Ido Hakimi Assaf Schuster

Ensemble Distribution Distillation.

Andrey Malinin Bruno Mlodozeniec Mark J. F. Gales

Deformable Kernels: Adapting Effective Receptive Fields for Object Deformation.

Hang Gao Xizhou Zhu Stephen Lin Jifeng Dai

VL-BERT: Pre-training of Generic Visual-Linguistic Representations.

Weijie Su Xizhou Zhu Yue Cao Bin Li Lewei Lu Furu Wei Jifeng Dai

Optimistic Exploration even with a Pessimistic Initialisation.

Tabish Rashid Bei Peng Wendelin Boehmer Shimon Whiteson

Certified Robustness for Top-k Predictions against Adversarial Perturbations via Randomized Smoothing.

Jinyuan Jia Xiaoyu Cao Binghui Wang Neil Zhenqiang Gong

Identifying through Flows for Recovering Latent Representations.

Shen Li Bryan Hooi Gim Hee Lee

Robust training with ensemble consensus.

Jisoo Lee Sae-Young Chung

Self-Adversarial Learning with Comparative Discrimination for Text Generation.

Wangchunshu Zhou Tao Ge Ke Xu Furu Wei Ming Zhou

Vid2Game: Controllable Characters Extracted from Real-World Videos.

Oran Gafni Lior Wolf Yaniv Taigman

Action Semantics Network: Considering the Effects of Actions in Multiagent Systems.

Weixun Wang Tianpei Yang Yong Liu Jianye Hao Xiaotian Hao Yujing Hu Yingfeng Chen Changjie Fan Yang Gao

Learning Efficient Parameter Server Synchronization Policies for Distributed SGD.

Rong Zhu Sheng Yang Andreas Pfadler Zhengping Qian Jingren Zhou

Relational State-Space Model for Stochastic Multi-Object Systems.

Fan Yang Ling Chen Fan Zhou Yusong Gao Wei Cao

Piecewise linear activations substantially shape the loss surfaces of neural networks.

Fengxiang He Bohan Wang Dacheng Tao

Novelty Detection Via Blurring.

Sung-Ik Choi Sae-Young Chung

Bounds on Over-Parameterization for Guaranteed Existence of Descent Paths in Shallow ReLU Networks.

Arsalan Sharif-Nassab Saber Salehkaleybar S. Jamaloddin Golestani

Data-Independent Neural Pruning via Coresets.

Ben Mussay Margarita Osadchy Vladimir Braverman Samson Zhou Dan Feldman

Deep Network Classification by Scattering and Homotopy Dictionary Learning.

John Zarka Louis Thiry Tomás Angles Stéphane Mallat

Q-learning with UCB Exploration is Sample Efficient for Infinite-Horizon MDP.

Yuanhao Wang Kefan Dong Xiaoyu Chen Liwei Wang

Mixout: Effective Regularization to Finetune Large-scale Pretrained Language Models.

Cheolhyoung Lee Kyunghyun Cho Wanmo Kang

I Am Going MAD: Maximum Discrepancy Competition for Comparing Classifiers Adaptively.

Haotao Wang Tianlong Chen Zhangyang Wang Kede Ma

Black-Box Adversarial Attack with Transferable Model-based Embedding.

Zhichao Huang Tong Zhang

Compositional languages emerge in a neural iterated learning model.

Yi Ren Shangmin Guo Matthieu Labeau Shay B. Cohen Simon Kirby

Population-Guided Parallel Policy Search for Reinforcement Learning.

Whiyoung Jung Giseung Park Youngchul Sung

Variational Recurrent Models for Solving Partially Observable Control Tasks.

Dongqi Han Kenji Doya Jun Tani

GAT: Generative Adversarial Training for Adversarial Example Detection and Robust Classification.

Xuwang Yin Soheil Kolouri Gustavo K. Rohde

Detecting and Diagnosing Adversarial Images with Class-Conditional Capsule Reconstructions.

Yao Qin Nicholas Frosst Sara Sabour Colin Raffel Garrison W. Cottrell Geoffrey E. Hinton

MACER: Attack-free and Scalable Robust Training via Maximizing Certified Radius.

Runtian Zhai Chen Dan Di He Huan Zhang Boqing Gong Pradeep Ravikumar Cho-Jui Hsieh Liwei Wang

Semantically-Guided Representation Learning for Self-Supervised Monocular Depth.

Vitor Guizilini Rui Hou Jie Li Rares Ambrus Adrien Gaidon

Stochastic AUC Maximization with Deep Neural Networks.

Mingrui Liu Zhuoning Yuan Yiming Ying Tianbao Yang

Difference-Seeking Generative Adversarial Network-Unseen Sample Generation.

Yi Lin Sung Sung-Hsien Hsieh Soo-Chang Pei Chun-Shien Lu

FasterSeg: Searching for Faster Real-time Semantic Segmentation.

Wuyang Chen Xinyu Gong Xianming Liu Qian Zhang Yuan Li Zhangyang Wang

Learning Execution through Neural Code fusion.

Zhan Shi Kevin Swersky Daniel Tarlow Parthasarathy Ranganathan Milad Hashemi

Editable Neural Networks.

Anton Sinitsin Vsevolod Plokhotnyuk Dmitry V. Pyrkin Sergei Popov Artem Babenko

Can gradient clipping mitigate label noise?

Aditya Krishna Menon Ankit Singh Rawat Sashank J. Reddi Sanjiv Kumar

Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model.

Wenhan Xiong Jingfei Du William Yang Wang Veselin Stoyanov

Pruned Graph Scattering Transforms.

Vassilis N. Ioannidis Siheng Chen Georgios B. Giannakis

GLAD: Learning Sparse Graph Recovery.

Harsh Shrivastava Xinshi Chen Binghong Chen Guanghui Lan Srinivas Aluru Han Liu Le Song

VideoFlow: A Conditional Flow-Based Model for Stochastic Video Generation.

Manoj Kumar Mohammad Babaeizadeh Dumitru Erhan Chelsea Finn Sergey Levine Laurent Dinh Durk Kingma

Adversarial Policies: Attacking Deep Reinforcement Learning.

Adam Gleave Michael Dennis Cody Wild Neel Kant Sergey Levine Stuart Russell

Escaping Saddle Points Faster with Stochastic Momentum.

Jun-Kun Wang Chi-Heng Lin Jacob D. Abernethy

Few-shot Text Classification with Distributional Signatures.

Yujia Bao Menghua Wu Shiyu Chang Regina Barzilay

Geometric Insights into the Convergence of Nonlinear TD Learning.

David Brandfonbrener Joan Bruna

Learning Self-Correctable Policies and Value Functions from Demonstrations with Negative Sampling.

Yuping Luo Huazhe Xu Tengyu Ma

Exploring Model-based Planning with Policy Networks.

Tingwu Wang Jimmy Ba

On Identifiability in Transformers.

Gino Brunner Yang Liu Damian Pascual Oliver Richter Massimiliano Ciaramita Roger Wattenhofer

Automated curriculum generation through setter-solver interactions.

Sébastien Racanière Andrew K. Lampinen Adam Santoro David P. Reichert Vlad Firoiu Timothy P. Lillicrap

Progressive Memory Banks for Incremental Domain Adaptation.

Nabiha Asghar Lili Mou Kira A. Selby Kevin D. Pantasdo Pascal Poupart Xin Jiang

What graph neural networks cannot learn: depth vs width.

Andreas Loukas

RTFM: Generalising to New Environment Dynamics via Reading.

Victor Zhong Tim Rocktäschel Edward Grefenstette

Input Complexity and Out-of-distribution Detection with Likelihood-based Generative Models.

Joan Serrà David Álvarez Vicenç Gómez Olga Slizovskaia José F. Núñez Jordi Luque

Functional vs. parametric equivalence of ReLU networks.

Mary Phuong Christoph H. Lampert

Disentangling Factors of Variations Using Few Labels.

Francesco Locatello Michael Tschannen Stefan Bauer Gunnar Rätsch Bernhard Schölkopf Olivier Bachem

A critical analysis of self-supervision, or what we can learn from a single image.

Yuki Markus Asano Christian Rupprecht Andrea Vedaldi

Accelerating SGD with momentum for over-parameterized learning.

Chaoyue Liu Mikhail Belkin

Interpretable Complex-Valued Neural Networks for Privacy Protection.

Liyao Xiang Hao Zhang Haotian Ma Yifan Zhang Jie Ren Quanshi Zhang

V-MPO: On-Policy Maximum a Posteriori Policy Optimization for Discrete and Continuous Control.

H. Francis Song Abbas Abdolmaleki Jost Tobias Springenberg Aidan Clark Hubert Soyer Jack W. Rae Seb Noury Arun Ahuja Siqi Liu Dhruva Tirumala Nicolas Heess Dan Belov Martin A. Riedmiller Matthew M. Botvinick

Improving Adversarial Robustness Requires Revisiting Misclassified Examples.

Yisen Wang Difan Zou Jinfeng Yi James Bailey Xingjun Ma Quanquan Gu

DivideMix: Learning with Noisy Labels as Semi-supervised Learning.

Junnan Li Richard Socher Steven C. H. Hoi

Fooling Detection Alone is Not Enough: Adversarial Attack against Multiple Object Tracking.

Yunhan Jia Yantao Lu Junjie Shen Qi Alfred Chen Hao Chen Zhenyu Zhong Tao Wei

Watch, Try, Learn: Meta-Learning from Demonstrations and Rewards.

Allan Zhou Eric Jang Daniel Kappler Alexander Herzog Mohi Khansari Paul Wohlhart Yunfei Bai Mrinal Kalakrishnan Sergey Levine Chelsea Finn

Logic and the 2-Simplicial Transformer.

James Clift Dmitry Doryn Daniel Murfet James Wallbridge

Ae-OT: a New Generative Model based on Extended Semi-discrete Optimal transport.

Dongsheng An Yang Guo Na Lei Zhongxuan Luo Shing-Tung Yau Xianfeng Gu

Exploration in Reinforcement Learning with Deep Covering Options.

Yuu Jinnai Jee Won Park Marlos C. Machado George Dimitri Konidaris

Learning Disentangled Representations for CounterFactual Regression.

Negar Hassanpour Russell Greiner

Analysis of Video Feature Learning in Two-Stream CNNs on the Example of Zebrafish Swim Bout Classification.

Bennet Breier Arno Onken

Robust Local Features for Improving the Generalization of Adversarial Training.

Chuanbiao Song Kun He Jiadong Lin Liwei Wang John E. Hopcroft

Reinforcement Learning with Competitive Ensembles of Information-Constrained Primitives.

Anirudh Goyal Shagun Sodhani Jonathan Binas Xue Bin Peng Sergey Levine Yoshua Bengio

Learning the Arrow of Time for Problems in Reinforcement Learning.

Nasim Rahaman Steffen Wolf Anirudh Goyal Roman Remme Yoshua Bengio

The Variational Bandwidth Bottleneck: Stochastic Evaluation on an Information Budget.

Anirudh Goyal Yoshua Bengio Matthew M. Botvinick Sergey Levine

The Implicit Bias of Depth: How Incremental Learning Drives Generalization.

Daniel Gissin Shai Shalev-Shwartz Amit Daniely

Rethinking Softmax Cross-Entropy Loss for Adversarial Robustness.

Tianyu Pang Kun Xu Yinpeng Dong Chao Du Ning Chen Jun Zhu

Measuring Compositional Generalization: A Comprehensive Method on Realistic Data.

Daniel Keysers Nathanael Schärli Nathan Scales Hylke Buisman Daniel Furrer Sergii Kashubin Nikola Momchev Danila Sinopalnikov Lukasz Stafiniak Tibor Tihon Dmitry Tsarkov Xiao Wang Marc van Zee Olivier Bousquet

Theory and Evaluation Metrics for Learning Disentangled Representations.

Kien Do Truyen Tran

Mixup Inference: Better Exploiting Mixup to Defend Adversarial Attacks.

Tianyu Pang Kun Xu Jun Zhu

Dynamically Pruned Message Passing Networks for Large-scale Knowledge Graph Reasoning.

Xiaoran Xu Wei Feng Yunsheng Jiang Xiaohui Xie Zhiqing Sun Zhi-Hong Deng

Are Pre-trained Language Models Aware of Phrases? Simple but Strong Baselines for Grammar Induction.

Taeuk Kim Jihun Choi Daniel Edmiston Sang-goo Lee

FSPool: Learning Set Representations with Featurewise Sort Pooling.

Yan Zhang Jonathon S. Hare Adam Prügel-Bennett

Multi-agent Reinforcement Learning for Networked System Control.

Tianshu Chu Sandeep Chinchali Sachin Katti

Hierarchical Foresight: Self-Supervised Learning of Long-Horizon Tasks via Visual Subgoal Generation.

Suraj Nair Chelsea Finn

Neural Stored-program Memory.

Hung Le Truyen Tran Svetha Venkatesh

ES-MAML: Simple Hessian-Free Meta Learning.

Xingyou Song Wenbo Gao Yuxiang Yang Krzysztof Choromanski Aldo Pacchiano Yunhao Tang

TabFact: A Large-scale Dataset for Table-based Fact Verification.

Wenhu Chen Hongmin Wang Jianshu Chen Yunkai Zhang Hong Wang Shiyang Li Xiyou Zhou William Yang Wang

Implicit Bias of Gradient Descent based Adversarial Training on Separable Data.

Yan Li Ethan X. Fang Huan Xu Tuo Zhao

Image-guided Neural Object Rendering.

Justus Thies Michael Zollhöfer Christian Theobalt Marc Stamminger Matthias Nießner

Knowledge Consistency between Neural Networks and Beyond.

Ruofan Liang Tianlin Li Longfei Li Jing Wang Quanshi Zhang

Lazy-CFR: fast and near-optimal regret minimization for extensive games with imperfect information.

Yichi Zhou Tongzheng Ren Jialian Li Dong Yan Jun Zhu

Additive Powers-of-Two Quantization: An Efficient Non-uniform Discretization for Neural Networks.

Yuhang Li Xin Dong Wei Wang

Enhancing Transformation-Based Defenses Against Adversarial Attacks with a Distribution Classifier.

Connie Kou Hwee Kuan Lee Ee-Chien Chang Teck Khim Ng

Observational Overfitting in Reinforcement Learning.

Xingyou Song Yiding Jiang Stephen Tu Yilun Du Behnam Neyshabur

On Mutual Information Maximization for Representation Learning.

Michael Tschannen Josip Djolonga Paul K. Rubenstein Sylvain Gelly Mario Lucic

Ranking Policy Gradient.

Kaixiang Lin Jiayu Zhou

SVQN: Sequential Variational Soft Q-Learning Networks.

Shiyu Huang Hang Su Jun Zhu Ting Chen

Understanding Architectures Learnt by Cell-based Neural Architecture Search.

Yao Shu Wei Wang Shaofeng Cai

AutoQ: Automated Kernel-Wise Neural Network Quantization.

Qian Lou Feng Guo Minje Kim Lantao Liu Lei Jiang

Poly-encoders: Architectures and Pre-training Strategies for Fast and Accurate Multi-sentence Scoring.

Samuel Humeau Kurt Shuster Marie-Anne Lachaux Jason Weston

A Learning-based Iterative Method for Solving Vehicle Routing Problems.

Hao Lu Xingwen Zhang Shuang Yang

Transferable Perturbations of Deep Feature Distributions.

Nathan Inkawhich Kevin J. Liang Lawrence Carin Yiran Chen

Continual Learning with Adaptive Weights (CLAW).

Tameem Adel Han Zhao Richard E. Turner

Scalable and Order-robust Continual Learning with Additive Parameter Decomposition.

Jaehong Yoon Saehoon Kim Eunho Yang Sung Ju Hwang

Weakly Supervised Clustering by Exploiting Unique Class Count.

Mustafa Umit Oner Hwee Kuan Lee Wing-Kin Sung

Linear Symmetric Quantization of Neural Networks for Low-precision Integer Hardware.

Xiandong Zhao Ying Wang Xuyi Cai Cheng Liu Lei Zhang

To Relieve Your Headache of Training an MRF, Take AdVIL.

Chongxuan Li Chao Du Kun Xu Max Welling Jun Zhu Bo Zhang

Automated Relational Meta-learning.

Huaxiu Yao Xian Wu Zhiqiang Tao Yaliang Li Bolin Ding Ruirui Li Zhenhui Li

N-BEATS: Neural basis expansion analysis for interpretable time series forecasting.

Boris N. Oreshkin Dmitri Carpov Nicolas Chapados Yoshua Bengio

Deep Learning of Determinantal Point Processes via Proper Spectral Sub-gradient.

Tianshu Yu Yikang Li Baoxin Li

Distance-Based Learning from Errors for Confidence Calibration.

Chen Xing Sercan Ömer Arik Zizhao Zhang Tomas Pfister

Curvature Graph Network.

Ze Ye Kin Sum Liu Tengfei Ma Jie Gao Chao Chen

Learning Expensive Coordination: An Event-Based Deep RL Approach.

Zhenyu Shi Runsheng Yu Xinrun Wang Rundong Wang Youzhi Zhang Hanjiang Lai Bo An

LAMOL: LAnguage MOdeling for Lifelong Language Learning.

Fan-Keng Sun Cheng-Hao Ho Hung-Yi Lee

ProxSGD: Training Structured Neural Networks under Regularization and Constraints.

Yang Yang Yaxiong Yuan Avraam Chatzimichailidis Ruud J. G. van Sloun Lei Lei Symeon Chatzinotas

Diverse Trajectory Forecasting with Determinantal Point Processes.

Ye Yuan Kris M. Kitani

Evaluating The Search Phase of Neural Architecture Search.

Kaicheng Yu Christian Sciuto Martin Jaggi Claudiu Musat Mathieu Salzmann

DeepHoyer: Learning Sparser Neural Network with Differentiable Scale-Invariant Sparsity Measures.

Huanrui Yang Wei Wen Hai Li

Depth-Adaptive Transformer.

Maha Elbayad Jiatao Gu Edouard Grave Michael Auli

Federated Adversarial Domain Adaptation.

Xingchao Peng Zijun Huang Yizhe Zhu Kate Saenko

Maxmin Q-learning: Controlling the Estimation Bias of Q-learning.

Qingfeng Lan Yangchen Pan Alona Fyshe Martha White

Automatically Discovering and Learning New Visual Categories with Ranking Statistics.

Kai Han Sylvestre-Alvise Rebuffi Sébastien Ehrhardt Andrea Vedaldi Andrew Zisserman

Mutual Mean-Teaching: Pseudo Label Refinery for Unsupervised Domain Adaptation on Person Re-identification.

Yixiao Ge Dapeng Chen Hongsheng Li

Neural Oblivious Decision Ensembles for Deep Learning on Tabular Data.

Sergei Popov Stanislav Morozov Artem Babenko

SQIL: Imitation Learning via Reinforcement Learning with Sparse Rewards.

Siddharth Reddy Anca D. Dragan Sergey Levine

Graph inference learning for semi-supervised classification.

Chunyan Xu Zhen Cui Xiaobin Hong Tong Zhang Jian Yang Wei Liu

Learning deep graph matching with channel-independent embedding and Hungarian attention.

Tianshu Yu Runzhong Wang Junchi Yan Baoxin Li

StructPool: Structured Graph Pooling via Conditional Random Fields.

Hao Yuan Shuiwang Ji

On the Weaknesses of Reinforcement Learning for Neural Machine Translation.

Leshem Choshen Lior Fox Zohar Aizenbud Omri Abend

Sharing Knowledge in Multi-Task Deep Reinforcement Learning.

Carlo D'Eramo Davide Tateo Andrea Bonarini Marcello Restelli Jan Peters

Reinforcement Learning Based Graph-to-Sequence Model for Natural Question Generation.

Yu Chen Lingfei Wu Mohammed J. Zaki

SELF: Learning to Filter Noisy Labels with Self-Ensembling.

Duc Tam Nguyen Chaithanya Kumar Mummadi Thi-Phuong-Nhung Ngo Thi Hoai Phuong Nguyen Laura Beggel Thomas Brox

Large Batch Optimization for Deep Learning: Training BERT in 76 minutes.

Yang You Jing Li Sashank J. Reddi Jonathan Hseu Sanjiv Kumar Srinadh Bhojanapalli Xiaodan Song James Demmel Kurt Keutzer Cho-Jui Hsieh