ICLR 2017论文列表 - 5th International Conference on Learning Representations, ICLR 2017, Toulon, France, April 24-26, 2017, Conference Track Proceedings.| 数据学习 (DataLearner)

ICLR 2017 论文列表

5th International Conference on Learning Representations, ICLR 2017, Toulon, France, April 24-26, 2017, Conference Track Proceedings.

Hadamard Product for Low-rank Bilinear Pooling.

Jin-Hwa Kim Kyoung Woon On Woosang Lim Jeonghee Kim Jung-Woo Ha Byoung-Tak Zhang

A Learned Representation For Artistic Style.

Vincent Dumoulin Jonathon Shlens Manjunath Kudlur

HyperNetworks.

David Ha Andrew M. Dai Quoc V. Le

Dropout with Expectation-linear Regularization.

Xuezhe Ma Yingkai Gao Zhiting Hu Yaoliang Yu Yuntian Deng Eduard H. Hovy

Neural Photo Editing with Introspective Adversarial Networks.

Andrew Brock Theodore Lim James M. Ritchie Nick Weston

Hierarchical Multiscale Recurrent Neural Networks.

Junyoung Chung Sungjin Ahn Yoshua Bengio

Why Deep Neural Networks for Function Approximation?

Shiyu Liang R. Srikant

HolStep: A Machine Learning Dataset for Higher-order Logic Theorem Proving.

Cezary Kaliszyk François Chollet Christian Szegedy

Tighter bounds lead to improved classifiers.

Nicolas Le Roux

Understanding Trainable Sparse Coding with Matrix Factorization.

Thomas Moreau Joan Bruna

An Actor-Critic Algorithm for Sequence Prediction.

Dzmitry Bahdanau Philemon Brakel Kelvin Xu Anirudh Goyal Ryan Lowe Joelle Pineau Aaron C. Courville Yoshua Bengio

Pointer Sentinel Mixture Models.

Stephen Merity Caiming Xiong James Bradbury Richard Socher

Fine-grained Analysis of Sentence Embeddings Using Auxiliary Prediction Tasks.

Yossi Adi Einat Kermany Yonatan Belinkov Ofer Lavi Yoav Goldberg

Adversarial Training Methods for Semi-Supervised Text Classification.

Takeru Miyato Andrew M. Dai Ian J. Goodfellow

Sparsely-Connected Neural Networks: Towards Efficient VLSI Implementation of Deep Neural Networks.

Arash Ardakani Carlo Condo Warren J. Gross

Semi-Supervised Classification with Graph Convolutional Networks.

Thomas N. Kipf Max Welling

Efficient Representation of Low-Dimensional Manifolds using Deep Networks.

Ronen Basri David W. Jacobs

Inductive Bias of Deep Convolutional Networks through Pooling Geometry.

Nadav Cohen Amnon Shashua

Recurrent Mixture Density Network for Spatiotemporal Visual Attention.

Loris Bazzani Hugo Larochelle Lorenzo Torresani

Predicting Medications from Diagnostic Codes with Recurrent Neural Networks.

Jacek M. Bajor Thomas A. Lasko

Adversarial Machine Learning at Scale.

Alexey Kurakin Ian J. Goodfellow Samy Bengio

Learning Recurrent Representations for Hierarchical Behavior Modeling.

Eyrun Eyjolfsdottir Kristin Branson Yisong Yue Pietro Perona

Reasoning with Memory Augmented Neural Networks for Language Comprehension.

Tsendsuren Munkhdalai Hong Yu

Learning Invariant Representations Of Planar Curves.

Gautam Pai Aaron Wetzler Ron Kimmel

Geometry of Polysemy.

Jiaqi Mu Suma Bhat Pramod Viswanath

Do Deep Convolutional Nets Really Need to be Deep and Convolutional?

Gregor Urban Krzysztof J. Geras Samira Ebrahimi Kahou Özlem Aslan Shengjie Wang Abdelrahman Mohamed Matthai Philipose Matthew Richardson Rich Caruana

Discrete Variational Autoencoders.

Jason Tyler Rolfe

Towards Deep Interpretability (MUS-ROVER II): Learning Hierarchical Representations of Tonal Music.

Haizi Yu Lav R. Varshney

Tying Word Vectors and Word Classifiers: A Loss Framework for Language Modeling.

Hakan Inan Khashayar Khosravi Richard Socher

Support Regularized Sparse Coding and Its Fast Encoder.

Yingzhen Yang Jiahui Yu Pushmeet Kohli Jianchao Yang Thomas S. Huang

Batch Policy Gradient Methods for Improving Neural Conversation Models.

Kirthevasan Kandasamy Yoram Bachrach Ryota Tomioka Daniel Tarlow David Carter

Stick-Breaking Variational Autoencoders.

Eric T. Nalisnick Padhraic Smyth

Faster CNNs with Direct Sparse Convolutions and Guided Pruning.

Jongsoo Park Sheng R. Li Wei Wen Ping Tak Peter Tang Hai Li Yiran Chen Pradeep Dubey

Towards the Limit of Network Quantization.

Yoojin Choi Mostafa El-Khamy Jungwon Lee

Adversarial Feature Learning.

Jeff Donahue Philipp Krähenbühl Trevor Darrell

Identity Matters in Deep Learning.

Moritz Hardt Tengyu Ma

Delving into Transferable Adversarial Examples and Black-box Attacks.

Yanpei Liu Xinyun Chen Chang Liu Dawn Song

Learning to Compose Words into Sentences with Reinforcement Learning.

Dani Yogatama Phil Blunsom Chris Dyer Edward Grefenstette Wang Ling

Training deep neural-networks using a noise adaptation layer.

Jacob Goldberger Ehud Ben-Reuven

On Detecting Adversarial Perturbations.

Jan Hendrik Metzen Tim Genewein Volker Fischer Bastian Bischoff

Temporal Ensembling for Semi-Supervised Learning.

Samuli Laine Timo Aila

Sample Efficient Actor-Critic with Experience Replay.

Ziyu Wang Victor Bapst Nicolas Heess Volodymyr Mnih Rémi Munos Koray Kavukcuoglu Nando de Freitas

Deep Multi-task Representation Learning: A Tensor Factorisation Approach.

Yongxin Yang Timothy M. Hospedales

Entropy-SGD: Biasing Gradient Descent Into Wide Valleys.

Pratik Chaudhari Anna Choromanska Stefano Soatto Yann LeCun Carlo Baldassi Christian Borgs Jennifer T. Chayes Levent Sagun Riccardo Zecchina

Incremental Network Quantization: Towards Lossless CNNs with Low-precision Weights.

Aojun Zhou Anbang Yao Yiwen Guo Lin Xu Yurong Chen

Central Moment Discrepancy (CMD) for Domain-Invariant Representation Learning.

Werner Zellinger Thomas Grubinger Edwin Lughofer Thomas Natschläger Susanne Saminger-Platz

Energy-based Generative Adversarial Networks.

Junbo Jake Zhao Michaël Mathieu Yann LeCun

Learning to Play in a Day: Faster Deep Reinforcement Learning by Optimality Tightening.

Frank S. He Yang Liu Alexander G. Schwing Jian Peng

Loss-aware Binarization of Deep Networks.

Lu Hou Quanming Yao James T. Kwok

Learning to Repeat: Fine Grained Action Repetition for Deep Reinforcement Learning.

Sahil Sharma Aravind S. Lakshminarayanan Balaraman Ravindran

Revisiting Classifier Two-Sample Tests.

David Lopez-Paz Maxime Oquab

FractalNet: Ultra-Deep Neural Networks without Residuals.

Gustav Larsson Michael Maire Gregory Shakhnarovich

Deep Information Propagation.

Samuel S. Schoenholz Justin Gilmer Surya Ganguli Jascha Sohl-Dickstein

Learning through Dialogue Interactions by Asking Questions.

Jiwei Li Alexander H. Miller Sumit Chopra Marc'Aurelio Ranzato Jason Weston

Adversarially Learned Inference.

Vincent Dumoulin Ishmael Belghazi Ben Poole Alex Lamb Martín Arjovsky Olivier Mastropietro Aaron C. Courville

Dialogue Learning With Human-in-the-Loop.

Jiwei Li Alexander H. Miller Sumit Chopra Marc'Aurelio Ranzato Jason Weston

Automatic Rule Extraction from Long Short Term Memory Networks.

W. James Murdoch Arthur Szlam

The Neural Noisy Channel.

Lei Yu Phil Blunsom Chris Dyer Edward Grefenstette Tomás Kociský

Deep Variational Information Bottleneck.

Alexander A. Alemi Ian Fischer Joshua V. Dillon Kevin Murphy

Variable Computation in Recurrent Neural Networks.

Yacine Jernite Edouard Grave Armand Joulin Tomás Mikolov

Learning and Policy Search in Stochastic Dynamical Systems with Bayesian Neural Networks.

Stefan Depeweg José Miguel Hernández-Lobato Finale Doshi-Velez Steffen Udluft

DeepCoder: Learning to Write Programs.

Matej Balog Alexander L. Gaunt Marc Brockschmidt Sebastian Nowozin Daniel Tarlow

Learning to Navigate in Complex Environments.

Piotr Mirowski Razvan Pascanu Fabio Viola Hubert Soyer Andy Ballard Andrea Banino Misha Denil Ross Goroshin Laurent Sifre Koray Kavukcuoglu Dharshan Kumaran Raia Hadsell

Reinforcement Learning through Asynchronous Advantage Actor-Critic on a GPU.

Mohammad Babaeizadeh Iuri Frosio Stephen Tyree Jason Clemons Jan Kautz

Learning a Natural Language Interface with Neural Programmer.

Arvind Neelakantan Quoc V. Le Martín Abadi Andrew McCallum Dario Amodei

SGDR: Stochastic Gradient Descent with Warm Restarts.

Ilya Loshchilov Frank Hutter

Recurrent Batch Normalization.

Tim Cooijmans Nicolas Ballas César Laurent Çaglar Gülçehre Aaron C. Courville

Density estimation using Real NVP.

Laurent Dinh Jascha Sohl-Dickstein Samy Bengio

Combining policy gradient and Q-learning.

Brendan O'Donoghue Rémi Munos Koray Kavukcuoglu Volodymyr Mnih

Paleo: A Performance Model for Deep Neural Networks.

Hang Qi Evan R. Sparks Ameet Talwalkar

Latent Sequence Decompositions.

William Chan Yu Zhang Quoc V. Le Navdeep Jaitly

Online Bayesian Transfer Learning for Sequential Data Modeling.

Priyank Jaini Zhitang Chen Pablo Carbajal Edith Law Laura Middleton Kayla Regan Mike Schaekermann George Trimponias James Tung Pascal Poupart

Categorical Reparameterization with Gumbel-Softmax.

Eric Jang Shixiang Gu Ben Poole

Visualizing Deep Neural Network Decisions: Prediction Difference Analysis.

Luisa M. Zintgraf Taco S. Cohen Tameem Adel Max Welling

Offline bilingual word vectors, orthogonal transformations and the inverted softmax.

Samuel L. Smith David H. P. Turban Steven Hamblin Nils Y. Hammerla

beta-VAE: Learning Basic Visual Concepts with a Constrained Variational Framework.

Irina Higgins Loïc Matthey Arka Pal Christopher P. Burgess Xavier Glorot Matthew M. Botvinick Shakir Mohamed Alexander Lerchner

Mollifying Networks.

Çaglar Gülçehre Marcin Moczulski Francesco Visin Yoshua Bengio

Generative Multi-Adversarial Networks.

Ishan P. Durugkar Ian Gemp Sridhar Mahadevan

Deep Variational Bayes Filters: Unsupervised Learning of State Space Models from Raw Data.

Maximilian Karl Maximilian Soelch Justin Bayer Patrick van der Smagt

Recurrent Hidden Semi-Markov Model.

Hanjun Dai Bo Dai Yan-Ming Zhang Shuang Li Le Song

Frustratingly Short Attention Spans in Neural Language Modeling.

Michal Daniluk Tim Rocktäschel Johannes Welbl Sebastian Riedel

TopicRNN: A Recurrent Neural Network with Long-Range Semantic Dependency.

Adji B. Dieng Chong Wang Jianfeng Gao John W. Paisley

Unrolled Generative Adversarial Networks.

Luke Metz Ben Poole David Pfau Jascha Sohl-Dickstein

The Concrete Distribution: A Continuous Relaxation of Discrete Random Variables.

Chris J. Maddison Andriy Mnih Yee Whye Teh

Regularizing CNNs with Locally Constrained Decorrelations.

Pau Rodríguez Jordi Gonzàlez Guillem Cucurull Josep M. Gonfaus F. Xavier Roca

A Structured Self-Attentive Sentence Embedding.

Zhouhan Lin Minwei Feng Cícero Nogueira dos Santos Mo Yu Bing Xiang Bowen Zhou Yoshua Bengio

Sigma Delta Quantized Networks.

Peter O'Connor Max Welling

Trusting SVM for Piecewise Linear CNNs.

Leonard Berrada Andrew Zisserman M. Pawan Kumar

Learning to superoptimize programs.

Rudy Bunel Alban Desmaison M. Pawan Kumar Philip H. S. Torr Pushmeet Kohli

A Baseline for Detecting Misclassified and Out-of-Distribution Examples in Neural Networks.

Dan Hendrycks Kevin Gimpel

Learning Features of Music From Scratch.

John Thickstun Zaïd Harchaoui Sham M. Kakade

Multi-view Recurrent Neural Acoustic Word Embeddings.

Wanjia He Weiran Wang Karen Livescu

Attend, Adapt and Transfer: Attentive Deep Architecture for Adaptive Transfer from multiple sources in the same domain.

Janarthanan Rajendran Aravind S. Lakshminarayanan Mitesh M. Khapra P. Prasanna Balaraman Ravindran

EPOpt: Learning Robust Neural Network Policies Using Model Ensembles.

Aravind Rajeswaran Sarvjeet Ghotra Balaraman Ravindran Sergey Levine

Recurrent Environment Simulators.

Silvia Chiappa Sébastien Racanière Daan Wierstra Shakir Mohamed

Quasi-Recurrent Neural Networks.

James Bradbury Stephen Merity Caiming Xiong Richard Socher

Lie-Access Neural Turing Machines.

Greg Yang Alexander M. Rush

Hyperband: Bandit-Based Configuration Evaluation for Hyperparameter Optimization.

Lisha Li Kevin G. Jamieson Giulia DeSalvo Afshin Rostamizadeh Ameet Talwalkar

Introspection: Accelerating Neural Network Training By Learning Weight Evolution.

Abhishek Sinha Aahitagni Mukherjee Mausoom Sarkar Balaji Krishnamurthy

Tree-structured decoding with doubly-recurrent neural networks.

David Alvarez-Melis Tommi S. Jaakkola

Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer.

Noam Shazeer Azalia Mirhoseini Krzysztof Maziarz Andy Davis Quoc V. Le Geoffrey E. Hinton Jeff Dean

A recurrent neural network without chaos.

Thomas Laurent James von Brecht

Variational Lossy Autoencoder.

Xi Chen Diederik P. Kingma Tim Salimans Yan Duan Prafulla Dhariwal John Schulman Ilya Sutskever Pieter Abbeel

LR-GAN: Layered Recursive Generative Adversarial Networks for Image Generation.

Jianwei Yang Anitha Kannan Dhruv Batra Devi Parikh

Deep Probabilistic Programming.

Dustin Tran Matthew D. Hoffman Rif A. Saurous Eugene Brevdo Kevin Murphy David M. Blei

Zoneout: Regularizing RNNs by Randomly Preserving Hidden Activations.

David Krueger Tegan Maharaj János Kramár Mohammad Pezeshki Nicolas Ballas Nan Rosemary Ke Anirudh Goyal Yoshua Bengio Aaron C. Courville Christopher J. Pal

Structured Attention Networks.

Yoon Kim Carl Denton Luong Hoang Alexander M. Rush

Lossy Image Compression with Compressive Autoencoders.

Lucas Theis Wenzhe Shi Andrew Cunningham Ferenc Huszár

Exploring Sparsity in Recurrent Neural Networks.

Sharan Narang Greg Diamos Shubho Sengupta Erich Elsen

Metacontrol for Adaptive Imagination-Based Optimization.

Jessica B. Hamrick Andrew J. Ballard Razvan Pascanu Oriol Vinyals Nicolas Heess Peter W. Battaglia

SampleRNN: An Unconditional End-to-End Neural Audio Generation Model.

Soroush Mehri Kundan Kumar Ishaan Gulrajani Rithesh Kumar Shubham Jain Jose Sotelo Aaron C. Courville Yoshua Bengio

Dynamic Coattention Networks For Question Answering.

Caiming Xiong Victor Zhong Richard Socher

Incorporating long-range consistency in CNN-based texture generation.

Guillaume Berger Roland Memisevic

Bidirectional Attention Flow for Machine Comprehension.

Min Joon Seo Aniruddha Kembhavi Ali Farhadi Hannaneh Hajishirzi

DeepDSL: A Compilation-based Domain-Specific Language for Deep Learning.

Tian Zhao Xiaobing Huang Yu Cao

Machine Comprehension Using Match-LSTM and Answer Pointer.

Shuohang Wang Jing Jiang

Designing Neural Network Architectures using Reinforcement Learning.

Bowen Baker Otkrist Gupta Nikhil Naik Ramesh Raskar

Query-Reduction Networks for Question Answering.

Min Joon Seo Sewon Min Ali Farhadi Hannaneh Hajishirzi

Pruning Convolutional Neural Networks for Resource Efficient Inference.

Pavlo Molchanov Stephen Tyree Tero Karras Timo Aila Jan Kautz

Calibrating Energy-based Generative Adversarial Networks.

Zihang Dai Amjad Almahairi Philip Bachman Eduard H. Hovy Aaron C. Courville

Deep Learning with Dynamic Computation Graphs.

Moshe Looks Marcello Herreshoff DeLesley Hutchins Peter Norvig

Improving Policy Gradient by Exploring Under-appreciated Rewards.

Ofir Nachum Mohammad Norouzi Dale Schuurmans

Learning to Perform Physics Experiments via Deep Reinforcement Learning.

Misha Denil Pulkit Agrawal Tejas D. Kulkarni Tom Erez Peter W. Battaglia Nando de Freitas

Capacity and Trainability in Recurrent Neural Networks.

Jasmine Collins Jascha Sohl-Dickstein David Sussillo

A Simple but Tough-to-Beat Baseline for Sentence Embeddings.

Sanjeev Arora Yingyu Liang Tengyu Ma

Words or Characters? Fine-grained Gating for Reading Comprehension.

Zhilin Yang Bhuwan Dhingra Ye Yuan Junjie Hu William W. Cohen Ruslan Salakhutdinov

Transfer Learning for Sequence Tagging with Hierarchical Recurrent Networks.

Zhilin Yang Ruslan Salakhutdinov William W. Cohen

Learning to Remember Rare Events.

Lukasz Kaiser Ofir Nachum Aurko Roy Samy Bengio

A Compositional Object-Based Approach to Learning Physical Dynamics.

Michael Chang Tomer D. Ullman Antonio Torralba Joshua B. Tenenbaum

DSD: Dense-Sparse-Dense Training for Deep Neural Networks.

Song Han Jeff Pool Sharan Narang Huizi Mao Enhao Gong Shijian Tang Erich Elsen Peter Vajda Manohar Paluri John Tran Bryan Catanzaro William J. Dally

Trained Ternary Quantization.

Chenzhuo Zhu Song Han Huizi Mao William J. Dally

On the Quantitative Analysis of Decoder-Based Generative Models.

Yuhuai Wu Yuri Burda Ruslan Salakhutdinov Roger B. Grosse

Optimal Binary Autoencoding with Pairwise Correlations.

Akshay Balsubramani

Autoencoding Variational Inference For Topic Models.

Akash Srivastava Charles Sutton

Training Compressed Fully-Connected Networks with a Density-Diversity Penalty.

Shengjie Wang Haoran Cai Jeff A. Bilmes William S. Noble

Data Noising as Smoothing in Neural Network Language Models.

Ziang Xie Sida I. Wang Jiwei Li Daniel Lévy Aiming Nie Dan Jurafsky Andrew Y. Ng

A Compare-Aggregate Model for Matching Text Sequences.

Shuohang Wang Jing Jiang

Learning to Optimize.

Ke Li Jitendra Malik

Learning Curve Prediction with Bayesian Neural Networks.

Aaron Klein Stefan Falkner Jost Tobias Springenberg Frank Hutter

Generalizing Skills with Semi-Supervised Reinforcement Learning.

Chelsea Finn Tianhe Yu Justin Fu Pieter Abbeel Sergey Levine

Generative Models and Model Criticism via Optimized Maximum Mean Discrepancy.

Danica J. Sutherland Hsiao-Yu Tung Heiko Strathmann Soumyajit De Aaditya Ramdas Alexander J. Smola Arthur Gretton

Towards a Neural Statistician.

Harrison Edwards Amos J. Storkey

Decomposing Motion and Content for Natural Video Sequence Prediction.

Ruben Villegas Jimei Yang Seunghoon Hong Xunyu Lin Honglak Lee

Neuro-Symbolic Program Synthesis.

Emilio Parisotto Abdel-rahman Mohamed Rishabh Singh Lihong Li Dengyong Zhou Pushmeet Kohli

Training Agent for First-Person Shooter Game with Actor-Critic Curriculum Learning.

Yuxin Wu Yuandong Tian

Snapshot Ensembles: Train 1, Get M for Free.

Gao Huang Yixuan Li Geoff Pleiss Zhuang Liu John E. Hopcroft Kilian Q. Weinberger

PixelVAE: A Latent Variable Model for Natural Images.

Ishaan Gulrajani Kundan Kumar Faruk Ahmed Adrien Ali Taïga Francesco Visin David Vázquez Aaron C. Courville

Deep Biaffine Attention for Neural Dependency Parsing.

Timothy Dozat Christopher D. Manning

Diet Networks: Thin Parameters for Fat Genomics.

Adriana Romero Pierre Luc Carrier Akram Erraqabi Tristan Sylvain Alex Auvolat Etienne Dejoie Marc-André Legault Marie-Pierre Dubé Julie G. Hussin Yoshua Bengio

Deep Predictive Coding Networks for Video Prediction and Unsupervised Learning.

William Lotter Gabriel Kreiman David D. Cox

Learning to Query, Reason, and Answer Questions On Ambiguous Texts.

Xiaoxiao Guo Tim Klinger Clemens Rosenbaum Joseph P. Bigus Murray Campbell Ban Kawas Kartik Talamadupula Gerry Tesauro Satinder Singh

Steerable CNNs.

Taco S. Cohen Max Welling

Tracking the World State with Recurrent Entity Networks.

Mikael Henaff Jason Weston Arthur Szlam Antoine Bordes Yann LeCun

Neural Program Lattices.

Chengtao Li Daniel Tarlow Alexander L. Gaunt Marc Brockschmidt Nate Kushman

Soft Weight-Sharing for Neural Network Compression.

Karen Ullrich Edward Meeds Max Welling

Episodic Exploration for Deep Deterministic Policies for StarCraft Micromanagement.

Nicolas Usunier Gabriel Synnaeve Zeming Lin Soumith Chintala

Program Synthesis for Character Level Language Modeling.

Pavol Bielik Veselin Raychev Martin T. Vechev

Variational Recurrent Adversarial Deep Domain Adaptation.

Sanjay Purushotham Wilka Carvalho Tanachat Nilanon Yan Liu

Third Person Imitation Learning.

Bradly C. Stadie Pieter Abbeel Ilya Sutskever

Unsupervised Cross-Domain Image Generation.

Yaniv Taigman Adam Polyak Lior Wolf

Improving Neural Language Models with a Continuous Cache.

Edouard Grave Armand Joulin Nicolas Usunier

Highway and Residual Networks learn Unrolled Iterative Estimation.

Klaus Greff Rupesh Kumar Srivastava Jürgen Schmidhuber

Mode Regularized Generative Adversarial Networks.

Tong Che Yanran Li Athul Paul Jacob Yoshua Bengio Wenjie Li

PixelCNN++: Improving the PixelCNN with Discretized Logistic Mixture Likelihood and Other Modifications.

Tim Salimans Andrej Karpathy Xi Chen Diederik P. Kingma

An Information-Theoretic Framework for Fast and Robust Unsupervised Learning via Neural Population Infomax.

Wentao Huang Kechen Zhang

Emergence of foveal image sampling from learning to attend in visual scenes.

Brian Cheung Eric Weiss Bruno A. Olshausen

What does it take to generate natural textures?

Ivan Ustyuzhaninov Wieland Brendel Leon A. Gatys Matthias Bethge

Transfer of View-manifold Learning to Similarity Perception of Novel Objects.

Xingyu Lin Hao Wang Zhihao Li Yimeng Zhang Alan L. Yuille Tai Sing Lee

Learning Invariant Feature Spaces to Transfer Skills with Reinforcement Learning.

Abhishek Gupta Coline Devin Yuxuan Liu Pieter Abbeel Sergey Levine

Efficient Vector Representation for Documents through Corruption.

Minmin Chen

Improving Generative Adversarial Networks with Denoising Feature Matching.

David Warde-Farley Yoshua Bengio

Multilayer Recurrent Network Models of Primate Retinal Ganglion Cell Responses.

Eleanor Batty Josh Merel Nora Brackbill Alexander Heitman Alexander Sher Alan M. Litke E. J. Chichilnisky Liam Paninski

Normalizing the Normalizers: Comparing and Extending Network Normalization Schemes.

Mengye Ren Renjie Liao Raquel Urtasun Fabian H. Sinz Richard S. Zemel

Filter shaping for Convolutional Neural Networks.

Xingyi Li Fuxin Li Xiaoli Z. Fern Raviv Raich

Learning to Generate Samples from Noise through Infusion Training.

Florian Bordes Sina Honari Pascal Vincent

Pruning Filters for Efficient ConvNets.

Hao Li Asim Kadav Igor Durdanovic Hanan Samet Hans Peter Graf

Distributed Second-Order Optimization using Kronecker-Factored Approximations.

Jimmy Ba Roger B. Grosse James Martens

Nonparametric Neural Networks.

George Philipp Jaime G. Carbonell

Stochastic Neural Networks for Hierarchical Reinforcement Learning.

Carlos Florensa Yan Duan Pieter Abbeel

Learning Visual Servoing with Deep Features and Fitted Q-Iteration.

Alex X. Lee Sergey Levine Pieter Abbeel

Paying More Attention to Attention: Improving the Performance of Convolutional Neural Networks via Attention Transfer.

Sergey Zagoruyko Nikos Komodakis

Topology and Geometry of Half-Rectified Network Optimization.

C. Daniel Freeman Joan Bruna

Maximum Entropy Flow Networks.

Gabriel Loaiza-Ganem Yuanjun Gao John P. Cunningham

Learning Graphical State Transitions.

Daniel D. Johnson

Amortised MAP Inference for Image Super-resolution.

Casper Kaae Sønderby Jose Caballero Lucas Theis Wenzhe Shi Ferenc Huszár

Semi-supervised Knowledge Transfer for Deep Learning from Private Training Data.

Nicolas Papernot Martín Abadi Úlfar Erlingsson Ian J. Goodfellow Kunal Talwar

On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima.

Nitish Shirish Keskar Dheevatsa Mudigere Jorge Nocedal Mikhail Smelyanskiy Ping Tak Peter Tang

Learning to Act by Predicting the Future.

Alexey Dosovitskiy Vladlen Koltun

Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic.

Shixiang Gu Timothy P. Lillicrap Zoubin Ghahramani Richard E. Turner Sergey Levine

Neural Architecture Search with Reinforcement Learning.

Barret Zoph Quoc V. Le

Understanding deep learning requires rethinking generalization.

Chiyuan Zhang Samy Bengio Moritz Hardt Benjamin Recht Oriol Vinyals

Multi-Agent Cooperation and the Emergence of (Natural) Language.

Angeliki Lazaridou Alexander Peysakhovich Marco Baroni

Reinforcement Learning with Unsupervised Auxiliary Tasks.

Max Jaderberg Volodymyr Mnih Wojciech Marian Czarnecki Tom Schaul Joel Z. Leibo David Silver Koray Kavukcuoglu

Towards Principled Methods for Training Generative Adversarial Networks.

Martín Arjovsky Léon Bottou

Learning End-to-End Goal-Oriented Dialog.

Antoine Bordes Y-Lan Boureau Jason Weston

Optimization as a Model for Few-Shot Learning.

Sachin Ravi Hugo Larochelle

End-to-end Optimized Image Compression.

Johannes Ballé Valero Laparra Eero P. Simoncelli

Making Neural Programming Architectures Generalize via Recursion.

Jonathon Cai Richard Shin Dawn Song