NIPS2018论文及代码集锦(30)(亮点：三维刚体CNN;网格TensorFlow;可信数据应对严重污染标签)

2019年7月15日 1680点热度 2人点赞 0条评论

[1] 3D Steerable CNNs: Learning Rotationally Equivariant Features in Volumetric Data

Maurice Weiler, Mario Geiger, Max Welling, Wouter Boomsma, Taco Cohen

University of Amsterdam, EPFL, University of Copenhagen, Qualcomm AI Research

立即下载

这篇文章提出一种新型卷积网络，该网络与刚体运动等价。该模型使用三维欧几里得空间上的标量、矢量和张量场来表示数据，同时使用等变量卷积来得到这些表示之间的映射。

这些SE(3)等变量卷积是基于内核的，这些内核是由完备可引导内核基的线性组合得到的，本文对此进行了分析性推导。本文证明了等变量卷积是三维空间中场之间最一般的等数线性映射。

实验结果表明，3D可引导CNN在氨基酸倾向预测和蛋白质结构分类问题上效果可观，两者均具有固有的SE(3)对称性。

几种方法的效果对比如下

其中2对应的论文为

Gift: A real-time and scalable 3d shape search engine， CVPR 2016

7对应的论文为

Spherical CNNs，ICLR 2018

14对应的论文为

3D object classification and retrieval with Spherical CNNs，2017

16对应的论文为

Deep aggregation of local 3d geometric features for 3d model retrieval, BMVC 2016

24对应的论文为

Rotationnet: Joint object categorization and pose estimation using multiviews from unsupervised viewpoints, 2018

代码地址

https://github.com/kanezaki/rotationnet

35对应的论文为

Large-Scale 3D Shape Retrieval from ShapeNet Core55, 2017

39对应的论文为

Multi-fourier spectra descriptor and augmentation with spectral clustering for 3d shape retrieval，2009

准确率随训练集大小变化图如下

代码地址
https://github.com/mariogeiger/se3cnn

数据集地址

https://github.com/wouterboomsma/cath_datasets

[2] Mesh-TensorFlow: Deep Learning for Supercomputers

Noam Shazeer, Youlong Cheng, Niki Parmar, Dustin Tran, Ashish Vaswani, Penporn Koanantakool, Peter Hawkins, HyoukJoong Lee Mingsheng Hong, Cliff Young, Ryan Sepassi, Blake Hechtman

Google Brain

立即下载

对数据进行分批，使得数据并行化，在分布式深层神经网络训练策略中占有主流地位，该方法具有通用性，而且能够促成单程序多数据流编程。

然而，数据分批处理存在一些问题，比如由于内存限制无法训练非常大的模型，而且具有高延迟性，另外，批量过小时会导致效率低下。值得高兴的是，这些问题都可以通过比较常用的分布策略(模型并行化)来解决。不幸的是，高效的模型并行算法往往比较复杂，难以发现、描述，并且难以实现，尤其在大型集群上更是如此。

本文提出了 Mesh-TensorFlow，它是一种用于特定类别分布式张量计算的语言。在 Mesh-TensorFlow 中，数据并行性可以看做沿"批处理"维度进行拆分张量和操作，用户可以指定在多维处理器网格上的任意维度拆分，进而得到任意张量维度。

Mesh-TensorFlow 图可以编译为 SPMD 程序，该程序由并行操作与集合通信基元(如 Allreduce)结合。本文利用 Mesh-TensorFlow 实现了Transformer序列到序列模型的另一个高效版本，该版本数据并行、模型也并行。作者们利用 512 个内核的 TPU 网格，训练具有多达 50 亿个参数的Transformer模型，效果超越了 WMT'14 英语-法语翻译任务和 10 亿字语言建模基准的当前最优结果。

同步数据并行算法伪代码如下