智能论文笔记

UI Layers Group Detector: Grouping UI Layers via Text Fusion and Box Attention

Shuhong Xiao , Tingting Zhou , Yunnong Chen , Dengming Zhang , Liuqing Chen , Lingyun Sun , Shiyu Yue

分类：计算机视觉

2022-12-07

Graphic User Interface (GUI) is facing great demand with the popularization and prosperity of mobile apps. Automatic UI code generation from UI design draft dramatically simplifies the development process. However, the nesting layer structure in the design draft affects the quality and usability of the generated code. Few existing GUI automated techniques detect and group the nested layers to improve the accessibility of generated code. In this paper, we proposed our UI Layers Group Detector as a vision-based method that automatically detects images (i.e., basic shapes and visual elements) and text layers that present the same semantic meanings. We propose two plug-in components, text fusion and box attention, that utilize text information from design drafts as a priori information for group localization. We construct a large-scale UI dataset for training and testing, and present a data augmentation approach to boost the detection performance. The experiment shows that the proposed method achieves a decent accuracy regarding layers grouping.

translated by 谷歌翻译

CPnP: Consistent Pose Estimator for Perspective-n-Point Problem with Bias Elimination

Guangyang Zeng , Shiyu Chen , Biqiang Mu , Guodong Shi , Junfeng Wu

分类：计算机视觉 | 机器人

2022-09-13

在计算机视觉和摄影测量协会中，Perspective-N-Point（PNP）问题已被广泛研究。随着功能提取技术的开发，单镜头可能会提供大量功能点。有望设计一个一致的估计器，即，随着点的数量增加，估计值可以收敛到真实的摄像头姿势。为此，我们提出了一个一致的PNP求解器，称为\ emph {cpnp}，并消除了偏差。具体而言，线性方程是通过原始投影模型通过测量模型修改和可变消除构建的，基于该模型，基于该模型的最小二乘解决方案。然后，我们分析并减去该溶液的渐近偏置，从而产生一致的估计值。此外，执行高斯 - 纽顿（GN）迭代以完善一致的解决方案。我们提出的估计器在计算方面有效 - 它具有$ O（n）$计算复杂性。关于合成数据和真实图像的实验测试表明，就估计精度和计算时间而言，我们提出的估计量优于一些具有密集视觉特征的图像的知名图像。

translated by 谷歌翻译

Learned Distributed Image Compression with Multi-Scale Patch Matching in Feature Domai

Yujun Huang , Bin Chen , Shiyu Qin , Jiawei Li , Yaowei Wang , Tao Dai , Shu-Tao Xia

分类：计算机视觉

2022-09-06

除了在经典图像压缩编解码器上实现较高的压缩效率外，还可以通过其他侧面信息（例如，从同一场景的不同角度）改进深层图像压缩。为了更好地利用分布式压缩方案下的侧面信息，现有方法（Ayzik和Avidan 2020）仅在图像域上实现匹配的补丁，以解决由查看点差异引起的视差问题。但是，在图像域上匹配的补丁匹配对由不同的视角引起的比例，形状和照明的差异并不强大，也无法充分利用侧面信息图像的丰富纹理信息。为了解决此问题，我们建议在分布式图像压缩模型的解码器上充分利用多尺度特征域贴片匹配（MSFDPM）。具体而言，MSFDPM由侧面信息特征提取器，多尺度特征域补丁匹配模块和多尺度特征融合网络组成。此外，我们重复使用从浅层层进行斑点相关性，以加速深层的贴片匹配。最后，我们认为，与图像域（Ayzik和Avidan 2020）的贴片匹配方法相比，在多尺度特征域中的匹配进一步提高了压缩率约20％。

translated by 谷歌翻译

DGPO: Discovering Multiple Strategies with Diversity-Guided Policy Optimization

Wenze Chen , Shiyu Huang , Yuan Chiang , Ting Chen , Jun Zhu

分类：机器学习 | 人工智能

2022-07-12

最新专为加强学习任务而设计的算法着重于找到一个最佳解决方案。但是，在许多实际应用中，重要的是开发具有多种策略的合理代理商。在本文中，我们提出了多样性引导的政策优化（DGPO），这是一个在同一任务中发现多种策略的政策框架。我们的算法使用多样性目标来指导潜在的条件政策，以在单个培训程序中学习一系列不同的策略。具体而言，我们将算法形式化为多样性受限的优化问题和外部奖励约束优化问题的组合。我们将约束优化作为概率推理任务解决，并使用策略迭代来最大化派生的下限。实验结果表明，我们的方法有效地在各种强化学习任务中找到了各种策略。我们进一步表明，与其他基线相比，DGPO达到了更高的多样性评分，并且具有相似的样品复杂性和性能。

translated by 谷歌翻译

TENET: Transformer Encoding Network for Effective Temporal Flow on Motion Prediction

Yuting Wang , Hangning Zhou , Zhigang Zhang , Chen Feng , Huadong Lin , Chaofei Gao , Yizhi Tang , Zhenting Zhao , Shiyu Zhang , Jie Guo

分类：计算机视觉 | 人工智能

2022-06-30

该技术报告提出了一种有效的自动驾驶运动预测方法。我们开发了一种基于变压器的方法，用于输入编码和轨迹预测。此外，我们提出了时间流动头来增强轨迹编码。最后，使用了有效的K均值集合方法。使用我们的变压器网络和集合方法，我们以1.90的最新Brier-Minfde得分赢得了Argoverse 2 Motion预测挑战的第一名。

translated by 谷歌翻译

Queried Unlabeled Data Improves and Robustifies Class-Incremental Learning

Tianlong Chen , Sijia Liu , Shiyu Chang , Lisa Amini , Zhangyang Wang

分类：机器学习 | 人工智能

2022-06-15

班级学习（CIL）遭受了学习新添加的课程和保留先前学习的课堂知识之间臭名昭著的困境。通过存储重播的历史数据可以减轻灾难性的遗忘问题，这会导致内存开销以及预测更新。为了解决这一难题，我们建议在持续学习中利用“免费”外部未标记的数据查询。我们首先提出了一个带有查询的未标记数据（CIL-QUD）方案的CIL，其中我们仅存储一些过去的训练样本作为锚点，并每次都使用它们来查询相关的未标记示例。除了新的和过去存储的数据外，通过学习 - 验证（LWF）正规化器和班级平衡培训，有效地利用了查询未标记的未标记。除了保留对过去和当前任务的模型概括外，我们下一步研究CIL-QUD的对抗性鲁棒性问题。受到未标记的数据学习强大模型的成功启发，我们探索了一种新的鲁棒性感知的CIL设置，在此设置中，随着新任务不断出现，学习的对手鲁棒性必须抵制遗忘并被转移。尽管现有的选项很容易失败，但我们显示了查询的未标记数据可以继续受益，并无缝将CIL-QUD扩展到其可靠的版本RCIL-QUD中。广泛的实验表明，与以前的最新CIL方法相比，CIL-QUD在CIFAR-10和CIFAR-100上实现了可观的准确性。此外，Rcil-Qud确立了鲁棒性意识CIL的第一个强大里程碑。代码可在https://github.com/vita-group/cil-qud中找到。

translated by 谷歌翻译

Linearity Grafting: Relaxed Neuron Pruning Helps Certifiable Robustness

Tianlong Chen , Huan Zhang , Zhenyu Zhang , Shiyu Chang , Sijia Liu , Pin-Yu Chen , Zhangyang Wang

分类：机器学习 | 人工智能

2022-06-15

可认证的鲁棒性是在安全至关重要的情况下采用深层神经网络（DNN）的高度理想的属性，但通常需要建立乏味的计算。主要障碍在于大型DNN中的大量非线性。为了权衡DNN表现力（要求更多的非线性）和鲁棒性认证可伸缩性（更喜欢线性性），我们提出了一种新颖的解决方案来通过“授予”适当的线性水平来策略性地操纵神经元。我们建议的核心是首先将无关紧要的依赖神经元线性化，以消除既有用于DNN性能的多余的非线性组件，又对其认证有害。然后，我们优化替换线性激活的相关斜率和截距，以恢复模型性能，同时保持认证性。因此，典型的神经元修剪可以被视为一种特殊情况，即授予固定零斜率和截距的线性功能，这可能过于限制网络灵活性并牺牲其性能。在多个数据集和网络骨架上进行的广泛实验表明，我们的线性嫁接可以有效地收紧认证界限；（2）在没有认证的鲁棒培训的情况下实现竞争性认证的鲁棒性（即CIFAR-10型号的30％改进）；（3）将完整的验证扩展到具有17m参数的大型对抗训练的模型。代码可在https://github.com/vita-group/linearity-grafting上找到。

translated by 谷歌翻译

Data-Efficient Double-Win Lottery Tickets from Robust Pre-training

Tianlong Chen , Zhenyu Zhang , Sijia Liu , Yang Zhang , Shiyu Chang , Zhangyang Wang

分类：机器学习 | 人工智能

2022-06-09

预训练是在各种下游任务上转移学习的广泛采用的起点。对彩票假说（LTH）的最新研究表明，这种巨大的预训练模型可以用极稀疏的子网（又称匹配子网络）代替，而无需牺牲可传递性。但是，实际的安全 - 重要应用程序通常在标准转移之外提出了更具挑战性的要求，这也要求这些子网克服对抗性脆弱性。在本文中，我们制定了一个更严格的概念，双赢彩票，其中预训练模型的位置可以在各种下游任务上独立传输，以在两个标准下达到相同的标准和可靠的概括正如完整的预培训模型可以做到的那样，对抗性训练制度。我们全面检查了各种训练机制，发现强大的预训练倾向于制作出更少的双赢彩票，其性能优于标准对应物。例如，在下游CIFAR-10/100数据集上，我们识别出具有标准的，快速的对抗性和对抗性预训练的双赢匹配子网，以89.26％/73.79％，89.26％/79.03％和91.41％的匹配培训。 /83.22%稀疏。此外，我们观察到获得的双赢彩票票可以在实用数据限制（例如1％和10％）下游方案下传输的数据效率更高。我们的结果表明，彩票票务方案以及数据限制的转移设置可以扩大稳健的预训练的好处。代码可在https://github.com/vita-group/double-win-lth上找到。

translated by 谷歌翻译

TAFA: Design Automation of Analog Mixed-Signal FIR Filters Using Time Approximation Architecture

Shiyu Su , Qiaochu Zhang , Juzheng Liu , Mohsen Hassanpourghadi , Rezwan Rasul , Mike Shuo-Wei Chen

分类：机器学习

2021-12-15

由于数字电路的成熟CAD支持，一种数字有限脉冲响应（FIR）滤波器设计是完全可合成的。相反，模拟混合信号（AMS）滤波器设计主要是手动过程，包括架构选择，原理图设计和布局。这项工作提出了一种系统设计方法，可以使用没有任何可调谐无源组件的时间近似架构自动化AMS FIR滤波器设计，例如开关电容器或电阻器。它不仅提高了过滤器的灵活性，而且还促进了模拟复杂性降低的设计自动化。所提出的设计流程具有混合近似方案，根据时间量化效果自动优化过滤器的脉冲响应，这表明了具有最小设计者在循环中的努力的显着性能改进。另外，基于人工神经网络（ANN）的布局感知回归模型与基于梯度的搜索算法结合使用，用于自动化和加快滤波器设计。通过拟议的框架，我们展示了在65nm过程中快速合成了来自规范到布局的过程中的AMS FIR滤波器。

translated by 谷歌翻译

Analog/Mixed-Signal Circuit Synthesis Enabled by the Advancements of Circuit Architectures and Machine Learning Algorithms

Shiyu Su , Qiaochu Zhang , Mohsen Hassanpourghadi , Juzheng Liu , Rezwan A Rasul , Mike Shuo-Wei Chen

分类：机器学习

2021-12-15

由于技术缩放和更高的灵活性/可重构性需求，模拟混合信号（AMS）电路架构已经发展到更加数字友好。同时，由于优化电路尺寸，布局和验证复杂AMS电路的必要性，AMS电路的设计复杂性和成本基本上增加。另一方面，在过去十年中，机器学习（ML）算法受到指数增长，并由电子设计自动化（EDA）社区积极利用。本文将确定这一趋势所带来的机遇和挑战，并概述了几个新兴AMS设计方法，这些方法是最近的AMS电路架构和机器学习算法的演变。具体而言，我们将专注于使用基于神经网络的代理模型来加快电路设计参数搜索和布局迭代。最后，我们将展示从规范到硅原型的若干AMS电路实例的快速合成，具有显着降低的人为干预。

translated by 谷歌翻译