论文阅读:AugGAN: Cross Domain Adaptation with GAN-based Data Augmentation

2023-09-22 10:45:36

Abstract

  • 基于GAN的图像转换方法存在两个缺陷:保留图像目标保持图像转换前后的一致性,这导致不能用它生成大量不同域的训练数据。
  • 论文提出了一种结构感知(Structure-aware)的图像转换网络(image-to-image translation network)。

Proposed Framework

  • 为了将图像正确地转换,我们需要编码信息包含:1)相互风格信息(Mutual style)2)结构信息
  • 在我们同时优化图像转化和语义分割的假设下,通过我们的参数共享策略,语义分割子任务作为图像转化的辅助正则化。
  • 框架具体过程可以参考上面的图示。
    在这里插入图片描述

结构感知编码和分割子任务

  • 文章认为通过训练分割子任务,可以将图像的结构化信息学习出来。

多任务网络的权重共享

  • 生成器解析网络之间共享权值,允许生成器充分利用上下文感知的特征向量。
  • 我们计算了两个网络反卷积层之间的差异,并以零矩阵为目标,通过均方误差将差建模为损失函数。给出了软分权损失函数的数学表达式:
    在这里插入图片描述

循环一致性

  • 循环一致性损失已被证明在防止网络在目标域内生成随机图像方面是相当有效的。
    在这里插入图片描述

对抗性学习

  • 网络包括两个生成对抗网络:
    在这里插入图片描述

实验

Synthetic Datasets

在这里插入图片描述

Reality Datasets

在这里插入图片描述

  • 从实验结果来看效果并不够好,但是这种学习方法还是值得借鉴的。

Reference

[1] Huang S W, Lin C T, Chen S P, et al. Auggan: Cross domain adaptation with gan-based data augmentation[C]//Proceedings of the European Conference on Computer Vision (ECCV). 2018: 718-731.

更多推荐

邓俊辉《数据结构》→ “2.6.5 二分查找(版本A)”之“成功查找长度”递推式推导

【问题描述】邓俊辉的《数据结构(C++语言版)(第3版)》(ISBN:9787302330646)中,开始于第48页的“2.6.5二分查找(版本A)”内容在第50页详述了“成功查找长度”的递推式,但此递推式乍一看令人费解。故为了说明问题,进行一些约定并详述如下:●既然是二分查找,所以给定的序列必定是有序的。●不失一般性

SmartNews 基于 Flink 的 Iceberg 实时数据湖实践

摘要:本文整理自SmartNews数据平台架构师ApacheIcebergContributor戢清雨,在FlinkForwardAsia2022实时湖仓专场的分享。本篇内容主要分为五个部分:SmartNews数据湖介绍基于Icebergv1格式的数据湖实践基于Flink实时更新的数据湖(Icebergv2)解决方案实

浅谈霍尔电流传感器在汽车电池管理系统中的应用

摘要:随着电动汽车和混合动力汽车的需求和产量正在增加,两种类型的车辆都需要高电流容量的电池来运行50kW或更高功率的电机,并且这些都使用高压系统。汽车电池管理系统中对于电流的测量检测需要隔离测量的方式,而霍尔电流传感器是隔离测量,所以霍尔电流传感器适用于该应用场景。关键词:电动汽车;混合动力汽车;电池管理系统;霍尔电流

Go语言基础-基础语法

前言:\textcolor{Green}{前言:}前言:💞这个专栏就专门来记录一下寒假参加的第五期字节跳动训练营💞从这个专栏里面可以迅速获得Go的知识本文主要是根据今天所学(链接放在了最后)总结记录的笔记。主要内容包括学习准备(环境安装等)以及go语言的基础语法总结,其中有一些自己的想法,如果大家想与我交流共同进步

贝叶斯神经网络 BBB 学习中遇到的一些问题

这里写目录标题贝叶斯公式模型概率的公式1/n形式的贝叶斯公式全概率公式全概率公式的积分形式后验推理后验预测分布posteriorpredictivedistributionKL散度平均场VIBayesbyBackprop代码重新参数化贝叶斯公式模型概率的公式一开始看了这个https://zhuanlan.zhihu.c

AI创作专家,免费的AI创作专家工具

AI创作专家是一种崭新的工具,它们利用先进的人工智能技术,帮助创作者和写手更轻松地应对创作挑战。这些工具不仅可以生成文字,还可以提供灵感、帮助构思和组织思路,使创作过程更加高效。147GPT批量文章生成工具​www.147seo.com/post/2801.html​编辑https://link.zhihu.com/?

天猫商品详情数据采集

天猫商品详情数据采集方法有很多种,可以从商品详情页采集,也可以从PC端的ajax采集,也可以从开放平台的API采集。不同的来源有不同的数据结构,可以收集的信息也不同。天猫开放平台的API目前申请淘客API权限相对容易,淘客权限API能够收集到的信息非常少。如果从网页或者ajax采集,就要考虑采集的频率,容易触发反采集机

数学建模熵权法中信息熵与信息熵冗余度的理解

具体步骤:数学建模——熵权法-腾讯云开发者社区-腾讯云(tencent.com)灵感来源:信息熵越大,信息量到底是越大还是越小?-骚动的白米饭的回答-知乎https://www.zhihu.com/question/274997106/answer/1055696026信息熵在第二篇博文中有比较好的案例解读。我们在做A

Lua学习笔记:在Visual Studio中调试Lua源码和打断点

前言本篇在讲什么调试Lua源码本篇需要什么对Lua语法有简单认知依赖VisualStudio工具本篇的特色具有全流程的图文教学重实践,轻理论,快速上手提供全流程的源码内容★提高阅读体验★👉♠一级标题👈👉♥二级标题👈👉♣三级标题👈👉♦四级标题👈目录♠前言♠新建C++控制台应用♠下载Lua源码♠引入Lua源

ChatGPT追祖寻宗:GPT-2论文要点解读

论文地址:LanguageModelsareUnsupervisedMultitaskLearners上篇:GPT-1论文要点解读在上篇:GPT-1论文要点解读中我们介绍了GPT1论文中的相关要点内容,其实自GPT模型诞生以来,其核心模型架构基本没有太大的改变,都是一路坚持奉行着基于Transformer的单解码器结构

触摸芯片在小功率音箱中的应用

音箱的基本组成部分包括扬声器单元和放大器。扬声器单元是产生声音的核心部件,而放大器则负责放大电信号,使其能够驱动扬声器单元。当我们使用音箱播放音乐时,音频信号首先通过音源设备(如音乐播放器、电视、电脑等)发送到音箱。这个音频信号是以电信号的形式存在的,无法直接被我们听到。喇叭的音质完全取决于喇叭本身的好坏,而不是功率,

热文推荐