网站排名软件有哪些wordpress 禁止下载

张小明 2026/3/12 6:58:25
网站排名软件有哪些,wordpress 禁止下载,门户网站制作价格表,姐姐直播tv从GAN到WGAN-GP#xff1a;生成对抗网络的进化之路与实战详解 在深度学习的生成模型领域#xff0c;GAN (Generative Adversarial Networks) 无疑是最耀眼的明星之一。从2014年 Ian Goodfellow 提出 GAN 至今#xff0c;它已经经历了无数次的迭代和进化。其中#xff0c;WG…从GAN到WGAN-GP生成对抗网络的进化之路与实战详解在深度学习的生成模型领域GAN (Generative Adversarial Networks)无疑是最耀眼的明星之一。从2014年 Ian Goodfellow 提出 GAN 至今它已经经历了无数次的迭代和进化。其中WGAN和WGAN-GP是两次里程碑式的改进它们从数学原理上解决了原始 GAN 训练不稳定、模式崩塌等“顽疾”。本文将深入浅出地梳理从 GAN 到 WGAN 再到 WGAN-GP 的演进逻辑分析它们背后的数学直觉并提供核心代码实现。一、GAN天才的博弈1.1 基本原理GAN 的灵感来源于博弈论。它由两个网络组成生成器 (Generator, G)负责制造“假钞”生成数据。它的目标是生成尽可能逼真的数据以骗过判别器。判别器 (Discriminator, D)负责充当“验钞机”。它的目标是尽可能准确地分辨出输入数据是真实的来自数据集还是假的由 G 生成。两者的目标函数是一个Min-Max 博弈min ⁡ G max ⁡ D V ( D , G ) E x ∼ P d a t a ( x ) [ log ⁡ D ( x ) ] E z ∼ P z ( z ) [ log ⁡ ( 1 − D ( G ( z ) ) ) ] \min_G \max_D V(D, G) \mathbb{E}_{x \sim P_{data}(x)} [\log D(x)] \mathbb{E}_{z \sim P_{z}(z)} [\log (1 - D(G(z)))]Gmin​Dmax​V(D,G)Ex∼Pdata​(x)​[logD(x)]Ez∼Pz​(z)​[log(1−D(G(z)))]1.2 GAN 的阿喀琉斯之踵虽然 GAN 的思想非常精妙但在实际训练中研究者们发现它非常难训练主要面临以下问题训练不稳定G 和 D 需要小心翼翼地平衡。如果 D 太强G 的梯度会消失如果 D 太弱G 又学不到东西。模式崩塌 (Mode Collapse)G 发现生成某一种特定的样本特别容易骗过 D于是它就只生成这一种样本失去了多样性。无法指示训练进程GAN 的 Loss 值通常震荡剧烈无法像监督学习那样通过 Loss 下降来判断模型是否变好。根本原因原始 GAN 等价于在该小 JS 散度 (Jensen-Shannon Divergence)。当真实分布P r P_rPr​和生成分布P g P_gPg​重叠很少甚至不重叠时在高维空间中这很常见JS 散度是常数导致梯度消失G 无法获得有效的更新方向。二、WGAN推土机距离的救赎为了解决 GAN 的问题2017年 Arjovsky 等人提出了Wasserstein GAN (WGAN)。2.1 核心思想Wasserstein 距离WGAN 引入了Wasserstein 距离也称 Earth-Mover DistanceEM 距离推土机距离。简单来说如果把两个分布看作是两堆土EM 距离就是把一堆土搬到另一堆土的位置所消耗的最小“功”质量 $ imes$ 距离。优势即使两个分布完全不重叠Wasserstein 距离仍然能提供平滑的梯度指引 G 慢慢向真实分布靠拢。这彻底解决了梯度消失的问题。2.2 WGAN 的改进点为了近似计算 Wasserstein 距离WGAN 做了以下改动判别器变身“评论家” (Critic)D 的最后一层去掉 Sigmoid不再输出概率而是输出一个实数值评分。Loss 改变L D E x ~ ∼ P g [ D ( x ~ ) ] − E x ∼ P r [ D ( x ) ] L_D \mathbb{E}_{\tilde{x} \sim P_g}[D(\tilde{x})] - \mathbb{E}_{x \sim P_r}[D(x)]LD​Ex~∼Pg​​[D(x~)]−Ex∼Pr​​[D(x)]L G − E x ~ ∼ P g [ D ( x ~ ) ] L_G -\mathbb{E}_{\tilde{x} \sim P_g}[D(\tilde{x})]LG​−Ex~∼Pg​​[D(x~)]注意不再取 log。权重剪枝 (Weight Clipping)为了满足 Wasserstein 距离成立的数学条件1-Lipschitz 连续性WGAN 强制将 Critic 的所有参数限制在[ − c , c ] [-c, c][−c,c]之间例如 c0.01。2.3 WGAN 的局限虽然 WGAN 解决了训练稳定性问题并且 Loss 值终于可以代表图像质量了但Weight Clipping过于简单粗暴它限制了 Critic 的表达能力。容易导致参数集中在截断边界-c 和 c不仅浪费了神经网络的拟合能力还可能引发梯度爆炸或消失。三、WGAN-GP梯度惩罚的优雅为了解决 Weight Clipping 的副作用Gulrajani 等人提出了WGAN-GP (WGAN with Gradient Penalty)。3.1 核心改进梯度惩罚WGAN-GP 依然沿用了 WGAN 的架构和 Loss但改变了实现 1-Lipschitz 约束的方法。它不再直接剪裁参数而是在 Critic 的 Loss 函数中增加了一个梯度惩罚项 (Gradient Penalty)。根据数学推导如果一个函数是 1-Lipschitz 的那么它的梯度范数应该在处处不超过 1。WGAN-GP 鼓励梯度的范数接近 1。3.2 Loss 函数详解新的 Critic Loss 如下L E x ~ ∼ P g [ D ( x ~ ) ] − E x ∼ P r [ D ( x ) ] ⏟ 原始 WGAN Loss λ E x ^ ∼ P x ^ [ ( ∣ ∣ ∇ x ^ D ( x ^ ) ∣ ∣ 2 − 1 ) 2 ] ⏟ Gradient Penalty L \underbrace{\mathbb{E}_{\tilde{x} \sim P_g}[D(\tilde{x})] - \mathbb{E}_{x \sim P_r}[D(x)]}_{\text{原始 WGAN Loss}} \lambda \underbrace{\mathbb{E}_{\hat{x} \sim P_{\hat{x}}}[(||\nabla_{\hat{x}} D(\hat{x})||_2 - 1)^2]}_{\text{Gradient Penalty}}L原始WGAN LossEx~∼Pg​​[D(x~)]−Ex∼Pr​​[D(x)]​​λGradient PenaltyEx^∼Px^​​[(∣∣∇x^​D(x^)∣∣2​−1)2]​​其中λ \lambdaλ是惩罚系数通常取 10。x ^ \hat{x}x^是采样点。我们在真实样本x xx和生成样本x ~ \tilde{x}x~之间随机插值采样x ^ ϵ x ( 1 − ϵ ) x ~ \hat{x} \epsilon x (1-\epsilon) \tilde{x}x^ϵx(1−ϵ)x~ϵ ∼ U [ 0 , 1 ] \epsilon \sim U[0, 1]ϵ∼U[0,1]。我们约束这些插值点上的梯度范数接近 1。四、PyTorch 核心代码实现下面是 WGAN-GP 核心部分的 PyTorch 实现代码。4.1 梯度惩罚计算函数importtorchimporttorch.nnasnnimporttorch.autogradasautograddefcompute_gradient_penalty(D,real_samples,fake_samples,device): 计算 WGAN-GP 的梯度惩罚项 # 1. 随机权重插值alphatorch.rand(real_samples.size(0),1,1,1).to(device)# 假设输入是图片 (N, C, H, W)需要根据维度调整 alpha 的形状interpolates(alpha*real_samples(1-alpha)*fake_samples).requires_grad_(True)# 2. 将插值样本输入判别器d_interpolatesD(interpolates)# 3. 计算判别器输出相对于插值样本的梯度faketorch.ones(real_samples.shape[0],1).to(device)gradientsautograd.grad(outputsd_interpolates,inputsinterpolates,grad_outputsfake,create_graphTrue,retain_graphTrue,only_inputsTrue,)[0]# 4. 计算梯度范数gradientsgradients.view(gradients.size(0),-1)gradient_penalty((gradients.norm(2,dim1)-1)**2).mean()returngradient_penalty4.2 训练循环示例# 超参数lambda_gp10n_critic5# 每训练 1 次 Generator训练 5 次 Critic# ... 初始化 DataLoader, Generator(G), Critic(D), Optimizers ...fori,(imgs,_)inenumerate(dataloader):real_imgsimgs.to(device)batch_sizereal_imgs.shape[0]# ---------------------# 训练 Critic (D)# ---------------------optimizer_D.zero_grad()# 生成假样本ztorch.randn(batch_size,latent_dim).to(device)fake_imgsG(z)# 计算 WGAN Loss# 注意为了使用 min 优化器我们将最大化问题转化为最小化负数real_validityD(real_imgs)fake_validityD(fake_imgs)# WGAN Loss: -E[D(x)] E[D(G(z))]d_loss-torch.mean(real_validity)torch.mean(fake_validity)# 计算梯度惩罚gradient_penaltycompute_gradient_penalty(D,real_imgs,fake_imgs.detach(),device)# 总 Lossd_lossd_losslambda_gp*gradient_penalty d_loss.backward()optimizer_D.step()# ---------------------# 训练 Generator (G)# ---------------------# 每 n_critic 步训练一次 Gifi%n_critic0:optimizer_G.zero_grad()# 重新生成假样本 (可选也可以复用上面的但为了计算图清晰通常重新生成)gen_imgsG(z)# G 的目标是让 D 给出的分数越高越好 (即最小化 -D(G(z)))g_loss-torch.mean(D(gen_imgs))g_loss.backward()optimizer_G.step()ifi%1000:print(f[Epoch{epoch}/{opt.n_epochs}] [Batch{i}/{len(dataloader)}] [D loss:{d_loss.item()}] [G loss:{g_loss.item()}])五、总结与建议特性GANWGANWGAN-GP判别器输出概率 [0, 1] (Sigmoid)实数评分 (无 Sigmoid)实数评分 (无 Sigmoid)Loss 函数JS 散度 (Log Loss)Wasserstein 距离 (均值差)Wasserstein 距离 梯度惩罚约束方法无Weight Clipping(参数截断)Gradient Penalty(梯度惩罚)训练稳定性差 (易模式崩塌)较好极好收敛速度快 (但不稳定)较慢适中实际使用建议如果你要处理新的生成任务首选 WGAN-GP。它几乎不需要繁琐的超参数调试就能稳定训练而且 Loss 曲线能真实反映图像质量的提升。虽然计算梯度惩罚会稍微增加一点训练时间但相比于原始 GAN 调参的痛苦这是非常值得的投入。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

网站切图是指什么高端网站建设kgu

第一章:多模态 Agent 的 Docker 网络隔离在构建多模态 Agent 系统时,确保各个服务模块(如语音识别、图像处理、自然语言理解等)之间的网络隔离至关重要。Docker 提供了灵活的网络模型,允许通过自定义网络实现容器间的逻…

张小明 2026/3/5 2:12:46 网站建设

51个人网站长沙的网站建设公司

近日,江苏省工业和信息化厅公示了2025年度第二批省级“专精特新”中小企业名单,苏州共营互联网科技有限公司(“大脑营行”为公司旗下品牌)成功通过认定,再次荣耀上榜,综合能力得到政府和行业的充分认可。“…

张小明 2026/3/5 2:36:26 网站建设

合肥网站建设怎么做织梦网站添加下载

还在为网络信号差无法追更小说而烦恼吗?fanqienovel-downloader这款强大的开源工具能够让你轻松将番茄小说平台上的精彩内容保存到本地,彻底告别网络依赖,实现真正的离线阅读自由!🚀 【免费下载链接】fanqienovel-down…

张小明 2026/3/5 2:12:51 网站建设

网站建设的一般流程是什么意思wordpress oss官方

12月12日,黑芝麻智能科技有限公司(以下简称“黑芝麻智能”)与深圳元戎启行科技有限公司(以下简称“元戎启行”)正式签署合作协议。双方在此次合作中将建立资本与业务的双重纽带,叠加各自在芯片技术与辅助驾…

张小明 2026/3/5 2:32:35 网站建设

网站建设经营范围哪里有网站建设

终成国际成立于2010年,总部位于青岛/上海双总部,业务覆盖全国200城市及海外20国家,是专业的人力资本解决方案服务商。集团以"共建卓越企业、提升人才价值"为使命,累计服务企业2000家、人才50万人次。拥有90专业团队、70…

张小明 2026/3/5 2:12:52 网站建设

华夏名网网站建设有网络但浏览器打不开网页

鼠鬚管输入法完整指南:快速安装与个性化配置 【免费下载链接】squirrel 项目地址: https://gitcode.com/gh_mirrors/squi/squirrel 鼠鬚管输入法是一款基于中州韵引擎的开源中文输入法,以其高度可定制性和优雅的设计深受用户喜爱。本指南将详细介…

张小明 2026/3/5 2:12:50 网站建设