当前所在位置: 首页 > 生活常识 > 正文

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

2022-12-20 canyinms.com 【 字体:

今天跟大家聊聊 MAE,何恺明大神的新作。

我们先说下 MAE 的任务:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

简单讲:将图片随机遮挡然后复原

并且遮挡的比例,非常大超过整张图的 80%,我们直接看效果:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

第一列是遮挡图,第二列是修复结果,第三列是原图。

图片太多,可能看不清,我们单看一个:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

看这个遮挡的程度,表针、表盘几乎都看不见了。但是 MAE 依然能够修复出来:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

这个效果真的很惊艳!

甚至对于遮挡 95%面积的图片依然 work。

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

看左图,你能看出来被遮挡的是蘑菇吗??

MAE 却能轻松修复出来。

MAE

MAE 的意义不仅在这个修复遮挡,去掉 mask 本身。更在于为 CV 领域大一统的预训练模型提供了无限的想象。

做过 NLP 的小伙伴应该知道,在 NLP 任务中,Bert 已经一统江湖。各子任务(如翻译、生成、文本理解等)均可使用相同的无监督预训练模型。这保证了每个任务都能有非常不错的效果。

但在 CV 任务中,却各玩各的,分类任务有自己的无监督学习,检测任务有自己的无监督学习,每个 CV 领域的子任务,都有自己一套无监督学习,一直无法统一。

而 MAE 一出,可以想象大一统的 CV 无监督预训练模型的时代已不远矣。

可能这段话,一些刚入门的小伙伴看不太懂。

没关系,慢慢学。学了 Bert,你就明白这意味着什么了。MAE 就是类似 Bert 存在的东西,可以认为它就是 Bert 的一个 CV 版。

接下来简单讲解下 MAE。

Vit

讲解 MAE 之前不得不先说下 Vit。

红遍大江南北的 Vision Transformer,ViT。

领域内的小伙伴,或多或少都应该听说过。

它将 Transformer 应用到了 CV 上面,将整个图分为 16 * 16 的小方块,每个方块做成一个词,然后放进 Transformer 进行训练。

从 ViT 开始,CV 小伙伴们终于可以更优雅地使用 Transformer了。

MAE

MAE 结构设计得非常简单:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

将一张图随机打 Mask,未 Mask 部分输入给 Encoder 进行编码学习,这个 Encoder 就是 Vit,然后得到每个块的特征。

再将未 Mask 部分以及 Mask 部分全部输入给 Decoder 进行解码学习,最终目标是修复图片。

而 Decoder 就是一个轻量化的 Transformer。它的损失函数就是普通的 MSE。

所以说, MAE 的 Encoder 和 Decoder 结构不同,是非对称式的。Encoder 将输入编码为 latent representation,而 Decoder 将从 latent representation 重建原始信号。

更详细的细节大家可以直接看看论文:

https://arxiv.org/abs/2111.06377

算法测试

官方刚刚开源6天,就已经获得了1.5k+的 Star,关注度可见一斑。

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

项目地址:

https://github.com/facebookresearch/mae

项目提供了 Colab,如果你能登录,那么可以直接体验:

https://colab.research.google.com/github/facebookresearch/mae/blob/main/demo/mae_visualize.ipynb

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

如果不能登录,可以直接本地部署,作者提供了预训练模型。

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

一起看下我跑的效果:

电脑照片怎么去除马赛克看原图(去除图片遮挡的方法及工具)

这个修复效果,你打几分?

最后

MAE 可以用来生成不存在的内容,就像 GAN 一样。

很多小伙伴可能又有了一些“大胆”的想法,不过玩笑归玩笑,自己玩玩就好,大家还是要遵纪守法哦~

阅读全文
相关推荐

小米13配置参数详情

小米13配置参数详情
1、6.36英寸屏幕,E6OLED材质,1080P分辨率,120Hz刷新率。2、前置3200万像素,后置5000万徕卡主摄+1200万超广角+1000万长焦。3、4500mAh电池,67W有线和50W无线。

小米13屏幕多大尺寸

小米13屏幕多大尺寸
1、小米13采用6.36英寸E6直屏,高度约为152.8毫米,宽度约为71.5毫米,厚度约为7.98毫米(玻璃)和8.1毫米(纳米皮)。2、小米13正面为居中打孔直屏,搭配金属直立边框,配合其1.61毫米宽的超窄边,屏占比可达到93.3%。

视频比例怎么调整

视频比例怎么调整
1、打开手机中的【清爽视频编辑】,点击【视频编辑】,选中要调整比例的视频,点击【下一步】-【剪辑】。2、点击【裁切】,选择【比例】,调整完毕后点击右下角【对勾】即可。

QQ压缩文件怎么打开

QQ压缩文件怎么打开
1、打开手机【QQ】,打开好友发送【压缩文件】的窗口,下载压缩文件后选择【用其他应用打开】。2、选择【拷贝到iZip】,进入iZip,在【解压所有文件】的窗口,点击【好的】。3、即可解压QQ压缩文件。

微信怎么删除加入黑名单

微信怎么删除加入黑名单
1、打开手机【微信】,点击右下角的【我】,找到【设置】。2、进入设置页面后点击【隐私】,选择【通讯录黑名单】。3、在黑名单中选中需要删除的人,点击右上角的三个点,选择【删除】,最后确认【删除联系人】即可。

苹果超长截屏怎么弄的

苹果超长截屏怎么弄的
1、在苹果手机主界面同时按住电源键加上音量键进行截屏,截屏三次,完成后打开【天天P图】。2、进入首页后点击【故事拼图】,选择需要拼接的截屏图片,然后依次点击【开始拼图】-【拼接】。3、点击【下载】即可。

ppt怎么添加多个文本框

ppt怎么添加多个文本框
1、打开【PPT】,点击【新建幻灯片】-【空白幻灯片】。2、点击【插入】-【文本框】。3、选择文本框样式后在空白页上画出文本框,输入内容后选中文本框。4、按【ctrl和c】键复制,最后按【ctrl和v】键粘贴即可增加多个文本框。

钉钉直播互动面板在哪打开

钉钉直播互动面板在哪打开
1、打开【钉钉】,进入一个【钉钉群】,然后点击右下角的【加号】,选择【群直播】。2、设置【直播主题】,点击【开始直播】,开启直播后即可自动打开互动面板。

手机上怎么输平方2

手机上怎么输平方2
1、在输入文字界面点击空白处唤出手机输入法,长按左下角的小球,在弹出来的菜单中选择【讯飞】。2、点击左下角的【符】按钮,下滑左边的选项选择【数学】,点击输入【平方号】。3、再点击【123】按钮,输入数字【2】即可。

图片和视频如何同时发朋友圈

图片和视频如何同时发朋友圈
1、打开【微信】,依次点击【我】-【收藏】-【加号】。2、点击【相册】,选择图片和视频,点击【完成】。3、点一下右上角的【...】,选择【分享到朋友圈】,编辑好文字后,点击【发表】,即可将图片和视频同时发到朋友圈。
本文Tag