无平行文本照样破解密码怎么设置 无平行文本照样破解密码
Root 编译整理
量子位 出品 | 公众号 QbitAI
有一位97年的少年,本科期间就进了微软、谷歌大脑实习。
不仅如此,他还参与了去年刷屏级论文Attention is All You Need的和One Model to Learn Them All的研究工作。
他,就是Aidan N. Gomez。
2月3号,Gomez作为一作和他在谷歌大脑的导师Kaiser往2018ICLR投的论文Unsupervised Cipher Cracking Using Discrete GANs被正式接收。
这篇论文介绍了非监督破译密码的模型CipherGAN,经非配对的明文密文训练后,可以高保真地破译凯撒移位密码或维吉尼亚密码。
加密 pk 解密简单介绍一下移位密码和维吉尼亚密码。
最早的加密方法,是公元前58年,凯撒出于军事需要发明的移位密码。
通过把明文的字母往右移三位,可得到外人看了不知所言的密文。
但这个加密方法保密性一般,只要破译的人用穷举法,就可以知道偏移量了。
好在,那时候的人没什么文化,移位密码在军事上用了好几个世纪。
表中左边三列是CipherGAN的表现,表右边两列是以往模型的表现。
可以看出来,在解密三种词量长度(10,200,58)的密文时,CipherGAN解密移位密码的表现近乎完美(100%,98.7%,99.8%)。
当密文有200个单词时:
1)CipherGAN破解移位加密的正确率可达到98.7%,是以往模型的两倍(44.5%);
2)维吉尼亚加密的密文以往模型的正确率完全不行,给了密钥才勉强能达到44.3%,而CipherGAN的正确率可达到75.7%。可以看出来CipherGAN比较擅长破译长词级密钥的密文。
该模型是基于图像风格转换模型CycleGAN(加我们自己的链接)作的修改,破译表现远高于以往频率分析的模型。
针对CipherGAN可以使用非平行文本作输入的特点,Gomez在接受Newsweek外媒采访的时候,也提到了,“密码破译的模型思路也能迁移到非监督学习的翻译上。”
因为语言翻译常面临的难题是,缺乏足够的平行语料。
正好和非配对明文密文的密码破译过程很相似。
Gomez希望Facebook和Google这种量级的巨头公司可以继续这个课题,把CipherGAN用在提高机器翻译水平上。
“我们提出的算法,对任何两种文本信息都是通用的。不一定非要纯文本或者暗号,也可以是英语和法语。”Gomez说。
OMT破解密码模型工作的,是整个for.ai研究团队。一共5个小伙子,都是多伦多大学计算机系的学生。
Gomez文章开头介绍过就不多说了。
左一是还在念大三的Sheldon Huang,创办了多伦多大学机器智能学生社团UTMIST,是UTMIST主席。
左二是已经休学的Ivan Zhang,曾在Ranomics工作了两年,加入For.ai将近1年。
右二是Muhammad Osama,今年Gomez一起拿到了荣誉学士学位,于18年6月毕业。
最右边的是香港小伙子Bryan Li,曾在华为香港和AMD实习过。
最后,附论文地址,
https://arxiv.org/abs/1801.04883
及高质的同行评议,
https://openreview.net/forum?id=BkeqO7x0-
及开源代码的地址,
https://github.com/for-ai/CipherGAN
For.ai团队的官网
https://For.ai
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com