机器翻译的问题(科技爱好者周刊)
这里记录每周值得分享的科技内容,周五发布。
本杂志开源(GitHub: ruanyf/weekly[1]),欢迎提交 issue,投稿或推荐科技内容。
周刊讨论区的帖子《谁在招人?》[2],提供大量程序员就业信息,欢迎访问或发布工作/实习岗位。
封面图
曼谷市内最肮脏的一条水道 Klong Ong Ang,经过5年的努力,终于变清了。两岸布置了绿植和灯光,游客可以划独木舟,这条曾经的臭水沟成了吸引人的景点。(via[3])
本周话题:机器翻译是对译者的侮辱吗?上个月,豆瓣网有一条新闻[4]。北京语言大学的一个研究生,对乌拉圭小说《休战》的中译本打了差评。
“机翻痕迹严重,糟蹋了原作。还是老话,没有金刚钻别揽瓷器活。希望出版社找西班牙语科班出身的译者,翻译这些名家。”
译者看见了这条评论,非常生气,你凭什么说我像机器翻译!
“作为译者,愿意虚心接受来自所有人的意见。但是,逐字逐句认真翻译反复修改的书稿被说“机翻痕迹严重“,感觉挺糟心的。我觉得这和“翻译不好”不是一个概念,近乎人身攻击了。"
这本来是小事一桩,但是译者的好友打抱不平,向北京语言大学写举报信,声称该校学生对译者和出版社进行恶意攻击。学校收信后,出面让学生写了书面道歉。这下犯了众怒,网友蜂拥而至,为该书打“一星”。最终,豆瓣网不得不关闭了此书的评论和打分功能。
使用行政力量,压制正常的文艺批评,令人不齿。但是,今天我不想谈这个,而是想谈谈南桥老师[5]提出的一个有趣的观点:机器翻译很难接受吗?
"为什么被说是机器翻译,译者会觉得反感?难道翻译一定要逐字逐句人肉翻译吗?"
这个问题提得好。 很多人内心里面,把“机器翻译”等同于“劣质翻译”。但是,这种想法已经过时了。
现在的机器翻译强大得很,跟人工翻译的差距越来越小。英译中,人工翻译还有一点优势;但是中译英,真的不妨交给电脑吧。再过几年,如果有人说,你的翻译像机器翻译,很可能是一种表扬。这就好比,你的围棋水平被说成是软件水平,那就是世界冠军了。
我的想法是,拥抱机器翻译,尽量多使用。它是一种工具,能够提高生产力,为什么不多用呢。网上那么多英语信息,你看原文,看得过来吗?更好的方法是用机器翻译,先看一下中文。
各大浏览器现在全都内置了机器翻译,以 Edge 浏览器为例,打开英文网页时,会自动弹出一个对话框,询问是否需要翻译成中文。
我建议勾选“始终翻译英语网页”,以后只要打开英语网页,就会默认翻译成中文。这样阅读英语文章,极大提高速度,你的信息量将成倍增长。就算有时翻译得语句不通,但足以了解大意,如果觉得有必要精读,再查看英语原文。
此外,Gmail 网页端也内置了“邮件翻译”功能,这个也很有用。
回到翻译书籍,我认为合理的流程是,先让机器翻译一遍原著,译者再修改机器译稿。这样起码节约了打字的时间和精力。未来也许就没有“译者”这个称谓了,只有“机器翻译校对”。
Vite TypeScript 深度实践周刊与培训机构合作,每周介绍一门课程。通常,介绍的都是基础性课程, 本周尝试介绍一门前沿课程,内容很新,很多公司都在尝试,需要一定的前端基础。那就是 Vue.js 官方新推出的开发工具 Vite[6]。
Vite 到底是什么?一些资深的开发者都不太了解。这也难怪,它只有一年的历史,两个月前刚发布了稳定版 2.0。
简单说,Vite 是 Vue.js 项目的开发服务器,提供了快速打包能力,用来替换掉 Webpack。大家知道,Webpack 的最大痛点除了配置复杂,就是打包速度非常慢。有些大型项目,喝一杯咖啡回来,都没打包完;开发阶段哪怕只是修改一行代码,热更新(HMR)重新打包有时也要好几秒甚至更久。
Vite 就是为了解决这个问题而设计的,利用浏览器原生的 ES6 模块的加载能力,跳过 Webpack 打包,为开发阶段提供“快如闪电”(官方文档用语)的加载速度。它的 Logo 就是一道闪电。
本周的课程介绍 Vite 的用法, 深度实践 Vite TypeScript,带你真正理解 Vue3 的开发与应用。因为 Vite 是 Vue.js 的官方产品,以后的最佳实践应该就是用它来开发 Vue 项目。了解和学会这一套新做法,不仅有助于前端技术水平的快速进阶,也有助于先人一步掌握 Vue3.0 如何在企业项目中落地,为面试和工作助一臂之力。
报名成功的同学,还会再送一份价值294元的课程资料《TypeScript 高级教程》。
科技动态1、海水淡化暖房[8]
一个英国团队在非洲索马里兰海边,建成了大型海水淡化暖房。完全不用电,只使用阳光,进行海水淡化。
暖房里面有四个大型的金属制成的蒸发墙,放入海水以后,在干热的沙漠风吹拂之下,海水迅速蒸发,水蒸汽在蒸发墙上冷凝,形成淡水。同时,蒸发后的海水变成海盐,可以单独出售。
2、人脸识别破解术[9]
上海警方破获一起虚开增值税发票案,犯罪嫌疑人通过破解“人脸识别”,注册虚假公司开假发票。他们先以30元每个的价格,收购他人的高清头像照片和身份证信息,然后使用“活照片” App 让照片“动起来”,生成包括点头、摇头、眨眼、张嘴等动作视频。
有了视频,下一步使用特殊处理的手机‘劫持’摄像头,在人脸认证环节时,手机摄像头不会启动,系统获取的是之前做好的视频。系统会认为是本人在摄像头前,最后会通过认证。
据犯罪嫌疑人交代,他们已经破解了大量含有“人脸识别”环节的 App,其中不乏许多用户量巨大的App。每单的破解价格从25元到300元不等。
3、月球方舟[10]
美国亚利桑那大学的科学家提出“月球方舟”的设想,将地球上670万物种的种子、孢子、精子和卵子,冷冻储存后送到月球保存,以防物种灭绝。
具体做法是,利用月球地表下熔岩形成的空洞,建设坑道,将冷冻容器放在里面。月球地表已经有三、四十亿年没有改变过,比起现在位于北极的世界种子库要安全得多,地球的风险实在太大。
4、谷歌甲骨文诉讼的终审[11]
2005年,谷歌收购了安卓系统,准备将 Java 语言用于安卓开发。由于授权费没有谈拢,最后选择自己实现 Java 虚拟机,没有用官方实现,但是外部 API 保持不变。这样一来,开发者正常编写的 Java 代码不用修改,就可以在安卓上面运行。
2010年,甲骨文公司获得 Java 语言所有权之后,起诉谷歌侵权。双方争议的焦点是,软件的 API 是否具有版权,即谷歌沿用 Java 的 API,是否造成侵权?业界对这个诉讼非常关注,如果法庭判决侵权成立,以后就很难做服务的兼容层,因为未经许可不能提供跟他人一模一样的 API 了。
这个案件经历了多轮审判,2018年法院判决甲骨文胜诉,谷歌上诉至美国最高法院。2021年4月5日,最高法院以6票赞成、2票反对,裁决谷歌对 Java API 属于合理使用,不构成侵权。
5、一句话消息
埃及国家博物馆[12]搬迁新馆,政府举办了一个盛大晚会。浩浩荡荡的游行队伍将18具古埃及法老和4具皇后的木乃伊,以国王的规格,护送到新馆。这些木乃伊距今已经有3000多年。
GitHub[13]代码提交统计的 3D 模型,前一段时间开放了官方下载,网友已经收到了实物。官方的 3D 打印价格很贵,大家可以下载 stl 文件,去国内的网店打印。
奢侈品牌 Gucci[14]发布了首款数字虚拟运动鞋:Gucci Virtual 25,售价人民币78元。买来后,只能在线上世界穿。目前, Gucci App、VR 社交平台 VR Chat、游戏平台 Roblox 支持该鞋。
中科院[15]研究显示,北半球的夏季平均从78天增加到95天,而春季、秋季、冬季都变短了。
文章1、加油站扫码支付的风险[16](中文)
政府提示,在加油机旁边扫码付款有重大风险,手机发射的功率可能引发射频火花。这样说的话,那里也不应该手机上网。
2、如何救助一只雪豹[17](中文)
青海野生动物救护中心的副主任讲述,救助一只迷路雪豹的全过程。
3、大数据可视化工具[18](英文)
现在前端的图表库很多,作者推荐了几个他觉得最好的库,逐一进行了介绍。
4、Git 邮件工作流[19](英文)
多人项目现在一般使用 Pull Request 进行合作,但是 Linux 内核项目使用的是电子邮件工作流,本文介绍具体怎么做。电子邮件发送 Patch 其实也很方便。
5、React D3.js 如何开发 SVG 图形[20](英文)
本文是一篇详细教程,讲解如何在 React 里面引入 D3,开发 SVG 动画。
6、八进制数字造成的安全漏洞[21](英文)
本文分析 node.js 库 netmask 的一个安全漏洞的由来。如果黑客输入0177.0.0.1
,netmask 会认为这是一个公网地址,但实际上是内网地址。
7、什么是二分法搜索?[22](英文)
通过示例,详细讲解二分法搜索的入门教程。
8、如何创建 SVG 网格布局和动画[23](英文)
本文是一篇详细教程,一步步教大家怎么在 SVG 图形里面,创建网格布局,并且添加图像的动画效果。
工具1、xeuledoc[24]
一个命令行工具,用于获取谷歌文档的各种元信息。
2、kill-sticky[25]
一个 Bookmarklet 书签脚本,用于消除网页上的粘性页眉或页脚。
3、I don't care about cookies[26]
浏览器插件,用来消除网页上的各种 Cookie 许可的提示层。
4、Sorted CSS Colors[27]
CSS 标准一共列出了148种有名称的颜色,这个在线工具用来在它们当中找到合适的颜色。你在色轴上面确定一个基色,相近的颜色就会按照从浅到深的顺序列出。
5、Nyxt[28]
一个带有命令行的浏览器,可以完全不用鼠标,只通过命令行浏览网页。
6、Charts.css[29]
一个只使用 CSS 的图形库(不需要 JS),可以把<table>
标签变成折线图、直方图或其他图形。
7、Manim[30]
一个用来生成数学动画视频(比如绘制函数)的 Python 库。
8、React PIN Field[31]
一个 React 组件,生成漂亮的密码(验证码)输入框。
9、FocalBoard[32]
一个桌面的看板软件,类似 Trello,可以用来管理待办事项。
10、Workflow[33]
搜狗的 C 服务器引擎,支持各种后端协议,可以在它的基础上进行 C 开发,定制自己的高性能服务器。(@holmes1412[34]投稿)
资源1、Visu Algo[35]
该网站有各种常用算法的可视化演示。(@CIPHER-D[36]投稿)
2、.new
域名[37]
.new
域名是谷歌托管的,提供了一个打开网络服务的快捷方式,下面是一些例子。
•doc.new
:新建一篇谷歌文档•sheet.new
:新建一个谷歌表格•js.new
:新建一个 CodeSandbox 的代码片段•github.new
:新建一个 GitHub 仓库
标题网址是谷歌官方的.new
域名汇总。
3、文本编辑器比较[38]
文本编辑器是程序员的必备工具,这里比较了十几个常见编辑器的性能,包括内存占用、文件打开时间、正则搜索速度、大文件支持等方面。
4、Emoji Tracker[39]
这个网页按照推特的使用数量,对表情符号 Emoji 进行排序,最常用的放在最前面。可以用它查找哪些 Emoji 是经常使用的。
5、Go 实用教程[40](Practical Go Lessons)
一本很不错的 Go 语言的英文教程,从零讲起。
图片1、复杂的 C [41]
C 是一门复杂的语言,但是语言设计者还在往里面添加更多的东西。
•C 98版:879页•C 11版:1324页•C 14版:1368页•C 17版:1586页•C 20版:1834页
C 17 比 C 98 多了近80%的内容,而最新版 C 20 比 C 98 多了近1000页。开发者可能会抱怨复杂性的增加,很难掌握所有的内容,但是除了接受,并没有其他办法。
2、加尔松潟湖大桥[42]
加尔松潟湖大桥是乌拉圭的一座环状桥梁,于2015年通车。
它的环状设计主要出于美观考量,但也有一些实际的好处,比如强迫司机只能减速行驶,同时可以为行人设置单行道,不同方向的行人走不同的半圆,提高了安全性。
文摘1、时间是如何浪费掉的?[43]
作者:Paul Graham
几天前,我意识到了一件令人惊讶的事情:浪费时间的最危险方法不是花时间在玩,而是花时间在做假工作。
当你花时间玩乐时,你会知道自己在放纵。内心的警报很快就会发出。如果某天早晨我醒来后,整天坐在沙发上看电视,我很快会觉得自己一定是做错了什么。这样一想,就让人不舒服。你只需要在沙发上看电视2个小时,就会有这种不舒服的反应,更不用说整天看电视了。
但是,还有一些天,你整天都在忙,等到晚上你问自己今天干了什么,回答是:虽然很忙,做的却没什么意义。
你的感觉也会因此不好,但是不像整天看电视那样糟糕。如果我整天看电视,我会觉得自己正在走向灭亡,但如果是忙忙碌碌做无意义的事情,这样的警报就不会响起。因为我所做的事情表面上看起来像是真正的工作,比如处理电子邮件。
表面上看,你一天都在办公桌前工作,但其实你也是在浪费时间,因为这不会让你的生活发生真正的变化。而且由于你的内心不会发出警报,比起看电视,假工作才是浪费时间最危险的方法。
时间要用来做对你真正重要的事情,不要落入假工作的陷阱。
言论1、
为了提炼出一个清晰的观点,我需要充足的睡眠、贪婪地阅读、修炼者一样地冥想、不跟任何人解释我在干嘛。
-- 纳西姆·塔莱布(Nassim Taleb),畅销书《黑天鹅》的作者
2、
写作过程分为两个阶段:发散和收敛。在发散阶段,你自由地探索新想法;在收敛阶段,你变得专注,将想法尽量简化,以便将其发布。我最喜欢的一句写作格言:收集点,然后连接点。
-- David Perell
3、
金钱杀死了黑客团体,加密货币的兴起是最后一击。有些黑客团队通过入侵比特币交易所而成为亿万富翁,那些声称自己不在乎钱的黑客几乎毫无例外地都是孩子,或者只是假装自己不在乎。
-- Hacker News 读者[44]
4、
我希望 Deno 和 node.js 可以合并,就像以前 io.js 和 node.js 的合并。但是,这次应该很难发生,io.js 属于分叉,而 Deno 更像生态系统的重启。
-- Hacker News 读者[45]
5、
大学的建立是为了培养学生进行智力探索,但是现在,大学越来越转向职业培训,这根本不是建立大学的原始目的。
-- David Perell[46]
历史上的本周2020年(第 102 期):工作热情从何而来?
2019年(第 50 期):"时间换收入"是一个陷阱
References
[1]
ruanyf/weekly:https://github.com/ruanyf/weekly
[2]
《谁在招人?》:https://github.com/ruanyf/weekly/issues/1709
[3]
via:https://www.instagram.com/p/CMrCYC6H9zS/
[4]
新闻:https://www.sohu.com/a/458133742_260616
[5]
南桥老师:https://www.thepaper.cn/newsDetail_forward_11996536
[6]
Vite:https://vitejs.dev/
[7]
京程一灯:https://www.yidengxuetang.com/
[8]
海水淡化暖房:https://seawatergreenhouse.com/construction-blog/2017/11/7/construction-completed
[9]
人脸识别破解术:http://www.xinhuanet.com/2021-03/30/c_1127270651.htm
[10]
月球方舟:https://www.cbsnews.com/news/scientists-335-million-seed-sperm-egg-samples-moon-noahs-ark/
[11]
谷歌甲骨文诉讼的终审:https://www.bbc.com/zhongwen/simp/business-56646181
[12]
埃及国家博物馆:https://www.axios.com/egypt-ancient-mummies-parade-cairo-photos-88c44bf7-becb-410c-9e7e-3ed09fdcbdaf.html
[13]
GitHub:https://daniel.haxx.se/blog/2021/03/23/github-steel/
[14]
奢侈品牌 Gucci:https://www.ifanr.com/1407755
[15]
中科院:https://finance.sina.cn/7x24/2021-03-24/detail-ikknscsk0329255.d.html
[16]
加油站扫码支付的风险:http://www.xinhuanet.com/fortune/2021-03/24/c_1127247305.htm
[17]
如何救助一只雪豹:https://user.guancha.cn/main/content?id=482248
[18]
大数据可视化工具:https://itnext.io/visualization-tools-for-big-data-c3361241a67e
[19]
Git 邮件工作流:https://blog.brixit.nl/git-email-flow-versus-github-flow/
[20]
React D3.js 如何开发 SVG 图形:https://wattenberger.com/blog/react-and-d3
[21]
八进制数字造成的安全漏洞:https://sick.codes/universal-netmask-npm-package-used-by-270000-projects-vulnerable-to-octal-input-data-server-side-request-forgery-remote-file-inclusion-local-file-inclusion-and-more-cve-2021-28918/
[22]
什么是二分法搜索?:https://jorgechavez.dev/2020/08/22/everything-you-need-to-know-about-binary-search-algorithm/
[23]
如何创建 SVG 网格布局和动画:https://www.cassie.codes/posts/swipey-image-grids/
[24]
xeuledoc:https://github.com/Malfrats/xeuledoc
[25]
kill-sticky:https://github.com/t-mart/kill-sticky
[26]
I don't care about cookies:https://www.i-dont-care-about-cookies.eu/
[27]
Sorted CSS Colors:https://github.com/scriptype/sorted-colors
[28]
Nyxt:https://nyxt.atlas.engineer/
[29]
Charts.css:https://chartscss.org/
[30]
Manim:https://github.com/ManimCommunity/manim/
[31]
React PIN Field:https://github.com/soywod/react-pin-field
[32]
FocalBoard:https://www.focalboard.com/
[33]
Workflow:https://github.com/sogou/workflow
[34]
@holmes1412:https://github.com/ruanyf/weekly/issues/1712
[35]
Visu Algo:https://visualgo.net/
[36]
@CIPHER-D:https://github.com/ruanyf/weekly/issues/1710
[37]
.new
域名:https://whats.new/shortcuts
[38]
文本编辑器比较:https://github.com/jhallen/joes-sandbox/tree/master/editor-perf
[39]
Emoji Tracker:http://emojitracker.com/
[40]
Go 实用教程:https://www.practical-go-lessons.com/
[41]
复杂的 C :https://www.cppstories.com/2017/02/how-to-stay-sane-with-modern-c/
[42]
加尔松潟湖大桥:https://zh.wikipedia.org/wiki/加爾松潟湖大橋
[43]
时间是如何浪费掉的?:http://paulgraham.com/selfindulgence.html
[44]
Hacker News 读者:https://news.ycombinator.com/item?id=26498998
[45]
Hacker News 读者:https://news.ycombinator.com/item?id=26620578
[46]
David Perell:https://twitter.com/david_perell/status/1376378046752653313
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com