wordcloud函数的用法（word-wrap解惑）

木屐声响 2023-06-04 06:26:02

wordcloud函数的用法（word-wrap解惑）(1)

源起

我们经常需要“修复”一个老生常谈的“bug”，那就是文本的自动换行问题。在专业术语上，这种期望得到的渲染现象被称作“word wrap”，即文本处理器有能力把超出页边的整个词自动传到下一行。

在现实项目中，尤其是在测试阶段，鉴于测试使用非常极端的测试用例，我们经常需要“修复”如图所示的这个问题：

wordcloud函数的用法（word-wrap解惑）(2)

长单词溢出

图中，极长的这个英文单词（虽然是生造的）为了保证完整的显示，无奈地超出了容器的限制，它溢出了。为了“修复”这个“问题”，使得无论东亚还是西欧文字都能被限定在容器的尺寸范围内，我们一般会加上诸如“word-wrap: break-word; word-break: break-all”这样的属性，令我们满意（好吧，其实是令测试满意）的结果如图所示：

wordcloud函数的用法（word-wrap解惑）(3)

长单词被强行断行

从以结果现象为导向的观点出发，这个“bug”被“修复”了，但是在做了三五次这样的重复工作后，我开始产生这样几个疑问：

word-wrap 和 word-break 究竟是什么？
为什么会乐此不疲地重复碰到这个问题？
这个问题是问题么？

规则

在解惑之前，有几个关乎问题本质的客观现实需要指出，因为这些“常识”最容易被人忽视：

CJK 文字和 !CJK 文字有各自的排版规则。

在这里，CJK 代表 Chinese, Japanese, and Korean，即东亚文字，!CJK 就是非东亚文字，大多数情况下是西欧文字。

在文字的呈现规则上，两者很不相同，CJK 文字中，一个字母就是一个字素（单词），独立成义，!CJK 文字中，一些字母组成一个字素，并且字素们由连接符“-”连接，或由空格“ ”分隔。

有关 CJK 文字更多的排版规则上，比较有代表性的是：对中文来说，标点符号不能成为行首（特殊除外）；双字长的标点符号（省略号、破折号）不能断开。
对于 !CJK，主要是：单词不能在中间不合法地断开（合法情况例如从连接符处断开）；标点符号不能成为行首（特殊除外）

解惑一

word-wrap 和 word-break 究竟是什么？对于这个问题，直接拜访 W3C 官方，找到 CSS3 草案：http://www.w3.org/TR/2010/WD-css3-text-20101005/，再访问微软，借鉴诸如 http://msdn.microsoft.com/en-us/library/ms531184(VS.85).aspx.aspx)

得出的结论如下：

word-wrap, line-break, word-break 这几个属性都是 MS 的独立实现，随后其他浏览器也不同程度地实现了其中的某些，之后，这几个属性都被吸纳为 CSS3 标准。在对文字排版的渲染上，微软还是走在前面的。

在现有的 CSS3 草案中，关乎到文字排版的几个重要属性有：white-space，text-wrap，word-wrap，line-break，word-break。

根据 CSS3 的描述，列出这些属性各自的要点，这部分读者可以跳过……

white-space 是 white-space-collapsing 和 text-wrap 的缩写

wordcloud函数的用法（word-wrap解惑）(4)

text-wrap 定义文本的自动换行效果

wordcloud函数的用法（word-wrap解惑）(5)

word-wrap 执行最激进的单词断行控制，从单词的内部断开以防止文本溢出容器并且完全适应容器的宽度
在 IE 的实际效果中，word-break 的效果要激进得多，它穷凶极恶地断开所有单词（如果到达边界的话）

wordcloud函数的用法（word-wrap解惑）(6)

line-break 是断行的规则，针对东亚文字
基本是针对日文的换行规则
word-break 是断行的规则，针对非东亚文字

wordcloud函数的用法（word-wrap解惑）(7)

做一个归纳：专门用于控制文本自动换行功能的属性是 text-wrap 和 word-wrap，而 line-break 和 word-break 用来控制断行和单词边界分隔，根据 W3C 的描述来说，word-wrap 是最激进的自动换行方式，可以强行断开单词。而现实情况是，word-break: break-all 的方式要更为激进，如图：

wordcloud函数的用法（word-wrap解惑）(8)

word-wrap

wordcloud函数的用法（word-wrap解惑）(9)

word-break

对比 word-wrap: break-word 和 word-break: break-all，两者都将文本限定在了容器的范围内，只是 break-all 将所有单词，不论长短地，通通截断，break-word 则非如此，它尽量地遵从了排版规则。

兼容性

由于几个属性都来自于微软（部分来自于 CSS3），那么理所当然 IE 是支持最良好的，不过对于浮动元素，IE 6/7 的表现会有些 bug（可在文后给出的 demo 中验证）。

至于其他浏览器，FF 3.6 不支持 word-break；Chrome 7 支持良好；Safari 5 同 Chrome；Opera 10 同 FF

解惑二三

碰到相关问题的场景大体是两个：

测试使用了很极端的测试用例（比如 asdfasdfasdfasdfasdfasdfasdf）
IE 6/7 下，在宽度不大的容器中使用了浮动元素，同时浮动元素内包含了长的串，如图：

wordcloud函数的用法（word-wrap解惑）(10)

IE 6/7 中浮动盒子杯具

对于场景一，使用 word-wrap: break-word。

对于场景二，使用 IE 6/7 的 hack，word-break: keep-all 或者用 inline-block 来代替浮动（IE 6/7 中，hasLayout 的 inline 盒子大体等同于 inline-block）。

回头看疑问二，我们为什么会乐此不疲地重复碰到这个问题？原则上，各个浏览器默认的文字排版方式已经很好地顾及了 CJK 文字和 !CJK 文字，根据各个语言自己的规则来呈现排版，不应该出现诡异的问题。所以，对于上面的两个问题场景，之所以产生场景一，是因为使用了极端的测试用例，但是在现实中，这种极长的英文单词是根本不存在的（特殊行业除外），又，即使英文单词较长，也不应该突兀地截断，这有违西欧文字的排版规则。所以我认为，如果在现实环境下发生场景一中的问题，责任应该在于版面的设计，比如容器宽度太小，而不是去截断文本；对于场景二，应该归咎于 IE 6/7 的渲染 bug，这时，使用 inline-block 代替，或用 word-break: keep-all 来给犯错的浏览器擦屁股。

实践方案

对于我们输出的内容（可控的），不使用任何 word-wrap 和 word-break 等属性，对于可能产生的长单词溢出这种小概率事件，首先考虑容器宽度是否合理，其次可以为长单词添加连字符“-”以便合理地断开，最后设置 overflow: hidden 避免视觉上的溢出。
对于用户输出的内容（不可控的），比如评论等，由于不排除用户会输入“dddddddddddd”这样没营养的垃圾数据，使用 word-wrap: break-word 来强行截断。

最后的观点

不能完全迁就测试用例，因为有时不合现实情理。
浏览器默认已经做得够好，强加诸如 break-all 这样的指令是不优雅的。
问题大多不在于实现，而在于设计（如容器太窄）。
对于 bug 浏览器使用 hack 即可，这是它们的错。

希望本文能帮助到您！

点赞转发，让更多的人也能看到这篇内容（收藏不点赞，都是耍流氓-_-）

关注｛我｝，享受文章首发体验！

每周重点攻克一个前端技术难点。更多精彩前端内容私信我回复“教程”

原文链接：https://fed.taobao.org/blog/2010/10/15/confused-about-word-wrap/

作者：法海

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

wordcloud函数的用法（word-wrap解惑）

猜您喜欢

梅艳芳无人能及的人生（梅艳芳有种种遗憾）

李嘉诚共卖了多少楼（接盘李嘉诚40亿写字楼的神秘阔太）

经典武侠电影徐克（徐克放弃武侠片）

洪金宝在电影中有手撕秋裤的画面（洪金宝不动一拳一脚）

李雪健流浪地球二原声台词（流浪地球2李雪健演讲好震撼）

青菜是绿色的为什么叫青菜（不是所有青菜都叫青菜）

云萍的个人资料（云萍上海青）

热门推荐

排行榜