知乎有什么缺点?

%%看不懂的别点感谢。

我来说说技术上的东西好了,LaTeX的缺点其实就是TeX的缺点,所以我说说底层的。

1. 不易于扩展的的eqtb结构

在TeX中,eqtb分别用来存储命令和primitive的数值。但是针对命令的那部分,其实算一个hash表。我们可以了解到有很多可扩展、动态的hash算法。但是这种算法要整合到TeX中的难度是相当大的。这也就限制了可定义的命令的数量,超过了就会溢出。目前Y&Y TeX的eqtb中可定义命令的数量大小为32000。

2. 让人不省心的分页算法

这里指的并不是操作系统里面的分页算法。而是指TeX中将vertical lists封装成一个page的过程。在这个过程中,关注点有两个:段落的处理和插图的处理。插图的处理是个难点,在TUG的上有明确的一些提示,我也看了相关的算法,但是距离实现还有相当长一段时间,我觉得在TeX Live 2016能看到就不错了。当然,不保证别的聪明人先我一步先做出来。

所谓更优的断行算法,其实已经在pdfTeX里面实现了。但是,问题是,这些个扩展并没有跟汉字断行处理相联系,这个在LuaTeX里面虽然可以hook,但是做起来太麻烦了,损失的性能会更多。pdfTeX虽然提供了更好的断行算法,本身却损失了一些性能。这部分涉及到的microtype还有不少可能使用自动化的处理的地方。但是这个我暂缓,要做的事太多了。

目前TeX中的hyphenation算法是基于pattern的,这也就意味着对某些语言是很难操作的,比如说德语这种复合词异常多的语言(虽然有SISISI扩展)。而使用了layout engine的引擎对于有特殊hyphenation操作的地方也不是支持的。这个地方我可以先放SISISI扩展的,对于使用layout engine,我暂时还没有想法。

5. 不统一的汉字处理机制

这个是老坑了,其实编码出来绝对不是问题,问题是如何让扩展更好控制。pTeX对于所有的汉字处理情况都会加入\kanjiskip,这就导致了在某些环境下的异常断行,比如抄录环境。汉字处理的两种机制:宏级别的(CCT/CJK/xeCJK/LuaTeX-ja),引擎级别的(NTT jTeX/pTeX/PUTeX/Y&Y TeX)。还有很多不如人意的地方,还需要在讨论不少地方的。这方面不是问题,需要时间了。

拿pdfTeX/LuaTeX来说,PDF输出是有一组函数构成的,但是和pdfTeX耦合度太大,几乎无法改动,最简单的,给PDF添加一个加密功能都很难做到。而拿XeTeX来说,需要使用xdvipdfmx来处理xdv文件来得到PDF输出,问题通常出在eps处理上,字体的cmap上。不过xdvipdfmx的优点还是要比pdfTeX要好不少的,在性能上是比pdfTeX高一些的(据开发者)。拿Y&Y TeX来说,第一个pdf后端是使用libharu(libhpdf)实现的,但是我现在做的第二个pdf后端是基于xdvipdfmx的(高度整合成库,最后会以单独的库出现)。我这个变动的原因:libharu的字体支持和字体管理功能太差劲了,xdvipdfmx对多方向排版的支持是最好的,而且还支持加密。

最小二乘不够稳健,很容易受极端异常点的影响,如果是少数异常,可以用异常点检测的方法剔除,但有时候异常点也很重要,需要考虑,这时候可以用一些稳健方法,具体方法可以搜索关键字“稳健回归”,找相关的文献看看。

这将导致最直观影响用户体验的一个问题,比如最广泛的网站访问:从不同运营商发起对同一IPv6网站的(v6单栈)访问:在互通的条件下,v6网站能正常访问打开,反之则无法访问。

这是某机构发布的《支撑中国IPv6规模部署—中国IPv6业务端到端贯通用户体验监测报告》”, 该报告中对于网站IPv6的支持测试结果分为三类:

可以看到,公众在使用IPv6访问互联网站点的结果,很大一部分受到运营商支持程度的影响

这里还有一个IPv6支持度的专题监测(双栈支持,如果使用IPv6访问可看到当前访问IP地址):

3、应用管理层面,这里可讨论的范围就更大了,前述答案提到了v6技术属性中的公网IP安全性隐患;这里主要想提出,目前业界(尤其是单位机构网络)对于全面启动v4/v6双栈网络甚至IPv6-only网络仍然存在着很多“观望”,用户本身的认知、运维管理技术水平、安全体系等等,除了两办”行动计划“要求的网站改造,仍然更多的场景适配要,比如”最后一公里“终端层,包括办公PC、物联网等,IPv6应用【外延】的扩大,势必会引入新的问题要应对。

关于IPv6的一个探讨:

我要回帖

更多关于 玄彬缺点知乎 的文章

 

随机推荐