word文档里1MB是1mb等于多少kb内存

而空的 txt 是0 kb。高中老师神秘地解释为美帝的阴谋论,求科普.== 更新问题,题主特意去下了2013的office,来给各位个准话==原题是建立在2007版本之上的。题主试了其他版本以及一些知友的评论:2007版本无论是doc或是docx是10kb2013版本无论doc或是docx是0kb 不过也有例外的,真就不清楚了想来真是神奇。。谢谢各位的科普回答!
这个东西叫模板。。。是真的模板。。后缀是dot,一般打开来的word是通用模板,当然,你也可以自己定义。
&p&你可以把 Word 文档的扩展名 .docx 修改为 .zip,然后就可以解压缩啦!&br&随后你就会发现,里面包含了一些比较基本的定义,例如 样式 定义(样式 是一种很方便的排版方法,具体用法你可以搜一下),像是 标题1 的字体是什么,字号有多大,颜色是什么之类的。&br&就算你的文档是“空的”,没有任何文本,还是会留下样式信息的。&br&与之对应,文本文件是 100% 纯天然文本,天然得除了你在 Windows 记事本 里面输入的文本以外,真的就没有什么了。所以如果你想知道一个文件里面究竟有些什么,那么,用记事本探索吧!&/p&&br&&p&Rev 1.0&/p&&p&新成就:获得了三个赞。额,谢谢大家!&/p&&p&刚刚下课,吃完盖浇饭,做做饭后运动什么的。&/p&&p&好的,我们来实践一下。&/p&&p&首先,打开 Microsoft Office Word,什么都不写,直接保存,然后你应该就可以拿到一个 12KB 的文件了。&/p&&p&&img src=&/702b8dca3577aad4ce5b184_b.jpg& data-rawheight=&71& data-rawwidth=&566& class=&origin_image zh-lightbox-thumb& width=&566& data-original=&/702b8dca3577aad4ce5b184_r.jpg&&然后修改扩展名(没看到后面的 .docx?请自行搜索如何显示扩展名。)(请选择性忽略 Images 文件夹,它跑错片场了。)&/p&&p&&img src=&/33ce3c0bada7cca463af42_b.jpg& data-rawheight=&92& data-rawwidth=&566& class=&origin_image zh-lightbox-thumb& width=&566& data-original=&/33ce3c0bada7cca463af42_r.jpg&&解压缩&/p&&p&&img src=&/c8b852db_b.jpg& data-rawheight=&184& data-rawwidth=&553& class=&origin_image zh-lightbox-thumb& width=&553& data-original=&/c8b852db_r.jpg&&然后直奔主题&/p&&p&&img src=&/3faf89353d17addf4e02dceac04e3b80_b.jpg& data-rawheight=&166& data-rawwidth=&617& class=&origin_image zh-lightbox-thumb& width=&617& data-original=&/3faf89353d17addf4e02dceac04e3b80_r.jpg&&看到了一些文件。所以说你发现了 docx 本质上其实就是一个 zip 压缩包,里面的文件和文件夹井井有条。实际上,不仅仅是 docx,还有 xlsx、pptx、vsdx 等等等等(msaccdb 除外),其实都可以用这种方法来探索的。用记事本打开其中一个文件试试&/p&&p&&img src=&/951a51aba3f92_b.jpg& data-rawheight=&312& data-rawwidth=&914& class=&origin_image zh-lightbox-thumb& width=&914& data-original=&/951a51aba3f92_r.jpg&&如果你想了解一下什么是XML,请自行搜索。我在这里只是想向大家分享一个探索和发现的过程。&/p&&p&所幸 IE 为我们提供了一种很便捷的浏览方式。我们打开 IE&/p&&p&&img src=&/9b5de582dde9243c35eca65600bb7edb_b.jpg& data-rawheight=&529& data-rawwidth=&1044& class=&origin_image zh-lightbox-thumb& width=&1044& data-original=&/9b5de582dde9243c35eca65600bb7edb_r.jpg&&然后把刚才的 XML 文件拖进去&/p&&p&&img src=&/c09ee71dbe_b.jpg& data-rawheight=&472& data-rawwidth=&1044& class=&origin_image zh-lightbox-thumb& width=&1044& data-original=&/c09ee71dbe_r.jpg&&然后……&/p&&p&&img src=&/6fdbe05ddeceadc2f1c5_b.jpg& data-rawheight=&414& data-rawwidth=&1192& class=&origin_image zh-lightbox-thumb& width=&1192& data-original=&/6fdbe05ddeceadc2f1c5_r.jpg&&是的!你可以更加清晰地了解这个文档的内容了。你还可以把上面的内容和刚才记事本里面的内容对比一下。&/p&&p&如果你有了解过 XML,会发现 XML 其实是一种很开放的描述性语言,也就是说,它和 汉语、英语、C++、Java 一样,都只是一个框架,之于你要在这个框架下面来表述什么东西,其实和语言无关,而是是需要一些&b&约定&/b&的。例如,如果你想知道对方晚饭吃的是什么,你可以问:&/p&&p&Q: 你晚上吃的啥?&/p&&p&A: 我吃的盖浇饭。&/p&&p&- 或 -&/p&&p&Q: What did you have for dinner tonight?&/p&&p&A: I had Gai Jiaofan.&/p&&p&而对于我们这里见到的这个 [Content_Types.xml],为什么会有这些 ContentType、PartName,而不是盖浇饭?请自行搜索 开放式打包约定[Open Packaging Conventions ,OPC]。&/p&&p&即使你不知道什么是 OPC ,这还是不妨碍你继续对眼前的这个 docx 继续进行探索。我们来打开 word 文件夹&/p&&img src=&/27a84f092af88ddecc47d_b.jpg& data-rawheight=&234& data-rawwidth=&612& class=&origin_image zh-lightbox-thumb& width=&612& data-original=&/27a84f092af88ddecc47d_r.jpg&&&br&&p&然后在 IE 中打开 document.xml&/p&&p&&img src=&/205db6b81c67a70cc150aeb_b.jpg& data-rawheight=&563& data-rawwidth=&1311& class=&origin_image zh-lightbox-thumb& width=&1311& data-original=&/205db6b81c67a70cc150aeb_r.jpg&&先不管前面密密麻麻的 xmlns,你可以看看这里&/p&&div class=&highlight&&&pre&&code class=&language-xml&&&span class=&nt&&&w:pgSz&/span& &span class=&na&&w:w=&/span&&span class=&s&&&11906&&/span& &span class=&na&&w:h=&/span&&span class=&s&&&16838&&/span&&span class=&nt&&/&&/span&
&span class=&nt&&&w:pgMar&/span& &span class=&na&&w:gutter=&/span&&span class=&s&&&0&&/span& &span class=&na&&w:footer=&/span&&span class=&s&&&992&&/span& &span class=&na&&w:header=&/span&&span class=&s&&&851&&/span& &span class=&na&&w:left=&/span&&span class=&s&&&1800&&/span& &span class=&na&&w:bottom=&/span&&span class=&s&&&1440&&/span& &span class=&na&&w:right=&/span&&span class=&s&&&1800&&/span& &span class=&na&&w:top=&/span&&span class=&s&&&1440&&/span&&span class=&nt&&/&&/span&
&/code&&/pre&&/div&&p&你可能已经猜到了,这里的各种神缩写&/p&&p&pg == page&/p&&p&Sz == Size&/p&&p&Mar == Margin&/p&&p&所以呢?这两行其实定义了页面的大小,还有页边距。&/p&&p&页面宽 11906,高 16838,&/p&&p&页面上边距 1440,下边距 1440,左边距 1800,右边距 1800,页眉顶端到纸的边界距离为 851,页脚底端到纸的下边界距离为 992。(如果你不知道什么是页眉和页脚,请自行搜索。顺便说一句,用起来很方便!)&/p&&p&不要问我为什么知道这些犄角旮旯,我也是现场查的MSDN ||-_-&/p&&p&[c.f. &a href=&///?target=https%3A///zh-cn/ee364425& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pgSz element [Word 2003 XML Reference]&i class=&icon-external&&&/i&&/a&]&/p&&p&[c.f. &a href=&///?target=https%3A///zh-cn/ee364422& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pgMar element [Word 2003 XML Reference]&i class=&icon-external&&&/i&&/a&]&/p&&p&是不是少了点儿什么?对,是单位。&/p&&p&这里使用到的单位是 缇(tí)[twip] 。绨的本义是一种颜色,我在这里摘录一小段字典原文&/p&&blockquote&&b&(3)&/b&同本义 [oranged
red]&br&缇,帛丹黄色。――《说文》&br&缇,赤也。――《广雅》&br&缇十重。――《后汉书·应劭传》。注:“赤色缯也。”&br&赤缇用羊。――《周礼·草人》。注:“縓色也。”&br&四曰缇齐。――《周礼·酒正》。注:“成而红赤。如今下酒也。”&br&为治斋宫河上,张缇降帷。――《史记·滑稽列传》&/blockquote&&p&所以我觉得“缇”的用来当长度单位的这种用法很有可能是微软根据 twip 的发音音译过来的。&/p&&p&微软计算机词典(奇怪……我怎么会有这么诡异的词库)中提到&/p&&blockquote&&p&&b&twip&/b&&/p&n. A unit of measure used in typesetting and
desktop publishing, equal to one-twentieth of a printer’s point, or 1/1440th of
an inch. See also &i&point1 (definition 1).&/i&&/blockquote&&p&也就是说,1 缇是 1/1440 英寸,差不多是 17.6389 微米的样子。&/p&&p&那我们不妨来换算一下,注意要把微米再换算成厘米。&/p&&p&也就是页面宽度为 21cm, 高度 29.7cm。&/p&&p&这就是一张标准 A4 纸的大小。它比 16开 作业本大一圈。&/p&&p&顺带一提,用过 Visual Basic 6.0 及其之下版本的筒子们应该都体会过在 缇 和 像素 之间相互转换的痛苦酸爽。好在除了 NCRE 考级以外,VB6 已经在我们的生活中渐行渐远了。&br&&/p&&p&好的,我们的探索之旅到这里差不多就要结束了。在结束之前,让我们打开 styles.xml&/p&&img src=&/feb27bf5403c8cab0af2f68_b.jpg& data-rawheight=&642& data-rawwidth=&1083& class=&origin_image zh-lightbox-thumb& width=&1083& data-original=&/feb27bf5403c8cab0af2f68_r.jpg&&&p&这些代码是什么意思?你可以在 MSDN 上慢慢地搜索……&/p&&p&顺带一提,“标题1”的英文就是“Heading 1”。&/p&&br&&p&如果这些尚不足以满足你的好奇心……其实,你可以把 .zip 改回 .docx,然后在文档里面输点儿东西,整点儿格式,插点儿图片,然后再改成 .zip 并重新解压。你也可以尝试着使用记事本(或者 Notepad++,这个很好用!)对其中的一些文件进行修改,再重新打包。再或者,你可以用相同的方法来处理 Excel 文档、PowerPoint 或者 Publisher 文档,开始一段属于你自己的探索之旅。&/p&&p&最后——我貌似忘记说了——Office 2007 及其以后版本的文档格式使用的都是这种开放式打包约定,而在此之前,Office 使用的文档类型(如 doc/xls/ppt)都是最一般的二进制形式。在手头没有任何资料的情况下,对这样的文档进行研究几乎是不可能的。 &a class=&member_mention& href=&///people/e19cd0a65cd76f0b9950& data-title=&@于拙& data-editable=&true& data-tip=&p$b$e19cd0a65cd76f0b9950& data-hash=&e19cd0a65cd76f0b9950&&@于拙&/a& 的答案中提供了一种使用 7-zip 来对二进制文档进行拆解的做法。如果你感兴趣的话,不妨一试~~&/p&&p&在十多年前,我们使用二进制的形式来保存文档,也许是出于应用程序作者最朴实的想法——把内存里面的内容原样倒腾到硬盘里面,也许是为了程序的性能考虑,也许是为了不让是竞争对手能够开发出一个功能类似,而且还能与自己的文档格式兼容的应用程序。但我们现在可以看到的是,开放的程序和开放的数据表示正在为我们提供着更多的便利。&/p&&blockquote&&ul&&li&Howard 是一位好奇的用户,他发现 2007 Office 版本中的新文件格式容器是一个 ZIP 文件。Howard 想亲自弄个明白,因此他使用 ZIP 应用程序打开在 Word 2007 中创建的一个文档。他发现有些文件看起来像 XML 文档内容,有些图像与他在原始文档中看见的内容相一致。好奇的 Howard 非常感兴趣,他在记事本中打开了其中一个 XML 文件,想看看 Word 究竟生成了什么样的 XML 文件。如此轻松地就看到了文档的内部结构,他感到非常满意,因此他将记事本和 ZIP 应用程序关闭,重新在 Word 中打开该文件以继续操作该文档。 &/li&&li&&p&Jan 需要在她的 Word 2007 文档中更改文档属性。她在 ZIP 产品中打开新格式的文件,提取包含文档属性的 XML 项目,进行更改,将项目添加回容器中,然后保存并关闭该容器。随后她在 Word 中打开该文档,发现所有的内容仍在原来的位置,唯一的变化就是她对属性所做的修改。 &/p&&/li&&li&&p&一家顾问公司改变了徽标以反映其新使命。其 IT 部门接到了这项改变徽标的任务,而这个徽标位于服务器中存储的上千个文档中。在以前版本的 Microsoft Office 中,需要逐一打开每个文档来删除旧的徽标并粘贴新的徽标,或者创建并测试一个复杂的自定义应用程序来自动完成这项任务。使用新的文件格式,IT 部门可以创建一个批处理,用于浏览文件结构以在媒体文件夹中找到图形(此图形在每个文档中都相同),并将其换成新的图形。现在,当文档打开时,新的徽标将自动出现。 &/p&&/li&&li&&p&法律公司必须保护他们的客户数据以及他们自己的数据的机密性。按照常规,公司知道文档(包括在 Word 中创建的文档)存储了多个属性,其中有些属性在文档中是可见的,而有些属性是隐藏的。这些属性中有些可能包含客户敏感信息和公司专有信息。经过试验和错误排查,公司创建了一个删除此信息的过程。但是,该过程很浪费时间,而且因为它要求用户完全按照该过程操作,容易出错。使用新的文件格式,IT 部门开发了一个简单的批处理,用于遍历文件夹结构以删除包中的目标部件。现在,公司可以确信所有的敏感信息和专有信息都已安全地从文档中删除了。 &/p&&/li&&li&&p&Denise 正在她的硕士论文中进行最后的更改。添加目录索引之后,她准备进行最后的保存。然而,令她非常震惊的是,保存过程很快停止,并显示了一条消息,告诉她文件看起来已被损坏。当 Denise 从震惊中平静下来后,她意识到自己使用了新的文件格式。她将文本导入到一个新文档中,重新附加图片并重新设置格式和样式部分,成功地重建了文档。然后,她保存了新的文档。 &/p&&/li&&li&&p&Elizabeth 是一位 Windows 2000 用户,她运行的是 Office 2000,而且安装了 2007 Office 版本中包含的转换器。她能够打开 Word XML 格式的文档。另外,由于转换器提供打开和保存支持,她还能够编辑文档并将其重新保存为新格式的文档。 &/p&&/li&&/ul&&p& [c.f. &a href=&///?target=https%3A///zh-cn/library/ms406049.aspx& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Microsoft Office (2007) Open XML &i class=&icon-external&&&/i&&/a&]&/p&&/blockquote&
你可以把 Word 文档的扩展名 .docx 修改为 .zip,然后就可以解压缩啦!随后你就会发现,里面包含了一些比较基本的定义,例如 样式 定义(样式 是一种很方便的排版方法,具体用法你可以搜一下),像是 标题1 的字体是什么,字号有多大,颜色是什么之类的。就…
因为它实际上不是空的,它里面至少包含了作者的名字啦、页面设置啦、字体等一系列的,你已经习以为常的东西。那些东西都是没有缺省值,所以全部都要存下来的。
因为它实际上不是空的,它里面至少包含了作者的名字啦、页面设置啦、字体等一系列的,你已经习以为常的东西。那些东西都是没有缺省值,所以全部都要存下来的。
已有帐号?
无法登录?
社交帐号登录80.07kb是多大?在word文档里,一个字占多大内存?_百度知道
80.07kb是多大?在word文档里,一个字占多大内存?
例如一首歌是8兆.07相当于一首歌的1&#47,80.07k很小的80
为您推荐:
其他1条回答
多大自己算吧
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁而空的 txt 是0 kb。高中老师神秘地解释为美帝的阴谋论,求科普.== 更新问题,题主特意去下了2013的office,来给各位个准话==原题是建立在2007版本之上的。题主试了其他版本以及一些知友的评论:2007版本无论是doc或是docx是10kb2013版本无论doc或是docx是0kb 不过也有例外的,真就不清楚了想来真是神奇。。谢谢各位的科普回答!
轮子哥说的没错。事实上,由于Microsoft Word文档(以下简称doc)采用的是类似于区块状的结构(Stream),我们可以用7-zip软件将之解压。因为我没有时间去查文档,所以只能大概猜测一下:因为我没有时间去查文档,所以只能大概猜测一下:WordDocument就是喜闻乐见的文件头和正文了Data还没确定Summary*应该是文件的一个概述0Table储存了一些用户信息所以说doc文件并不是只有正文内容,它还包含这些信息,因此即使正文内容为空,它依然要占用一定空间。---------这里是Microsoft的文档。
&p&你可以把 Word 文档的扩展名 .docx 修改为 .zip,然后就可以解压缩啦!&br&随后你就会发现,里面包含了一些比较基本的定义,例如 样式 定义(样式 是一种很方便的排版方法,具体用法你可以搜一下),像是 标题1 的字体是什么,字号有多大,颜色是什么之类的。&br&就算你的文档是“空的”,没有任何文本,还是会留下样式信息的。&br&与之对应,文本文件是 100% 纯天然文本,天然得除了你在 Windows 记事本 里面输入的文本以外,真的就没有什么了。所以如果你想知道一个文件里面究竟有些什么,那么,用记事本探索吧!&/p&&br&&p&Rev 1.0&/p&&p&新成就:获得了三个赞。额,谢谢大家!&/p&&p&刚刚下课,吃完盖浇饭,做做饭后运动什么的。&/p&&p&好的,我们来实践一下。&/p&&p&首先,打开 Microsoft Office Word,什么都不写,直接保存,然后你应该就可以拿到一个 12KB 的文件了。&/p&&p&&img src=&/702b8dca3577aad4ce5b184_b.jpg& data-rawheight=&71& data-rawwidth=&566& class=&origin_image zh-lightbox-thumb& width=&566& data-original=&/702b8dca3577aad4ce5b184_r.jpg&&然后修改扩展名(没看到后面的 .docx?请自行搜索如何显示扩展名。)(请选择性忽略 Images 文件夹,它跑错片场了。)&/p&&p&&img src=&/33ce3c0bada7cca463af42_b.jpg& data-rawheight=&92& data-rawwidth=&566& class=&origin_image zh-lightbox-thumb& width=&566& data-original=&/33ce3c0bada7cca463af42_r.jpg&&解压缩&/p&&p&&img src=&/c8b852db_b.jpg& data-rawheight=&184& data-rawwidth=&553& class=&origin_image zh-lightbox-thumb& width=&553& data-original=&/c8b852db_r.jpg&&然后直奔主题&/p&&p&&img src=&/3faf89353d17addf4e02dceac04e3b80_b.jpg& data-rawheight=&166& data-rawwidth=&617& class=&origin_image zh-lightbox-thumb& width=&617& data-original=&/3faf89353d17addf4e02dceac04e3b80_r.jpg&&看到了一些文件。所以说你发现了 docx 本质上其实就是一个 zip 压缩包,里面的文件和文件夹井井有条。实际上,不仅仅是 docx,还有 xlsx、pptx、vsdx 等等等等(msaccdb 除外),其实都可以用这种方法来探索的。用记事本打开其中一个文件试试&/p&&p&&img src=&/951a51aba3f92_b.jpg& data-rawheight=&312& data-rawwidth=&914& class=&origin_image zh-lightbox-thumb& width=&914& data-original=&/951a51aba3f92_r.jpg&&如果你想了解一下什么是XML,请自行搜索。我在这里只是想向大家分享一个探索和发现的过程。&/p&&p&所幸 IE 为我们提供了一种很便捷的浏览方式。我们打开 IE&/p&&p&&img src=&/9b5de582dde9243c35eca65600bb7edb_b.jpg& data-rawheight=&529& data-rawwidth=&1044& class=&origin_image zh-lightbox-thumb& width=&1044& data-original=&/9b5de582dde9243c35eca65600bb7edb_r.jpg&&然后把刚才的 XML 文件拖进去&/p&&p&&img src=&/c09ee71dbe_b.jpg& data-rawheight=&472& data-rawwidth=&1044& class=&origin_image zh-lightbox-thumb& width=&1044& data-original=&/c09ee71dbe_r.jpg&&然后……&/p&&p&&img src=&/6fdbe05ddeceadc2f1c5_b.jpg& data-rawheight=&414& data-rawwidth=&1192& class=&origin_image zh-lightbox-thumb& width=&1192& data-original=&/6fdbe05ddeceadc2f1c5_r.jpg&&是的!你可以更加清晰地了解这个文档的内容了。你还可以把上面的内容和刚才记事本里面的内容对比一下。&/p&&p&如果你有了解过 XML,会发现 XML 其实是一种很开放的描述性语言,也就是说,它和 汉语、英语、C++、Java 一样,都只是一个框架,之于你要在这个框架下面来表述什么东西,其实和语言无关,而是是需要一些&b&约定&/b&的。例如,如果你想知道对方晚饭吃的是什么,你可以问:&/p&&p&Q: 你晚上吃的啥?&/p&&p&A: 我吃的盖浇饭。&/p&&p&- 或 -&/p&&p&Q: What did you have for dinner tonight?&/p&&p&A: I had Gai Jiaofan.&/p&&p&而对于我们这里见到的这个 [Content_Types.xml],为什么会有这些 ContentType、PartName,而不是盖浇饭?请自行搜索 开放式打包约定[Open Packaging Conventions ,OPC]。&/p&&p&即使你不知道什么是 OPC ,这还是不妨碍你继续对眼前的这个 docx 继续进行探索。我们来打开 word 文件夹&/p&&img src=&/27a84f092af88ddecc47d_b.jpg& data-rawheight=&234& data-rawwidth=&612& class=&origin_image zh-lightbox-thumb& width=&612& data-original=&/27a84f092af88ddecc47d_r.jpg&&&br&&p&然后在 IE 中打开 document.xml&/p&&p&&img src=&/205db6b81c67a70cc150aeb_b.jpg& data-rawheight=&563& data-rawwidth=&1311& class=&origin_image zh-lightbox-thumb& width=&1311& data-original=&/205db6b81c67a70cc150aeb_r.jpg&&先不管前面密密麻麻的 xmlns,你可以看看这里&/p&&div class=&highlight&&&pre&&code class=&language-xml&&&span class=&nt&&&w:pgSz&/span& &span class=&na&&w:w=&/span&&span class=&s&&&11906&&/span& &span class=&na&&w:h=&/span&&span class=&s&&&16838&&/span&&span class=&nt&&/&&/span&
&span class=&nt&&&w:pgMar&/span& &span class=&na&&w:gutter=&/span&&span class=&s&&&0&&/span& &span class=&na&&w:footer=&/span&&span class=&s&&&992&&/span& &span class=&na&&w:header=&/span&&span class=&s&&&851&&/span& &span class=&na&&w:left=&/span&&span class=&s&&&1800&&/span& &span class=&na&&w:bottom=&/span&&span class=&s&&&1440&&/span& &span class=&na&&w:right=&/span&&span class=&s&&&1800&&/span& &span class=&na&&w:top=&/span&&span class=&s&&&1440&&/span&&span class=&nt&&/&&/span&
&/code&&/pre&&/div&&p&你可能已经猜到了,这里的各种神缩写&/p&&p&pg == page&/p&&p&Sz == Size&/p&&p&Mar == Margin&/p&&p&所以呢?这两行其实定义了页面的大小,还有页边距。&/p&&p&页面宽 11906,高 16838,&/p&&p&页面上边距 1440,下边距 1440,左边距 1800,右边距 1800,页眉顶端到纸的边界距离为 851,页脚底端到纸的下边界距离为 992。(如果你不知道什么是页眉和页脚,请自行搜索。顺便说一句,用起来很方便!)&/p&&p&不要问我为什么知道这些犄角旮旯,我也是现场查的MSDN ||-_-&/p&&p&[c.f. &a href=&///?target=https%3A///zh-cn/ee364425& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pgSz element [Word 2003 XML Reference]&i class=&icon-external&&&/i&&/a&]&/p&&p&[c.f. &a href=&///?target=https%3A///zh-cn/ee364422& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&pgMar element [Word 2003 XML Reference]&i class=&icon-external&&&/i&&/a&]&/p&&p&是不是少了点儿什么?对,是单位。&/p&&p&这里使用到的单位是 缇(tí)[twip] 。绨的本义是一种颜色,我在这里摘录一小段字典原文&/p&&blockquote&&b&(3)&/b&同本义 [oranged
red]&br&缇,帛丹黄色。――《说文》&br&缇,赤也。――《广雅》&br&缇十重。――《后汉书·应劭传》。注:“赤色缯也。”&br&赤缇用羊。――《周礼·草人》。注:“縓色也。”&br&四曰缇齐。――《周礼·酒正》。注:“成而红赤。如今下酒也。”&br&为治斋宫河上,张缇降帷。――《史记·滑稽列传》&/blockquote&&p&所以我觉得“缇”的用来当长度单位的这种用法很有可能是微软根据 twip 的发音音译过来的。&/p&&p&微软计算机词典(奇怪……我怎么会有这么诡异的词库)中提到&/p&&blockquote&&p&&b&twip&/b&&/p&n. A unit of measure used in typesetting and
desktop publishing, equal to one-twentieth of a printer’s point, or 1/1440th of
an inch. See also &i&point1 (definition 1).&/i&&/blockquote&&p&也就是说,1 缇是 1/1440 英寸,差不多是 17.6389 微米的样子。&/p&&p&那我们不妨来换算一下,注意要把微米再换算成厘米。&/p&&p&也就是页面宽度为 21cm, 高度 29.7cm。&/p&&p&这就是一张标准 A4 纸的大小。它比 16开 作业本大一圈。&/p&&p&顺带一提,用过 Visual Basic 6.0 及其之下版本的筒子们应该都体会过在 缇 和 像素 之间相互转换的痛苦酸爽。好在除了 NCRE 考级以外,VB6 已经在我们的生活中渐行渐远了。&br&&/p&&p&好的,我们的探索之旅到这里差不多就要结束了。在结束之前,让我们打开 styles.xml&/p&&img src=&/feb27bf5403c8cab0af2f68_b.jpg& data-rawheight=&642& data-rawwidth=&1083& class=&origin_image zh-lightbox-thumb& width=&1083& data-original=&/feb27bf5403c8cab0af2f68_r.jpg&&&p&这些代码是什么意思?你可以在 MSDN 上慢慢地搜索……&/p&&p&顺带一提,“标题1”的英文就是“Heading 1”。&/p&&br&&p&如果这些尚不足以满足你的好奇心……其实,你可以把 .zip 改回 .docx,然后在文档里面输点儿东西,整点儿格式,插点儿图片,然后再改成 .zip 并重新解压。你也可以尝试着使用记事本(或者 Notepad++,这个很好用!)对其中的一些文件进行修改,再重新打包。再或者,你可以用相同的方法来处理 Excel 文档、PowerPoint 或者 Publisher 文档,开始一段属于你自己的探索之旅。&/p&&p&最后——我貌似忘记说了——Office 2007 及其以后版本的文档格式使用的都是这种开放式打包约定,而在此之前,Office 使用的文档类型(如 doc/xls/ppt)都是最一般的二进制形式。在手头没有任何资料的情况下,对这样的文档进行研究几乎是不可能的。 &a class=&member_mention& href=&///people/e19cd0a65cd76f0b9950& data-title=&@于拙& data-editable=&true& data-tip=&p$b$e19cd0a65cd76f0b9950& data-hash=&e19cd0a65cd76f0b9950&&@于拙&/a& 的答案中提供了一种使用 7-zip 来对二进制文档进行拆解的做法。如果你感兴趣的话,不妨一试~~&/p&&p&在十多年前,我们使用二进制的形式来保存文档,也许是出于应用程序作者最朴实的想法——把内存里面的内容原样倒腾到硬盘里面,也许是为了程序的性能考虑,也许是为了不让是竞争对手能够开发出一个功能类似,而且还能与自己的文档格式兼容的应用程序。但我们现在可以看到的是,开放的程序和开放的数据表示正在为我们提供着更多的便利。&/p&&blockquote&&ul&&li&Howard 是一位好奇的用户,他发现 2007 Office 版本中的新文件格式容器是一个 ZIP 文件。Howard 想亲自弄个明白,因此他使用 ZIP 应用程序打开在 Word 2007 中创建的一个文档。他发现有些文件看起来像 XML 文档内容,有些图像与他在原始文档中看见的内容相一致。好奇的 Howard 非常感兴趣,他在记事本中打开了其中一个 XML 文件,想看看 Word 究竟生成了什么样的 XML 文件。如此轻松地就看到了文档的内部结构,他感到非常满意,因此他将记事本和 ZIP 应用程序关闭,重新在 Word 中打开该文件以继续操作该文档。 &/li&&li&&p&Jan 需要在她的 Word 2007 文档中更改文档属性。她在 ZIP 产品中打开新格式的文件,提取包含文档属性的 XML 项目,进行更改,将项目添加回容器中,然后保存并关闭该容器。随后她在 Word 中打开该文档,发现所有的内容仍在原来的位置,唯一的变化就是她对属性所做的修改。 &/p&&/li&&li&&p&一家顾问公司改变了徽标以反映其新使命。其 IT 部门接到了这项改变徽标的任务,而这个徽标位于服务器中存储的上千个文档中。在以前版本的 Microsoft Office 中,需要逐一打开每个文档来删除旧的徽标并粘贴新的徽标,或者创建并测试一个复杂的自定义应用程序来自动完成这项任务。使用新的文件格式,IT 部门可以创建一个批处理,用于浏览文件结构以在媒体文件夹中找到图形(此图形在每个文档中都相同),并将其换成新的图形。现在,当文档打开时,新的徽标将自动出现。 &/p&&/li&&li&&p&法律公司必须保护他们的客户数据以及他们自己的数据的机密性。按照常规,公司知道文档(包括在 Word 中创建的文档)存储了多个属性,其中有些属性在文档中是可见的,而有些属性是隐藏的。这些属性中有些可能包含客户敏感信息和公司专有信息。经过试验和错误排查,公司创建了一个删除此信息的过程。但是,该过程很浪费时间,而且因为它要求用户完全按照该过程操作,容易出错。使用新的文件格式,IT 部门开发了一个简单的批处理,用于遍历文件夹结构以删除包中的目标部件。现在,公司可以确信所有的敏感信息和专有信息都已安全地从文档中删除了。 &/p&&/li&&li&&p&Denise 正在她的硕士论文中进行最后的更改。添加目录索引之后,她准备进行最后的保存。然而,令她非常震惊的是,保存过程很快停止,并显示了一条消息,告诉她文件看起来已被损坏。当 Denise 从震惊中平静下来后,她意识到自己使用了新的文件格式。她将文本导入到一个新文档中,重新附加图片并重新设置格式和样式部分,成功地重建了文档。然后,她保存了新的文档。 &/p&&/li&&li&&p&Elizabeth 是一位 Windows 2000 用户,她运行的是 Office 2000,而且安装了 2007 Office 版本中包含的转换器。她能够打开 Word XML 格式的文档。另外,由于转换器提供打开和保存支持,她还能够编辑文档并将其重新保存为新格式的文档。 &/p&&/li&&/ul&&p& [c.f. &a href=&///?target=https%3A///zh-cn/library/ms406049.aspx& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Microsoft Office (2007) Open XML &i class=&icon-external&&&/i&&/a&]&/p&&/blockquote&
你可以把 Word 文档的扩展名 .docx 修改为 .zip,然后就可以解压缩啦!随后你就会发现,里面包含了一些比较基本的定义,例如 样式 定义(样式 是一种很方便的排版方法,具体用法你可以搜一下),像是 标题1 的字体是什么,字号有多大,颜色是什么之类的。就…
因为它实际上不是空的,它里面至少包含了作者的名字啦、页面设置啦、字体等一系列的,你已经习以为常的东西。那些东西都是没有缺省值,所以全部都要存下来的。
因为它实际上不是空的,它里面至少包含了作者的名字啦、页面设置啦、字体等一系列的,你已经习以为常的东西。那些东西都是没有缺省值,所以全部都要存下来的。
已有帐号?
无法登录?
社交帐号登录

我要回帖

更多关于 图片1mb等于多少kb 的文章

 

随机推荐