怎么把word转成markdown导出word

工具学习(10)
本文主要介绍在Ubuntu系统下面如何将 word 文件转换为 markdown 文件。
第一步:安装 unoconv 和 pandoc
sudo apt-get install unoconv pandoc
第二步:将 word 文件转换 html
unoconv -f html -o file.html file.docx
-f html:指定我们要转为 html 格式(format)
-o file.html:表示输出(output)的文件名为 file.html
file.docx:表示要转换的文件为 file.docx
第三步:将 html 转换为 markdown
pandoc -f html -t markdown -o file.md file.html
-f html:指定我们要从什么文件(from)转换
-t markdown:指定我们要转为 markdown 格式(to)
-o file.md:表示输出(output)的文件名为 file.md
file.html:表示要转换的文件为 file.html
第四步:将图片拷贝到 images 中
& & &转换出来后会有很多图片,需要将图片拷贝到 images 文件夹中, 然后再单独上传images中的文件到博客中,这样就可以把我们 Word文档分享到博客了,比如CSDN博客。
& & &本博客转载自 //convert_word_to_markdown,笔者针对以上方法进行了测试,实际的项目中也在使用,对原作者表示由衷的感谢。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:36178次
积分:1023
积分:1023
排名:千里之外
原创:64篇
转载:25篇
(13)(7)(2)(1)(4)(4)(2)(4)(3)(2)(9)(4)(2)(16)(17)markdown格式在日常中的使用及转化_Markdown-tools-and-resources | Docs | HiGrid.Net
markdown格式在日常中的使用及转化
Markdown 的目标是实现「易读易写」不过最需要强调的便是它的可读性。一份使用Markdown格式撰写的文件应该可以直接以纯文字发布,并且看起来不会像是由许多标签或是格式指令所构成。Markdown语法受到一些既有text-to-HTML格式的影响,包括Setext、atx、Textile、reStructuredText、Grutatext和EtText,然而最大灵感来源其实是纯文字的电子邮件格式:Markdown 不是想要取代 HTML,甚至也没有要和它相近,它的语法种类很少,只对应 HTML 标记的一小部分。嗨网在线 提供了 Markdown入门教程 和 Markdown语法说明,由于涉及的内容也较多,在此将常用的 MarkDown 功能列举,供参考。利用Pandoc转换markdown和HTML、LaTeX相关内容:利用Pandoc转换 markdown/reStructuredTex/textile/HTML/LaTeX
markdown格式在日常中的使用及转化
推荐markdown工具
MarkDownPad
其他常用markdown工具
Windows:, MEditor
Linux:ReText
Chrome插件:Made, Markdown Here
Sublime Text 2: 跨平台编辑器,可通过插件支持Markdown
Pandoc: 强大的文本编译工具,支持各种文档格式互转
Markdown是什么
Markdown 是一种轻量级标记语言,创始人为John Gruber和Aaron Swartz。它允许人们“使用易读易写的纯文本格式编写文档,然后转换成有效的XHTML(或者HTML)文档”。这种语言吸收了很多在电子邮件中已有的纯文本标记的特性。 [1]
简单一句话就是:用纯文本写作,同时用直观的轻量级标记来格式化文档。
为什么要使用纯文本创作
我的哲学是,任何基于字符的创作都应该是内容至上(除了书法)。这包括写小说,写
论文,或者是写代码。在创作过程中,尤其是前期创作中,任何格式都是一种多余。这
一点大家可以想像一下作家用纸笔写小说,纸上总不能高亮或者加粗吧?用内容说话才
为什么要用Markdown
windows下常用的编辑工具是word,mac上常用的编辑工具是page,linux上常用的编辑工具就是vim了,一份文章编辑完后为了要在不同平台中保存完整的模样时就必需同时准备多种文本格式的文件,这是多么痛苦的一件事。我们写作的初衷是为了写作呀,反而被这些格式烦恼。所以我们要用Markdown,它让你关注内容,格式怎么显示不是要你在写得时候关注的。而在写Markdown时你只需要用一个纯文本的方式进行,不用担心平台与格式的困扰。
MarkDown资源
Markdown项目主页:
Markdown语法说明(中文版):
什么是Pandoc
Markdown本身是为了方便输出到HTML格式的。可是后来大家不局限于只是生成HTML
网页,而Pandoc就是为了解决这种需要。通过Pandoc,原始的Markdown文本可以顺利
的转换成Word文档(.docx),OpenOffice文档(.odt),或者是TeX文档(.tex)等等等等。
MarkDownPad编辑器虽然可以转换为HTML文件,但是转换PDF等就需要升级专业版收费了.
当然,Pandoc Markdown不是万能的,表格、复杂公式、多国语言、上下标、交叉引用、图表对齐较多的场合,它并不适合。但是需要互动、实时展现、更快输出的场合,Pandoc Markdown等值得大力推荐。未来互联网会逼使写作趋简。需要更快发表、互动输出与交流的场合,也会越来越多。比如课堂作业、企业内部交流、个人博客。用它节省的时间是写作时比较关键的”创作时间”而非”排版时间”。
为什么Markdown+Pandoc的组合让我动心
轻量、简单易学、上手容易。
能够顺利转换成Word文档。毕竟周围的人用Word还是不少,能够顺利和他们分享文档
也是我的基本需求之一。这点Pandoc可以解决。
能够转成TeX文档。这个对我来说也是必须的,目前为止Markdown对数学和表格的支持
还是有些弱。Pandoc可以将支持表格和公式。
安装Pandoc
下载依赖环境安装程序
下载安装程序
如果需要输出pdf格式,还得下载安装程序
或者参考怎样安装Pandoc
使用Pandoc
pandoc - -version
查看命令帮助
pandoc - -help
可以看到pandoc主要支持的输入与输出格式:
Input formats:
native, json, markdown, markdown+lhs, rst, rst+lhs, docbook,
textile, html, latex, latex+lhs
Output formats: native, json, html, html5, html+lhs, html5+lhs, s5, slidy,
slideous, dzslides, docbook, opendocument, latex, latex+lhs,
beamer, beamer+lhs, context, texinfo, man, markdown,
markdown+lhs, plain, rst, rst+lhs, mediawiki, textile, rtf, org,
asciidoc, odt, docx, epub
看见没,markdown只是pandoc输入格式的一种,它支持更多其他输入格式文件。
上述语言的互转关系,可以看看作者制作的这份,从中可以看出Pandoc的强大。这年头,哲学系教授会写程序,还是Haskell,伤不起啊
-f 输入格式(如果没有制定格式,则根据后缀名判断,如果没后缀名,则默认为markdown)
-t 输输出格式(默认为html)
-o 如果没有的话(默认是STDOUT)
Pandoc格式转换命令
最简单转换为html命令:pandoc xxx.txt -o yyy.html
a: txt转换为html格式。这里—ascii可以避免转成utf-8编码,这样中文在浏览器上就不会乱码了。命令为
pandoc -f markdown -t html higrid.net.txt -o newfile.html
pandoc —ascii higrid.net.txt -o newfile.html
b: txt转为pdf格式。注意,为了正确转换中文文本,请修改模板文件,在模板文件第一行下方加入 \usepackage{ctex} 命令为
pandoc —latex-engine=xelatex yourfile.txt -o newfile.pdf
c: txt转换为doc格式。
pandoc yourfile.txt -o newfile.doc
md转换为与上面类似,只需将youfile.txt换成youfile.md。
提示:常用的MarkDown语法
1.分割线:
---------------------------------------
2.原始文件
保持原段落文字不变,可以选用&pre&我是文字等&/pre&元素
要添加代码或者原始文本XML等,只需要添加进来整体选中按下tab键即可,
或者每一行代码前都空出四个空格也行
保持html等原始标签:使用反引号“,反引号在键盘数字1键的旁边
I strongly recommend against using any &blink& tags.
I wish SmartyPants used named entities like &
instead of decimal-encoded entites like —.
或者使用特殊html标签的原型比如&对应&,&对应&等
每一行最后加上两个空格,接下来输出的就是换行
4.标题、引用
#表示这是一级标题
##表示这是二级标题(注意二级标题下会带一条横线)
###表示这是三级标题
###### 最小是六级标题
也可以这样表示大标题(注意写完这行下一行加上=表示大标题)
这样表示小标题(注意写完这行下一行加上-表示小标题)
>aaaaa 表示引用
> This is a blockquote.
> This is the second paragraph in the blockquote.
> ## This is an H2 in a blockquote
单个回车,视为空格。
连续回车,才能分段。
6.斜体、粗体
*这些文字显示为斜体*
**这些文字显示为粗体**
7.列表、嵌套列表
A.无序列表如下:
- 这是无序列表项目
- 这是无序列表项目
- 这是无序列表项目
[注]两个列表之间不能相邻,否则会解释为嵌套的列表
B.有序列表如下:
1. 这是有序列表项目
2. 这是有序列表项目
3. 这是有序列表项目
C.嵌套列表如下:
- 外层列表项目
+ 内层列表项目
+ 内层无序列表项目
+ 内层列表项目
- 外层列表项目
8.超链接、图片链接
自动链接格式:&/&
就是在链接两边加上&和>
自动链接:&&
文字链接格式:This is an [example link](/).
文字链接:[higrid markdown](http://higrid.net)
加上标题alt的文字链接:[example link](/ "With a Title").
图片链接格式:![alt text](/path/to/img.jpg "Title")
图片链接: ![这是一个Logo图像](http://higrid.net/logo.Gif)
索引链接:
[higrid markdown][1]
![这是一个Logo图像][2]
[1]:http://higrid.net
[2]:http://higrid.net/Logo.Gif
I get 10 times more traffic from [Google][1] than from
[Yahoo][2] or [MSN][3].
[1]: / "Google"
[2]: / "Yahoo Search"
[3]: / "MSN Search"
I start my morning with a cup of coffee and
[The New York Times][NY Times].
[ny times]: /
9.转义普通字符
markdown支持在字符前加上\对字符保持原型进行转义
\*literal asterisks\*
目前\支持在加在如下字符前可起到转义作用:
10.关于代码块和着色
1)Markdown 会用&pre& 和 &code&标签来把代码区块包起来,这种情况代码不会着色,在MarkDownDad可以预览出效果。
用法&pre&&code&代码&/code&&/pre&.
2)使用格式如下
代码贴在中间
注意上面的”`”符号是键盘数字1左边那个键敲出来的,并且是什么语言就写什么,我是java开所以在那开头的三个符号之后就跟上了java,当然可以将java换成c,python,ruby,go等,markdown会自动着色,但是在MarkDownDad编辑器中看不出来预览效果
实例如下:
public String callSGCCService(String operationName,String inputXML,String serviceName,String serverContextRoot)
StringBuilder result=
String endpoint = serverContextRoot+"/services/"+serviceN
Service service = new Service();// 创建一个服务(service)调用(call)
Call call = (Call)service.createCall();// 通过service创建call对象
call.setTargetEndpointAddress(new java.net.URL(endpoint));// 设置service所在URL
call.setOperationName(new QName("",operationName));
call.setUseSOAPAction(true);
String result1 = (String)call.invoke(new Object[] {inputXML});
System.out.println(result1);
result=new StringBuilder(result1);
result.append("@@@@@");
result.append(XMLUtil.getNodeTxtByNodeName(XMLUtil.strToXML(result1).getRootElement(), "URL"));
catch (Exception e)
System.err.println(e.toString());
return result.toString();
11.关于表格
A.关于表格的处理,网上有人说了这么一种方式:
从word或excel中复制表格
贴上复制的文字,然后按convert,就会得到这个表格的代码
以上这种做法生成的HTML代码粘贴到MarkDownPad的确能预览,方法可行,就是麻烦
B.我更倾向于另一种方式:
这种方式得到的结果虽然不是HTML代码,也不能在MarkDownPad预览,
但是提交到github上就是标准表格,这就是万能的
Tables Generator 支持四种格式:LaTeX、HTML、Markdown、TEXT,先在 Table > Set size 中设置表格大小,然后填充数据,设置格式,就能在页面下面找到生成的结果,将结果复制到md文件中即可
因为本文讲的是MarkDown,所以用这个啦
至于为什么markdown能够识别出来”##”为未标题,”—-“为横线,你可以看它的css:,看过之后你就明白啦O(∩_∩)O~
随机文章 Random Posts
分类 Categories
最新文章 New Posts在企业开发中一般还都使用Word撰写开发文档,但在开源界Markdown无疑是最流行的,不过Word过于复杂的效果与Markdown过于简陋的语法都不能很好地实现开发文档所要求的上手简单、格式统一、语义明确等特点。
他们的不是你的好如何学习Asciidoc?Enjoy!
_开发文档一般都由Word或Markdown(格式)撰写,前则多见于企业,后则在开源界很流行。但在实际使用中总觉得不尽人意。_
## 他们的不是
**Word的问题**
1. 表现上:格式过于复杂,导致写出来的文档排版、格式很不统一,千人千面,不利于标准化
1. 工具上:要么收费(MS)要么多(WPS)要么不稳定(一些开源的),另外这些都是很重工具
1. 不被开源界待见,你说你写了个开源工具,文档是word的,很不和谐呀……:confused:
**Markdown的问题**
1. 表现上:绝对是矫枉过正了,它的语法太简单了,用MD写一篇(如本文)还凑合,但要写一个文档的话束缚太多了,谁用谁知道
1. 工具上:Gitbook不错,将MD文档用GIT托管是个很不错的Idea,不过它的新版本把导出功能给阉割了(需要用命令行处理),不厚道,有点被gitbook平台绑架的感觉
说了这两个东西不是,那么自然会引荐更合适的喽,这就是我们主角 **Asciidoc** :heart:
Asciidoc有什么魅力呢?
1. 简洁而不简陋的语法,它专门为编写书籍而生,在语法的支持上很到位,但不像Word那样可以随性,可以让你的文档更统一美观
1. AsciidocFX工具开源跨平台,使用体验很不错,更可以导出HTML、PDF、EBook等格式
1. Gitbook也支持这个语法(如果你希望用它的话)
**一图胜千言**
![AsciidocFX效果](https://static.oschina.net/uploads/img/72339_gbfG.png "AsciidocFX效果")
## 如何学习Asciidoc?
1. 了解语法 http://asciidoctor.org/docs/asciidoc-syntax-quick-reference/
1. 有个中语版的语法介绍 http://houqp.github.io/wbwa/wbwa.html
1. 有更好的示例吗?当然有喽,用AsciidocFX可以方便地建书籍示例:
![新建示例书籍](https://static.oschina.net/uploads/img/.png "新建示例书籍")
它生成的HTML如下:
![代码和表格示例](https://static.oschina.net/uploads/img/72908_JfLc.png "代码和表格示例")
不要怀疑,这些图及工式是Asciidoc语法生成的!
![绘图及公式](https://static.oschina.net/uploads/img/73000_FqYb.png "绘图及公式")
### Enjoy!markdown 的表格真是坑。。
已有帐号?
无法登录?
社交帐号登录

我要回帖

更多关于 word markdown插件 的文章

 

随机推荐