csdn 后台用的什么搜索引擎 csdn

如果把后台数据作为js的某个变量的值输出,页面加载完再由js解析数据并生成html,搜索引擎能搜索到么?
[问题点数:20分,结帖人fihuang]
如果把后台数据作为js的某个变量的值输出,页面加载完再由js解析数据并生成html,搜索引擎能搜索到么?
[问题点数:20分,结帖人fihuang]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
2012年 总版技术专家分年内排行榜第一
2013年 总版技术专家分年内排行榜第七2011年 总版技术专家分年内排行榜第五2009年 总版技术专家分年内排行榜第九
2016年3月 .NET技术大版内专家分月排行榜第二2016年1月 .NET技术大版内专家分月排行榜第二2015年12月 .NET技术大版内专家分月排行榜第二2015年2月 .NET技术大版内专家分月排行榜第二2015年1月 .NET技术大版内专家分月排行榜第二2014年11月 .NET技术大版内专家分月排行榜第二2014年5月 .NET技术大版内专家分月排行榜第二2014年4月 .NET技术大版内专家分月排行榜第二2012年2月 多媒体/设计/Flash/Silverlight 开发大版内专家分月排行榜第二
2016年4月 .NET技术大版内专家分月排行榜第三2016年2月 .NET技术大版内专家分月排行榜第三2015年10月 .NET技术大版内专家分月排行榜第三2015年9月 .NET技术大版内专家分月排行榜第三2015年7月 .NET技术大版内专家分月排行榜第三2015年6月 .NET技术大版内专家分月排行榜第三2015年5月 .NET技术大版内专家分月排行榜第三2015年4月 .NET技术大版内专家分月排行榜第三2014年12月 .NET技术大版内专家分月排行榜第三2014年10月 .NET技术大版内专家分月排行榜第三2014年9月 .NET技术大版内专家分月排行榜第三2014年1月 .NET技术大版内专家分月排行榜第三2013年12月 .NET技术大版内专家分月排行榜第三2013年10月 .NET技术大版内专家分月排行榜第三2013年5月 .NET技术大版内专家分月排行榜第三2011年9月 .NET技术大版内专家分月排行榜第三2011年2月 .NET技术大版内专家分月排行榜第三2010年2月 .NET技术大版内专家分月排行榜第三
本帖子已过去太久远了,不再提供回复功能。页面中可能多个条件搜索数据库时,后台要怎么写?
[问题点数:20分,结帖人wgf42421]
页面中可能多个条件搜索数据库时,后台要怎么写?
[问题点数:20分,结帖人wgf42421]
不显示删除回复
显示所有回复
显示星级回复
显示得分回复
只显示楼主
本帖子已过去太久远了,不再提供回复功能。一个搜索健康信息的新工具
发表于 11:06|
来源搜狐公众平台|
作者搜狐公众平台
摘要:目前搜狗明医对于零基础又想要查询靠谱健康信息的朋友算是一个实用的工具。
最近&魏泽西事件& 与 &退休医生被砍数十刀&的暴力杀医事件在朋友圈都刷屏了,我的公众号后台也有不少人让我发表看法。
说实话,作为一个医院营养科的小小营养师,我实在没有什么真知灼见可以跟大家分享,我也不愿每次都饱含着悲愤唾骂一阵,然后便悻悻而归。
所以,我选择了利用自己的影响力让更多的人来关注这些事,并在一些可能集思广益的话题上引发大家的讨论,这几天我的部分微博如下:
评论中网友们表示可以练习
准备防狼喷雾
以增加生存几率&&
图片来自游戏《求生之路》海报
而在昨天,我看到一条微博时觉得还是挺有意思可以聊一聊的。
王小川是搜狗的CEO,也是我微信里的一位熟人。他昨晚宣布搜狗推出&搜狗明医&频道,将优先展示非商业的、权威的医疗信息,其中包括维基百科、google结果、知乎社区、医学期刊、丁香园等等内容,还有正规大型医院、疾控中心、世界卫生组织的部分信息。
提供&权威&、&专业&、&真实&信息的想法无疑是好的,就在4天前我还跟知名科普组织科学松鼠会的工作人员交流过类似项目的可行性,我当时提出医学知识更新速度快,整理高质量权威医学信息工作量实在太大、维护成本过高,难以实施。
那么作为互联网最伟大发明之一的搜索引擎,如果坚持不作恶,通过技术手段能不能把健康搜索做得靠谱一些呢?
我带着好奇用&搜狗明医&做了一些简单的测试。
1.权威机构网站优先
关键词一:鱼肝油
我首先用鱼肝油作为检索词,是因为这曾是一个非常混乱的概念,央视有一年315晚会还闹了乌龙。
从搜狗明医的搜索结果来看,排在第一位的是一篇来自市级食品药品监督管理局的网页,内容比较简略,但大体还是可靠的。排在第二位的是知乎。
关键词二:上火
我以&上火&这个词进行检索,发现排在第一位、第二位的也都是政务网站。
我猜想可能搜狗明医对于食药监局等政府相关专业网站域名给权重会比较高。只不过如果点击第一条进入河北省食药监局官网后会发现,文章是转载自一家网络健康媒体,并不能真正代表食药监局的权威性。
排在后面的是来自中文在线期刊资源库维普的信息,只不过可能是关键词本身就不规范,搜索的结果是期刊数据库中的一些大众医学类的文章,而非正式医学类期刊,不过这总归比一般网页可靠一些。
关键词三:食品安全
我另外以&食品安全&作为关键词搜了一下,结果世界卫生组织、国家食品药品监督管理总局的结果也是非常靠前的。
2.医学专业网站优先
我最后试了下口腔溃疡这个词。
排在第一位的是丁香园的相关文章。丁香园是国内一家有着十几年历史的医学网站,我作为丁香园营养版版主已是第7个年头了。他们拥有大量医学背景的编辑,科普文章也经过了同行评议,加上无数医生盯着,信息可信度还是很高的。
排在第三位的是首都医科大学附属北京口腔医院,正好是我们医院的邻居,搜索引擎收录了官网上的留言回复,确实能对网友起到帮助。
然而问题来了,排在第二、第四位的都是知乎的答案&& 结合以上的答案不难看出:
3.知乎社区的比重非常高
这真的合适吗?
首先我承认,知乎的答案确实涵盖面非常广,可以很大程度上满足网友们对于信息的渴望,而且其中也不乏非常优质的资讯。我个人就很喜欢在知乎上搜索一些经验性的内容,比如说最近我家在装修,我就参考了知乎上的很多技巧、节约了大量的时间。
然而知乎一人一票给答案点赞而将答案置顶的机制很难区别外行和内行,尤其在健康方面这是非常危险的。我们都清楚,客观规律是不为人的意志而转移的,别人的答案对不对,非专业的我们没法准确地进行判断,特别是像医学知识这种有较高门槛的学科,个人的价值偏好,与正确性并不见得相关。
我曾经在一个最高票数的答案上看到一段话,作者说:&任何人都应该阅读和积累正确的解剖、生理、运动学、营养学知识,以充分认识自己的身体,辨别正确与不正确的健身知识,制定适合自己的健身计划。& 我看到这里时觉得深以为然就想给他点赞,然而再往下看,发现他给的具体做法大约一半都是错误的。
总之,目前搜狗明医对于零基础又想要查询靠谱健康信息的朋友算是一个实用的工具,但是还远不能让人满意。
声明:CSDN登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
推荐阅读相关主题:
CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
相关热门文章scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)
scrapy+Lucene搭建小型搜索引擎(现代信息检索大作业)
工程类搜索型:
定向采集 3-4 个新闻网站, 实现这些网站信息的抽取、索引和检索。网页数 目不少于 10 万条。能按相关度、时间、热度 (需要自己定义) 等属性进行排序, 能实现相似 新闻的自动聚类。
要求: 有相关搜索推荐、snippet 生成、结果预览 (鼠标移到相关结果, 能预览) 功能
二、项目线上访问地址
项目访问地址: (检索体育相关新闻)
代码托管在 github 上:
三、开发工具
jdk 版本:1.7
服务器:Tomcat7.0
python:2.7
scrapy:1.0
四、设计方案
4.1整体思路
在实现新闻信息检索系统时首先进行了信息采集,信息采集结束之后使用 Lucene 提供的 api 构建索引库, 前端使用 jsp 接收用户查询,在后台使用 servlet 对用户查询进 行分词处理,之后到索引库中进行文档匹配, 最后把查询结果集反馈给用户并在前端页面中 展示。
4.2信息采集
Scrapy 是 Python 开发的一个快速、高层次的屏幕抓取和 web 抓取框架,用于抓取 web 站点并从页面中提取结构化的数据。我们采集了 10w+ 新闻数据, 新闻信息以 json 文件格 式保存。scrapy 采集流程:
采集到的新闻数据:
新闻格式:
4.3倒排索引构建
在索引构建模块,主要包括下面三个关键步骤: 数据预处理、新闻内容分词、构建倒排 索引。
**数据预处理:**Gson 是 Google 提供的用来在 Java 对象和 JSON 数据之间进行映射的 Java 类库。可以将一个 JSON 字符串转成一个 Java 对象, 或者反过来。我们使用 Gson 把 json 文件转换为 News 对象
**中文分词:**IK Analyzer 是一个开源的,基于 java 语言开发的轻量级的中文分词工具 包,IK 发展为面向 Java 的公用分词组件,独立于 Lucene 项目,同时提供了对 Lucene 的默 认优化实现。IK 分词采用了特有的“正向迭代最细粒度切分算法“, 支持细粒度和智能分词两 种切分模式, 并且采用了多子处理器分析模式, 支持英文字母、数字、中文词汇等分词处理, 兼容韩文、日文字符。
**构建倒排索引:**Lucene 提供了构建倒排索引的方法,步骤如下图所示:
Luke 是一个用于 Lucene 搜索引擎的,方便开发和诊断的第三方工具,它可以访问
现有 Lucene 的索引. 使用 luke 打开索引目录,可以看到新闻信息被存储到索引库中。
4.4索引查询
索引创建好以后,查询可分为以下几个步骤:
设置查询索引的目录 (这里就是上面创建索引的目录).
2. 创建 indexSearcher.
3. 设置 query 的分词方式
4. 设置查询域, 比如查询域为 news title, 那么就到新闻标题域去比对 5. 设置查询字符串,也就是要查询的关键词.
6. 返回结果是一个文档集合,放在 TopDocs 中,通过循环 TopDocs 数组输出查询结果. 用户一般只看前几页的数据,为了加快前端的数据展示, 返回前 1000 条数据到前台。
4.5关键字高亮
检索结果高亮对于用户的体验度和友好度非常重要,可以快速标记出用户检索对关键 词。Lucene 的 Highlighter 类可以用于返回文档中的关键字高亮,通过在关键字前面添加 css 片段来实现。
4.6用户界面
使用 jsp 编写用户界面,服务器为 Tomcat 7.0, 用户输入关键词以后提交表单,后
台使用 servlet 接收用户查询, 之后把查询字符串作为搜索的 key 到索引库中搜索文档。检索效果:
4.7按时间排序和结果分页
按时间排序: 所有的新闻结果存放在一个 list 集合中,集合中的每个元素为一个 News 对象, 通过重写 Comparator 类中的 compare 方法实现按集合中每个新闻元素的 Time 排 序。
结果分页: 定义了一个 Page 类用来记录当前页、总页数、每页多少条数据、总的数据 数、每页起始数、每页终止数、是否有下一页、是否有前一页。
五、参考资料
下面列出可参考的资料:
开源工具的使用显著提高了开 发效率,但build from ground还需要学习很多东西,继续沉淀。
欢迎批评指正。
我的热门文章
即使是一小步也想与你分享

我要回帖

更多关于 csdn怎么搜索 的文章

 

随机推荐