什么是垂直搜索引擎?
是通过对专业特定的领域或行业的内容进行专业和深入的分析挖掘、过滤筛选,信息定位为更精准的专业搜索。实际上是搜索引擎的细分和延伸,有针对性地为某一特定领域、某一特定人群或某一特定需求提供的专门信息检索服务,以满足用户个性化的信息需求。
垂直搜索引擎能够定向采集与垂直搜索范围相关的网页,对内容相关的以及适于进一步处理的网页进行优先采集。其信息采集可以通过人工设定网址和网页分析等方式共同进行,在定向分字段抽取出所需要的数据并处理后再以某种形式返回给用户。
扩展资料:
垂直搜索引擎主要有四大关键技术
1、聚焦、实时和可管理的网页采集技术
垂直搜索只对局部来源的网页进行采集,采集的网页数量适中。但其要求采集的网页全面,必须达到更深的层级,采集动态网页的优先级也相对较高。在实际应用中,垂直搜索的网页采集技术能够按需控制采集目标和范围、按需支持深度采集及按需支持复杂的动态网页采集。
2、从非结构化内容到结构化数据的网页解析技术
由于垂直搜索引擎服务的特殊性,往往要求按需提供时间、来源、作者及其他元数据解析,包括对网页中特定内容的提取。
3、精、准、全的全文索引和联合检索技术
垂直搜索由于在信息的专业性和使用价值方面有更高的要求,因此能够支持全文检索和精确检索,并按需提供多种结果排序方式。另外,一些垂直搜索引擎还要求按需支持结构化和非结构化数据联合检索。
4、高度智能化的文本挖掘技术
垂直搜索是以结构化数据为最小单位。基于结构化数据和全文数据的结合,垂直搜索才能为用户提供更加到位、更有价值的服务。整个结构化信息提取贯穿从网页解析到网页加工处理的过程。
参考资料来源:百度百科-垂直搜索引擎
什么叫垂直搜索?
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
垂直搜索引擎和普通的网页搜索引擎的***区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。
整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。
垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。
垂直搜索引擎大体上需要以下技术
1.Spider
2.网页结构化信息抽取技术或元数据采集技术
3.分词、索引
4.其他信息处理技术
垂直搜索引擎的技术评估应从以下几点来判断
1.全面性
2.更新性
3.准确性
4.功能性
垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。
国内都有哪些垂直搜索引擎?
中国的垂直搜索引擎有搜搜、360、百度、有道、搜狗。
1、搜狗:
搜狐公司的旗下子公司,于2004年8月3日推出,目的是增强搜狐网的搜索技能,主要经营搜狐公司的搜索业务。在搜索业务的同时,也推出搜狗输入法、搜狗高速浏览器。
2、百度:
全球***的中文搜索引擎及***的中文网站,全球领先的人工智能公司。百度是最懂用户,并能帮助人们成长的全球顶级高科技公司。
3、搜搜:
腾讯旗下的搜索网站,是腾讯主要的业务单元之一。网站于2006年3月正式发布并开始运营。搜搜目前已成为中国网民首选的三大搜索引擎之一,主要为网民提供实用便捷的搜索服务,同时承担腾讯全部搜索业务,是腾讯整体在线生活战略中重要的组成部分之一。
4、360:
一个全面的元搜索引擎搜索,是一种搜索引擎,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的,搜索引擎来实现检索操作,是分布于网络的多种检索工具的全局控制机制。
5、有道:
网易旗下的子公司,利用大数据技术提供移动互联网应用。网易有道公司先后推出有道词典、有道云笔记、慧慧网、有道推广等系列产品。
参考资料来源:百度百科—搜狗
参考资料来源:百度百科—百度
参考资料来源:百度百科—搜搜
参考资料来源:百度百科—360搜索
参考资料来源:百度百科—有道
垂直搜索是什么?
指的是专注于某个行业领域的搜索。垂直领域既可能是不同的主题,如生活搜索,购物搜索,交通搜索,也可能是不同的媒介形式,如视频搜索,图片搜索
综合类搜索引擎与垂直类搜索引擎孰优孰劣?
综合来说,垂直搜索引擎优势在于覆盖面广阔、信息量巨大,缺点是不能完全精确定位搜索;而垂直搜索引擎优势在于准确率高、选择性强,缺点是覆盖面窄、信息量小,一般搜索结果就几百个左右。
所以综合搜索引擎一般单独的用于搜索(如百度),而垂直搜索引擎一般在大型网站内部使用(如淘宝搜索)。
垂直搜索的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于垂直搜索是什么意思、垂直搜索的信息别忘了在本站进行查找喔。