搜索

来自站长百科
跳转至: 导航、​ 搜索

人工智能中,搜索问题一般包括两个重要的问题:

  • 搜索什么:通常指目标
  • 在哪里搜索:即搜索空间,通常指一系列状态的汇集,因此也称为状态空间



搜索引擎[ ]

搜索引擎(search engines)是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息,它包括信息搜集、信息整理和用户查询三部分。目前常用的网络搜索引擎有百度,Google,搜狐,雅虎,有道,中搜,搜搜,搜客等。

早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。

随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办 yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。

然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索 “电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接

在百度、Google、雅虎等主流搜索引擎愈发发展成熟以外,各类不同的搜索大全也在今日的互联网逐渐兴起。搜索大全即为集各种不同类型搜索引擎,涵盖多语言于一身的搜索集合。该类搜索引擎大全的兴起,让搜索变得更加简单。几乎所有的内容都能在“一页之间”完成。


搜索策略[ ]

宽度优先搜索[ ]

宽度优先搜索算法是沿着树的宽度遍历树的节点,如果发现目标,则算法中止。属于盲目搜索。 宽度优先搜索的实现一般采用open-closed表。

深度优先搜索[ ]

深度优先搜索沿着树的最大深度方向生成节点并与目标节点进行比较,只有当上次访问的节点不是目标节点,而且没有其他节点可以生成的时候,才转到上次访问节点的父节点,然后搜索该节点的其他子节点。因此深度优先搜索也称为回溯搜索。它既不是完备的,也不是最优的。 有时候,某些特定的问题会产生大量重复的节点。例如“八数码”问题就是这样的,当每次运用向上、向下、向左、向右移动空格的算符时,可能产生与已经产生的节点重复的节点。当再次搜索到这个重复节点时,由于应用的算符基本一致,还会产生重复,所以为了节约时间和存储空间,往往在宽度优先算法中设立一个机制,用来删除这些重复的节点,以提高效率。

迭代加深搜索[ ]

对深度优先搜索进行了一定改进,对搜索树的深度进行控制,即有界深度优先搜索。

但是深度限制值d的选取是一个问题,因此试图尝试所有可能的深度限制,即在找到目标之前,通过迭代不断增大d以保证完备性和最优性。

启发式OR图搜索算法

  • 爬山算法
  • 模拟退火算法
  • 最好优先
  • 通用图
  • A*

AND-OR 图启发式搜索

一个特殊问题:博弈论

约束满足搜索

搜索策略还可以指在使用搜索引擎中所使用的策略,它通常是搜索之母,一个好的搜索过程必定有一个好的搜索策略来支持。


评价准则[ ]

  • 完备性
  • 时间复杂性
  • 空间复杂性
  • 最优性



相关条目[ ]



参考资源[ ]