不同形式的图像搜索引擎的实现原理

发布时间: 2017-12-13 15:21 来源: 未知 点击量: 196

     目前主流的搜索引擎图像,大多是基于HTML元素,如文本链接或图像alt标签来识别图像内容,当然,也有根据图像本身的内容做图像内容.让我们详细讨论这两个问题.当搜索引擎爬虫通过网络中的URL找到新页面时,通过第三方元素(如文本)标识图片内容的图像搜索引擎.

 
 
 
 
    它使用HTTP协议提取网页并将页面的HTML代码传输到内容分析器.内容分析器基于特定的HTML代码查找Web页面中包含的图像.然后搜索引擎爬虫将根据标题判断这个图像的内容.标题标签、关键字标签、谨慎标签和标签中的属性.
 
    同时,搜索引擎爬虫将通过链接到页面的外部链接来判断该图像的内容.当搜索引擎能基本判断图片的内容时,根据图像内容进行分类,并根据图像和关键词的相关性进行排序.
 
    上面的例子是一个单独的图像显示页面HTML代码.本文的主要目的是让搜索引擎爬虫理解图像的内容更容易.
 
    在确定图像的内容和分类后,搜索引擎将分析的数据放入索引数据库,并自动生成图像的缩略图.当用户搜索时,搜索引擎根据图像的内容和相关性对图像进行排序,并将最精确的结果显示给用户.
document.write ('');