首页 > 医卫考试> 健康知识
题目内容 (请给出正确答案)
[主观题]

PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当

网页甲有一个链接指向网页乙,就认为乙获得了甲对它贡献的分值,该值的多少取决于网页甲本身的重要程度,即网页甲的重要性越大,网页乙获得的贡献值就越高。由于网络中网页链接的相互指向,该分值的计算为一个迭代过程,最终网页根据所得分值进行检索排序。

互联网是一张有向图,每一个网页是图的一个顶点,网页间的每一个超链接是图的一个边,邻接矩阵B=(b)w如果从网页i到网页j有超链接,则by=1,否则为0。

记矩阵B的列和及行和分别是PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页它们分别给出了页面j的链人链接数目和页面i的链出链接数目。假如在上网时浏览页面并选择下一个页面的过程,与过去浏览过哪些页面无关,而仅依赖于当前所在的页面。那么这一-选择过程可以认为是一一个有限状态、离散时间的随机过程,其状态转移规律用Markov链描述。定义矩阵A=(ay)wxn为PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页式中:d是模型参数,通常取d=0.85;A是Markov链的转移概率矩阵;ay表示从页面i转移到页而j的概率。根据Markov链的基本性质,对于正则Markov链存在平稳分布x=PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页式中:x为在极限状态(转移次数趋于无限)下各网页被访问的概率分布,Google将它定义为各网页的PageRank值。假设x已经得到,则它按分量满足方程PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页网页i的PageRank值是划,它链出的页面有τ个,于是页面i将它的PageRank值分成r份,分别“投票"给它链出的网页。x为网页k的PageRank值,即网络上所有页面“投票给网页k的最终值。根据Markov链的基本性质还可以得到,平稳分布(即PageRank值)是转移概率矩阵A的转置矩阵AT的最大特征值(=1)所对应的归一化特征向量。

已知一个N=6的网络如图4.8所示,求它的PageRank取值。

PageRank算法是基于网页链接分析对关键字匹配搜索结果进行处理的。它借鉴传统引文分析思想:当网页

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“PageRank算法是基于网页链接分析对关键字匹配搜索结果进…”相关的问题
第1题
在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()?

A.深度优先

B.OPIC

C.广度优先

D.局部PageRank策略

点击查看答案
第2题
阅读下面的文章,回答问题 一个正常的搜索引擎,其核心功能自然是网页搜索。那搜索结果应该怎样排序才最好呢?实际上,在谷歌主导互联网搜索之前,人们为此伤透脑筋。很显然,搜索引擎应该把重要的网页放到搜素结果中比较靠前的地方。这个方案很容易想到,但是解决的方法却没有想象的那么简单。 在谷歌诞生之前那段时间,流行的网页排名算法都很类似,它们都使用了一个非常简单的思想:越是重要的网页,访问量就会越大。许多大公司就通过统计网页的访问量来进行网页排名。但是这种排名算法有两个很显著的问题:一是只能够抽样统计,所以统计数据不一定准确,而且访问量的波动会比较大,想要得到准确的统计需要大量的时间和人力,还只能维持很短的有效时间;二是访问量并不一定能体现网页的“重要程度”——可能一些比较早接触互联网的网民还记得,那时有很多人推出了专门“刷访问量”的服务。有没有更好的方法,不统计访问量就能够为网页的重要度排序呢? 就是在这种情况下,1996年初,谷歌公司的创始人,当时还是美国斯坦福大学研究生的佩奇和布林开始了对网页排序问题的研究。在1999年,一篇以佩奇为第一作者的论文发表了,论文中介绍了一种叫PageRank的算法,这种算法的主要思想是:越“重要”的网页,页面上的链接质量也越高,同时越容易被其它“重要”的网页链接,于是,算法完全利用网页之间互相链接的关系来计算网页的重要程度,将网页排序彻底变成一个数学问题,终于摆脱了访问量统计的框框。 不过要强调的是,虽然PageRank是谷歌搜索结果排序的重要依据,谷歌也以此发家,但是它并不是全部依据——实际上,谷歌发展到现在,已同时用了数百种不同的算法来确定最终显示给用户的搜索结果顺序。 搜索引擎对网页排序的最基本思想是指()

A.访问量越大排在越前面

B.链接质量越高排在越前面

C.和其他网页关系越密切排在越前面

D.越重要排在越前面

点击查看答案
第3题
在大数据计算服务(MaxCompute,原ODPS)的表中存有一批网站及其相互之间链接关系,开发人员希望通过pagerank算法来分析这批网站的排名,即把网站看做节点,把网站之间的连接关系看做权重,从而实现对网站的评分。()计算框架更适合实现这个场景。

A.SQL

B.MapReduce

C.Graph

D.Tunnel

点击查看答案
第4题
以下()场景可以使用MaxcomputeMR实现。

A.Web访问日志分析:分析用户访问行为,个性化推荐等

B.搜索,比如pagerank、网页爬取等

C.机器学习:监督学习、无监督学习、分类算法等

D.广告推荐:用户点击购买行为预测

点击查看答案
第5题
在PPT幻灯片中创建基于Web网页超链接的最快方法是()。

A.直接键入有效网址URL

B.插入内部链接

C.插入外部链接

D.单击鼠标右键选超链接

点击查看答案
第6题
在网页制作中,关于超链接接说法不正确的是()

A.可以链接网页

B.可以链接下载文件

C.可以链接音乐文件

D.不可以链接邮件地址

点击查看答案
第7题
关于跳转以下说法错误的是()?

A.仪表板间只有两种跳转方式

B.可以设置为分析模版跳转

C.可以设置为网页链接跳转

D.网页链接跳转不可带入参数

点击查看答案
第8题
在HIML中,主要用来链接其他网站的网页是相对地址。

点击查看答案
第9题
在进行网页测试和发布前要设置站点的原因是()。
A.Web站点是一组具有共享属性的链接文档和资源

B.在Dreamweaver中,“站点”指属于某个Web站点的文档的本地或远程存储位置

C.Dreamweaver站点提供了一种方法,使我们可以组织和管理您所有的Web文档,将站点上传到Web服务器,跟踪和维护链接以及管理和共享文件

D.方便以后对整个站点的测试,调试

点击查看答案
第10题
可视化分析方法,主要包括可视化查询、链接分析、路径分析、群集分析、社会网络分析等分析算法与分析工具。()
点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改