公布2019年9月3日通过 正规澳门赌场

如何使用XPath刮谷歌的搜索功能

谷歌的搜索引擎结果页面(SERP中)已经发生了很大变化,在过去10年里,随着越来越多的数据和信息被直接拉入结果页面本身。谷歌搜索功能可能时下最SERP中经常出现时的一些最常见的功能特色正在片段(又名“零位置”),知识面板和相关问题(又名“人还问”)。 数据显示 一些功能,如相关的问题,今天可能有近90%的养老金计划的功能上 - 在过去几年大幅增加。

了解这些特点是功能强大的正规澳门赌场。逆向工程为什么某些功能出现特定的查询类型和analyisng数据或包括在所说的功能能够向我们作出优化决策的文本。同 在下降似乎有机CTR,优化谷歌搜索功能比以往任何时候都更加重要,以确保内容是可见的,因为它可能可以进行搜索的用户。

本指南通过从SERP中收集的搜索功能数据的过程中运行,以帮助扩展您的分析和优化工作。我将演示如何从刮使用正规澳门赌场正规澳门赌场蜘蛛使用XPath SERP中的数据,并说明它是多么容易很快抓住相关和有用数据的加载。本指南的重点特色内容片断以及相关问题的具体,但原则是一样的过刮擦等特性。

TL;博士

如果你已经是XPath和刮专家,只是这里的语法和数据类型来设置你的提取(也许你看到我在雄辩地说明过程 seocamp巴黎 !还是今年pubcon拉斯维加斯),在这里你去(扰流警示其他人)! -

精选片段XPath语法

  • 精选片断页面标题(文本) - (// DIV [@类= '椭球'])[1] /文本()
  • 精选片段文本段(文本) - (//跨度[@类= “e24kjd”])[1]
  • 精选片段圆点文本(文本) - // UL [@类= “i8z77e”] /立
  • 精选片段编号列表(文本) - //醇[@类= “x5lh0c”] /立
  • 精选片段表(文本) - // //将表TR
  • 精选片段URL(内部HTML) - (// DIV [@类= “xpdopen”] // A / @ HREF)[2]
  • 精选片段图像源(文本) - // DIV [@类= “rg_ilbg”]
  • 相关问题XPath语法

  • 相关问题1个文本(文本) - (// DIV [1] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题2的文本(文本) - (// DIV [2] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题3文本(文本) - (// DIV [3] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题4文本(文本) - (// DIV [4] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关问题文本片段的所有4个问题(文本) - // G-手风琴式膨胀机//跨度[@类= “e24kjd”]
  • 相关的问题页面标题为所有4个问题(文本) - // G-手风琴式膨胀机// DIV [@类= “椭球”]
  • 相关的问题网页网址为所有4个问题(内HTML) - // DIV [@类= “fecgpcÿYF”] // DIV [@类= “RC”] // A / @ HREF
  • 你也可以得到这个列表中 我们伴随谷歌文档。回到我们为你休息定期安排的节目......请按照下列步骤开始刮精选片断以及相关的问题!

    1)制备

    上手,你需要 下载并安装正规澳门赌场蜘蛛软件有驾照 获得必要刮自定义提取功能。我也建议我们的 幅刮和数据提取导 作为光阅读的有用位,只是为了掩饰我们在说什么了这里的基础知识。

    2)收集关键字数据

    接下来你就需要找到功能片段和/或相关的问题都出现在SERP中相关的关键字。最知名的正规澳门赌场的智能工具具有的功能来过滤你排名关键字(或想排名)以及这些特征显示,或者你可能有自己的排名监测系统提供帮助。做不到这一点,只需运行的重要和相关的关键字,一些搜索来寻找自己,或从谷歌搜索控制台抢查询数据。无论你从了解关键字的数据,如果你有大量的数据并打算修剪和优先考虑你的关键字,我建议如下 -

  • 优先在那里你有一个体面的排名位置已经关键字。这不仅是有关获奖一个有特色的片段(几乎所有的功能片段是从页面的前10位排名有机服用,通常前5名),但更普遍的,如果谷歌认为您的网页已经是相关的查询,你会有针对所有类型的搜索功能更好的机会。
  • 当然考虑搜索量(越高越好,对吧?),而且还试图确定一个搜索功能,驾驶的可能性也点击。与主有机结果关键字的意图,并非所有的搜索功能将推动更多的流量显著量,即使你实现“零位置”。尽量客观地考虑某个特定查询背后的意图,并优先考虑这是更可能推动更多的点击的关键字。
  • 3)创建一个谷歌搜索查询网址

    我们要爬行谷歌搜索查询的URL,因此需要喂蜘蛛正规澳门赌场一个url使用收集到的关键字数据抓取。这既可以在Excel中使用查找和替换完,“连击”的公式来改变关键字的列表到一个单一的URL字符串(带+符号代替文字的空间,选择您所选择的谷歌,然后串联细胞创造一个完整的字符串),或者,你可以简单地粘贴你原来的关键字列表 到这个方便的谷歌文档 与包括公式(请在文档的副本第一)。

    google search query str在g URL

    在过程结束时,你应该有谷歌搜索查询的URL看起来像这样的清单 -

    //www.google.co.uk/search?q=keyword+one
    //www.google.co.uk/search?q=keyword+two
    //www.google.co.uk/search?q=keyword+three
    //www.google.co.uk/search?q=keyword+four
    //www.google.co.uk/search?q=keyword+five等。

    4)配置正规澳门赌场蜘蛛

    有经验的正规澳门赌场蜘蛛的用户都知道,我们的工具有多种 配置选项 帮你收集你所需要的重要数据。爬行谷歌搜索查询的网址需要一些配置工作。您需要配置如下菜单内 -

  • Configuration > Spider > Render在g > JavaScript
  • Configuration > robots.txt > Sett在gs > Ignore robots.txt
  • Configuration > User-Agent > Present User Agents > Chrome
  • Configuration > Speed > Max Threads = 1 > Max URI/s = 0.5
  • 这些配置选项确保正规澳门赌场蜘蛛可访问的功能,也没有爬行速度太快引发的验证码。一旦你设置这个配置我推荐 将其保存为自定义配置 你可以在未来重新加载。

    5)设置你的提取

    接下来,你需要告诉搜索引擎蜘蛛什么来提取。为此,进入“配置”菜单,选择“自定义”和“提取” -

    scream在g frog seo spider custom extraction

    那么你应该看到这样的画面 -

    scream在g frog seo spider xpath

    从“无效”下拉菜单中,您需要选择“的XPath”。从出现在右边的下拉新,您需要选择数据的您正在寻找提取的类型。这将取决于你在寻找什么样的数据,从搜索结果中提取(下面列出XPath语法和数据类型的完整列表),所以我们使用的相关问题的例子 -

    scrap在g google related questions

    上面的截图显示出在英国的搜索查询“正规澳门赌场”的相关问题。假设我们想知道相关问题进行显示查询,以确保我们有内容和针对性,回答了这些问题的页面。如果谷歌认为他们是相关的原始查询,至少是我们应该考虑的是分析和潜在的优化。在这个例子中,我们只是想的问题本身的文本,以帮助从内容角度探讨通知我们。

    通常4相关的问题显示某个特定查询,而这些4个问题有一个单独的XPath语法 -

  • 问题1 - (// DIV [1] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 问题2 - (// DIV [2] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 问题3 - (// DIV [3] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 问题4 - (// DIV [4] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 找到正确的XPath语法您所需的元素,我们的 网页抓取指南 可以帮助,但我们在本文的末尾有重要的的完整列表!

    一旦你输入你的语法,你也可以重命名抽出电场对应于每次提取(问题1,问题2等)。对于这个特殊的提取我们想要的问题本身的文本,因此需要选择数据类型下拉菜单中选择“提取文本”。你应该有一个画面是这样的 -

    scream在g frog custom extraction

    如果你这样做,你几乎没有!

    6)在列表模式抓取

    这个任务,你需要使用搜索引擎蜘蛛 列表模式. In the menu go Mode > List. Next, return to your list of created Google search query URL strings and copy all URLs. Return to the 正规澳门赌场蜘蛛, hit the ‘Upload’ button 和 then ‘Paste’. Your list of search query URLs should appear in the w在dow –

    scream在g frog list mode

    点击“OK”,你的抓取将开始。

    7)分析你的结果

    看你提取你需要导航到搜索引擎蜘蛛“自定义”选项卡,然后选择“提取”过滤器。 。在这里,你应该开始看到您的提取滚滚完成时,你应该有一个漂亮的屏幕看像这样的 -

    scream在g frog seo spider custom extraction

    你可以看到你的搜索查询,并出现在SERP中的四个相关问题拉进旁边吧。完成后,您可以导出数据和关键字匹配到您的网页,并开始对数据进行分析和优化为目标的有关问题。

    8)XPath语法的完整列表

    如许,我们已经做了很多繁重的工作,并有XPath语法的列表,以提取各种功能的片段和SERP中的相关问题的元素 -

    精选片段XPath语法

  • 精选片断页面标题(文本) - (// DIV [@类= '椭球'])[1] /文本()
  • 精选片段文本段(文本) - (//跨度[@类= “e24kjd”])[1]
  • 精选片段圆点文本(文本) - // UL [@类= “i8z77e”] /立
  • 精选片段编号列表(文本) - //醇[@类= “x5lh0c”] /立
  • 精选片段表(文本) - // //将表TR
  • 精选片段URL(内部HTML) - (// DIV [@类= “xpdopen”] // A / @ HREF)[2]
  • 精选片段图像源(文本) - // DIV [@类= “rg_ilbg”]
  • 相关问题XPath语法

  • 相关问题1个文本(文本) - (// DIV [1] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题2的文本(文本) - (// DIV [2] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题3文本(文本) - (// DIV [3] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关的问题4文本(文本) - (// DIV [4] / G-手风琴式膨胀机/ DIV / DIV)[1]
  • 相关问题文本片段的所有4个问题(文本) - // G-手风琴式膨胀机//跨度[@类= “e24kjd”]
  • 相关的问题页面标题为所有4个问题(文本) - // G-手风琴式膨胀机// DIV [@类= “椭球”]
  • 相关的问题网页网址为所有4个问题(文本) - // DIV [@类= “fecgpcÿYF”] // DIV [@类= “RC”] // A / @ HREF
  • 我们还包括他们在我们的 伴随谷歌文档 为便于。

    结论

    希望我们的导游一直有用,可以设置你的方式从搜索结果中提取各种有用的和相关的数据。让我知道你上车,如果您有任何其他漂亮的XPath的技巧和窍门,请在下面发表评论!