Selenium 教程第 3 部分
我真的很抱歉放弃这部续集。实际上,我在写这篇文章的时候就失去了动力,想着谁会去读它,甚至会喜欢它。但是看到您的一些支持者喜欢这个故事或添加到他们的阅读列表中,我感到内疚并想为此道歉并且也有动力。分享是一件好事,因为我们不知道谁在寻找它!现在,无论如何我都会继续写下去。谢谢大家:)
重要的提示: 我在 2022 年写这篇文章 1 和 2 写于 2021 年 4 月。所以,在使用硒时,我发现硒有 不推荐使用 find_element_by_ 方法。因此,以前的代码可能不起作用。在这一部分中,我使用的是最新的 selenium 版本,因此将向您展示如何使用新的方法和语法进行抓取。
因此,继续前进,当您在 Twitter 上搜索任何内容并按 Enter 键时,您将位于顶部。
top section
所以,从这里我想去人物部分并选择官方的 BTS 帐户。为此,我们可以使用 xpath 并以 People 形式查找文本并在那里执行单击事件。如前所示,xpath 使用文本在网页上查找元素的语法是 //*[text()='你的文字']. 因此,对于单击 People 部分,xpath 将是 //*[text()='People']。您也可以在检查页面上确认这一点。
在此页面中,您将看到 3 个单词与 People 和第一个总是以圆圈突出显示的元素。好在 查找元素 将给出第一次出现 People 的元素,如果你想要其他两个也可以使用 查找元素 .
单击“人员”部分的新语法是:
我们使用驱动变量,现在 selenium 只有一个功能 查找元素 为所有类型的操作和函数内部用户名,我们通过您要查找的方法和实际的 Web 元素传递,然后像往常一样使用 click() 函数。关键字 经过 来自硒的进口。 By 拥有所有其他功能来定位 Web 元素,如 By.TAG_NAME、By.CLASS_NAME 等(查看官方网站了解更多信息)。使用 sleep 加载页面。
library imports
现在我们在这个页面:
People section for search BTS
现在我们需要选择第一个是BTS的官方账号。要再次执行此操作,请右键单击第一个帐户并选择检查。找到 web 元素或只使用文本所在的 xpath '防弹童子军'。 我发现这非常简单,您正在利用这个词在页面中独一无二。现在只需找到带有此文本的元素并单击它并等待加载页面。
selecting bts official account
单击此按钮后,我们在此页面上:
official account of bts
现在,我们将从这个页面收集官方 bts 推文、点赞数、转推、评论、帐户名称、@... 等。首先,我们需要找到单个帖子。这会很困难,但别担心,我会在你身边
标签:教程,单击,标签,元素,Selenium,帖子,div,部分,页面 From: https://www.cnblogs.com/amboke/p/16652312.html