首页 > 其他分享 >如何使用Haskell语言和tagsoup库相结合采集同花顺财经相关视频

如何使用Haskell语言和tagsoup库相结合采集同花顺财经相关视频

时间:2023-11-02 16:35:05浏览次数:34  
标签:tagsoup HTTP 函数 同花顺 Haskell 获取 HTML 使用 getHTML

如何使用Haskell语言和tagsoup库相结合采集同花顺财经相关视频_HTTP

今天要给大家带来的是一个使用Haskell语言和tagsoup库相结合的爬虫程序,主要是用来采集同花顺财经上的相关视频。前段时间一个粉丝跟我要了好久,由于太忙了,一直拖到现在。正好给大家分享一下,一起学习交流。

```haskell

import Network.HTTP

import Text.HTML.TagSoup


-- 定义一个函数,用于发送HTTP请求并获取HTML内容

getHTML :: String -> IO String

getHTML url = do

  proxy <- createHTTPProxy "https://www.duoip.cn/get_proxy" 8000

  response <- simpleHTTP { proxy = proxy } $ getRequest url

  return $ responseBody response


-- 定义一个函数,用于解析HTML内容并获取视频链接

parseHTML :: String -> IO [String]

parseHTML html = do

  soup <- parseTagsoup html

  let videos = [a ! "href" | a <- findElementsByTagName "a" soup]

  return videos


-- 主函数,用于启动整个爬虫程序

main :: IO ()

main = do

  html <- getHTML "https://www.10jqka.com.cn/"

  links <- parseHTML html

  forM_ links $ print

```

以上代码首先定义了一个函数getHTML,用于发送HTTP请求并获取HTML内容。这个函数使用了createHTTPProxy函数来创建一个HTTP代理,使用simpleHTTP函数发送请求并获取响应。然后定义了一个函数parseHTML,用于解析HTML内容并获取视频链接。这个函数使用parseTagsoup函数解析HTML内容,然后使用findElementsByTagName函数找到所有的"a"标签,使用"href"属性获取链接。

最后定义了一个主函数main,用于启动整个爬虫程序。这个函数调用getHTML函数获取HTML内容,然后调用parseHTML函数解析内容并获取链接,最后使用forM_函数遍历链接并打印出来。希望今天的内容大家能喜欢。

标签:tagsoup,HTTP,函数,同花顺,Haskell,获取,HTML,使用,getHTML
From: https://blog.51cto.com/u_14448891/8150031

相关文章

  • 同花顺期货通使用python写指标demo1
    期货通支持python本来是个好事情。奈何同花顺公司做产品不讲究,未经测试就发布了,全是bug。API接口也不完善,取数据的接口不支持取【持仓量】!玩期货不提供持仓量接口,那就只能是个玩具,不具有实用价值。怎么说呢?还是希望同花顺期货通能把python功能搞完善。 ......
  • Haskell 入门 - 零碎版
    Haskell20104.DeclarationsandBindings4.1OverviewofTypesandClasses4.1.2SyntaxofTypesTypevariablesTypeconstructorstypeconstantswithkind∗typeswithkind∗→∗built-intypeconstructorstrivialtype,as()with*functiontype,as......
  • Haskell(二):类型和类型类
    Haskell有一个静态类型系统,每个表达式的类型在编译时都是已知的。Haskell中的所有内容都有类型,因此编译器可以在编译程序之前对程序进行大量推理。现在我们用GHCI来检查一些表达式的类型,通过:t,该命令后跟任何有效的表达式。 “::”读作“具有类型”。函数也有类型,当我们编写......
  • 22.04.1 wine8.10 完美安装同花顺最新版THS_9.20.40_20230613
    Linuxluma5.19.0-45-generic#46~22.04.1-UbuntuSMPPREEMPT_DYNAMICWedJun715:06:04UTC20x86_64x86_64x86_64GNU/Linux目前测试的结果除了模拟委托下单出现问题,其他的暂时未发现任何问题。wine8.10gdiplus需要单独安装,否则同花顺的弹幕滚动无效同花顺字体......
  • [AHK]打开同花顺委托下单窗口在同花顺(v8.60.13) 试验可用
    DetectHiddenWindows,onSetTitleMatchMode,Fast;主程序IfWinExist,ahk_class#32770ahk_exexiadan.exe ToolTip,找到下单窗口else{ open_xiadan() loop{ Sleep,1000 ifA_index>20 { MsgBox下单窗口呼叫失败 break } }UntilWinExist(ahk_class......
  • 同花顺选股公式代编 代做同花顺指标公式
    原理解析:赋值:1日前的收盘价RSI2赋值:收盘价-LC和0的较大值的12日[1日权重]移动平均/收盘价-LC的绝对值的12日[1日权重]移动平均*100RSI3赋值:收盘价-LC和0的较大值的18日[......
  • Haskell CSCI3136 Ripple Effect
    HaskellCSCI3136RippleEffectProblemDescriptionRippleEffectorHakyuuisalogicpuzzlesomewhatsimilartoSudoku.Thepuzzleconsistsofarectangulargri......
  • 同花顺涨停分析
    打开同花顺网站-首页-A股-原创,里面写着“涨停复盘”的文章就有表格图查看,一般文章表格发出来的时间都在下午4点左右。投资者在买卖成交后支付给财税部门的税收。上海股票......
  • 龙哥量化:文档目录2(股票,期货,通达信、同花顺、文华等软件使用,学习文档,策略案例等,量化交
    注意:部分文档,视频是其他博主的作品,龙哥借鉴和学习,分享给大家比较粗糙,先放个表格,有空就来编辑 1、通达信  1.1、通达信官网教程——通达信公式系统 https:......
  • Uninstall Haskell.ps1
    $decision=$Host.UI.PromptForChoice('UninstallHaskell','Doyouwanttouninstallallofthehaskelltoolchain,includingGHC,Cabal,StackandGHCupitself......