首页 > 其他分享 >OpenWebSpider 安装使用

OpenWebSpider 安装使用

时间:2023-06-30 10:33:15浏览次数:37  
标签:openwebspider www com eg OpenWebSpider 索引 使用 安装

OpenWebSpider 是一个很好用的网络爬虫,也可以叫做“网络蜘蛛”.

安装:

1.使用Vs.net 2003 编译,

记得要copy libmysql.dll到工程里

2.配置文件openwebspider.conf

将已经启动了的 mysql数据库用户名,密码填写好

3.数据库建立

执行 sql_struct.txt 下的文件目录。OK Go ahead , grabble your web now :)

下面我为说一下OpenWebSpider的使用方法。
一般情况下我们通过在CMD下输入
openwebspider -i http://www.****.com/ -e -s
就可以对你指定的网站进行采集了。

参数说明:
-I 在数据库里搜索字符串。        eg: openwebspider -I '美女'
-O 指定数据库内主机进行索引      eg: openwebspider -O 'www.baidu.com'
-i 指定主机名                    eg: openwebspider -i http://www.baidu.com/-t 线程 如不设定,默认为20
-s 限制层数 默认为0 不限制
-l 限制索引页数量 默认为0 不限制
-c 限制每页索引花费时间。
-b 限制出错时间
-e 限定主机,(不添加外部主机)
-F 自由索引模式

等等。



作者:古道轻风

标签:openwebspider,www,com,eg,OpenWebSpider,索引,使用,安装
From: https://blog.51cto.com/u_15949547/6588748

相关文章

  • Live2D的使用
    live2d-widget-model-gflive2d-widget-model-haru/01live2d-widget-model-haru/02live2d-widget-model-harutolive2d-widget-model-hibikilive2d-widget-model-hijikilive2d-widget-model-izumilive2d-widget-model-koharulive2d-widget-model-mik......
  • CentOS7安装xrdp(Windows远程桌面连接Linux)
    前提:CentOS安装桌面,如果无桌面,请执行:yum-ygroupsinstall"GNOMEDesktop"startx方法一配置源yuminstallepel*-y安装xrdpyum--enablerepo=epel-yinstallxrdp 方法二1、安装xrdp更具自己的系统位数选择对应的包(如果是32位使用则选择i386,如果是64位,请选择x86_64),查......
  • node安装
    #node笔记##安装去node官网下载LTS,长期支持版本,傻瓜式安装打开命令行```shellnode-v```如果能出现版本号,即安装成功如果不出现,再安装一次,可以考虑选择repair备注:win7用户,需要自行配置环境变量***##配置淘宝镜像```shellnpmgetregistry```如果出现的网址,不是......
  • RedHat 6.9 操作系统安装
    重启服务器--按F11--biosbootmanager---选择自己的U盘通过U盘启动RedHat6.9系统,如图安装界面:选择Installorupgradeanexisingsystem选项回车。系统安装进程初始化成功后,提示安装系统是否进行测试。按键盘tab移动光标选择Skip点击回车进入图形化系统安装界面,点击NEXT......
  • 使用 JCommander 解析命令行参数
    前言如果你想构建一个支持命令行参数的程序,那么jcommander非常适合你,jcommander是一个只有几十kb的Java命令行参数解析工具,可以通过注解的方式快速实现命令行参数解析。这篇教程会通过介绍jcommadner,快速的创建一个命令行程序,最后支持的命令参数功能如下图。这个命......
  • MongoDB从入门到实战之.NET Core使用MongoDB开发ToDoList系统(8)-Ant Design Blazor前端
    前言前面的章节我们介绍了一些值得推荐的BlazorUI组件库,通过该篇文章的组件库介绍最终我选用AntDesignBlazor这个UI框架作为ToDoList系统的前端框架。因为在之前的工作中有使用过AntDesignVue、AntDesignAngular习惯并且喜欢AntDesign设计规范和风格,废话不多说今天我......
  • Celery的基本使用
    day11——celerycelery介绍架构和安装#celery:分布式的异步任务框架,主要用来做: 异步任务延时任务定时任务---》如果只想做定时任务,可以不使用celery,有别的选择#celery框架,原理1)可以不依赖任何服务器,通过自身命令,启动服务(内部支持socket)2)celery服务为为其他......
  • [GPT] vue 的 quasar 框架 在 layout 模版中 如何获取 子页面当前使用的 useMeta
     在Quasar框架中,用VueRouter的meta字段来获取子页面当前使用的useMeta。首先,您需要在路由配置中设置子页面的meta字段。例如:  constroutes=[{path:'/page',component:PageComponent,meta:{useMeta:{//在这里定义您......
  • C# WinForm开发,使用dnSpy-net-win32调试dll文件或.exe文件工具
     工具下载:https://download.csdn.net/download/haojuntu/87967457打开文件,加载需要调试文件 视图-》窗口-》模块断点,可以调试具体模块 找到要调试的模块,启动项目后,类似vs开发,可以一步步调试 ......
  • 在GPT-4时代使用Semantic Kernel构建AI Copilot问答 以及 Semantic Kernel文档更新
    SemanticKernel是一个开源SDK,可让您轻松地将OpenAI,AzureOpenAI和HuggingFace等AI服务与C#和Python等传统编程语言相结合。通过这样做,您可以创建结合两全其美的AI应用程序。SemanticKernel团队在博客上发布了2篇文章:SemanticKernelatMicrosoftBUILD2023:Highlightsf......