• 2024-12-27webflux版定时任务实现方案
    通常定时任务我们一般采用spring注解@EnableScheduling来启动,但如何与webflux响应式代码结合实现定时任务呢?下面给出了一个企业内使用的真实案例,希望能帮到你。@Component@EnableScheduling@Slf4jpublicclassTestTask{@ResourceprivateReactiveStringRedi
  • 2024-11-25本地Docker部署Neko虚拟浏览器并实现远程与好友共享网页协同办公
  • 2024-11-25部署local-path-storage
    环境:os:Centos7k8s:1个master2个nodes以下操作都是在master节点上完成1.下载配置文件cd/softwgethttps://raw.githubusercontent.com/rancher/local-path-provisioner/v0.0.30/deploy/local-path-storage.yaml 2.修改镜像文件local-path-storage.yaml因为无法访问国外的
  • 2024-09-11Attention Sinks 入门指南 - 实现无限长度文本生成的高效流式语言模型
    AttentionSinks简介AttentionSinks是一种新的注意力机制,可以让预训练语言模型生成无限长度的连贯文本,同时保持恒定的内存使用。它通过保留初始token的注意力信息(称为"注意力池"),并使用滑动窗口来处理最近的token,从而实现了高效的长文本生成。AttentionSinks
  • 2024-09-07数仓工具之:Flume
    Flume是一个日志数据抽取工具Agent:是Flume中的基本单位,一个Flume配置文件,可以有多个Agent.每一个Agent中有三个组件组成,缺一不可:1、Source来源,数据过来的地方2、channel通道传递数据用的通道,一般比较的长,一个Channel中可以存储多个数据3、Sink数据下沉的地方
  • 2024-08-24大数据技术之Flume应用案例(2)
    目录 监控端口数据官方案例步骤1:准备环境步骤2:配置FlumeAgent步骤3:启动FlumeAgent步骤4:发送数据到Flume步骤5:查看HDFS中的数据注意事项示例说明实时监控单个追加文件案例需求分析实现步骤(1)确保环境变量配置正确(2)创建flume-file-hdfs.conf
  • 2024-07-30flume使用教程
    1.启动端口  ncnode10155555监听端口  nc-l55555 job下配置文件#example.conf:Asingle-nodeFlumeconfiguration #Namethecomponentsonthisagenta1.sources=r1a1.sinks=k1a1.channels=c1 #Describe/configurethesourcea1.sources.
  • 2024-07-03一些关于flume的知识知识碎片
    Flume架构Flume概述flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力。flume的数据流由事件(Event)贯穿始终
  • 2024-05-28简单理解Flume之Channel和Sink
    ChannelMemoryChannel1,MemoryChannel将数据临时存储的到内存队列2,属性属性默认值解释capacity100队列容量,默认情况队列中最多临时存储100条数据,实际过程这个值一般被调节成30W~50WtransacCapacity100PutList向Channel发送的数据条数,实际中一般会调节成3000~5000Fil
  • 2024-03-252-Flume之Sink与Channel
    FlumeSinkHDFSSink将数据写到HDFS上。数据以文件形式落地到HDFS上,文件名默认是以FlumeData开头,可以通过hdfs.filePrefix来修改HDFSSink默认每隔30s会滚动一次生成一个文件,因此会导致在HDFS上生成大量的小文件,实际过程中,需要通过hdfs.rollInterval来修改,一般设置为36
  • 2024-03-20Flume - [03] HDFS Sink
      一、概述  将事件写入Hadoop分布式文件系统(HDFS)。目前支持创建文本和序列文件。支持两种文件类型的压缩。可以根据经过的时间、数据大小或事件数周期性地滚动文件(关闭当前文件并创建文件)。根据事件起源的时间戳或机器等属性对数据进行存储/分区。HDFS目录路径可能包好
  • 2024-03-20Flume - [04] Hive Sink
      一、概述  HIVESink将包含分割文本或JSON数据的事件直接流到Hive表或分区中。事件是使用Hive事务编写的。一旦一组事件被提交到Hive,它们就会立即对hive查询可见。流到其中的分区可以是预先创建的,也可以是可选的,如果它们丢失了,可以创建它们。传入事件数据中的字段映射到
  • 2024-02-29详解海量日志传输框架 Flume
    什么是Flume本次我们来聊一聊Flume,它是Cloudera提供的一个高可用、高可靠、分布式的日志收集框架,用于海量日志的采集、聚合以及传输。Flume在生产上使用最多的场景就是,实时读取服务器本地磁盘的数据,然后将数据写入到HDFS。Flume基础架构再来看看Flume的基础架构:Ag
  • 2024-01-17Flume安装配置
    简介ApacheFlume是一个分布式、可靠、高可用的服务,用于有效地收集、聚合和移动大规模数据。Flume主要用于大数据环境下的日志收集和数据传输,能够帮助用户实现数据流的可靠传输和集中处理。flume安装配置解压安装包tar-zxvfapache-flume-1.9.0-bin.tar.gz-C/opt/module
  • 2023-10-08造轮子之日志
    在日常使用中日志也是我们必不可少的一环,在原生日志组件中支持的日志驱动比较少,所以我们需要使用一些三方日志组件来扩展我们的日志记录。集成Serilog三方日志组件有很多,如NLOG,LOG4NET等等,这里个人习惯,使用Serilog。Serilog的集成方式非常简单。安装Nuget包Serilog.AspNetCor
  • 2023-09-19Serilog实战
    提问快速上手Serilog步骤回答引用Serilog.Sinks.AsyncSerilog.Sinks.FileSerilog.Sinks.Console2.配置appsetting.sjon加入如下项"Serilog":{"MinimumLevel":{"Default":"Debug","Override":{&
  • 2023-08-30flume采集目录到HDFS案例:
    (1)采集需求:某服务器的某特定目录下,会不断产生新的文件,每当有新文件出现,就需要把文件采集到HDFS中去(2)根据需求,首先定义以下3大要素a):采集源,即source——监控文件目录:spooldirb):下沉目标,即sink——HDFS文件系统:hdfssinkc):source和sink之间的传递通道——chann
  • 2023-08-0125-Flume
    1.概述&入门Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。其最主要的作用就是实时读取服务器本地磁盘的数据,将数据写入到HDFS。1.1基础架构a.AgentFlume的部署单元,本质是一个JVM进程,Agent内
  • 2023-07-14flume知识点总结
    flume知识点总结1.flume作用:从各种各样的数据源采集数据(读数据,缓存数据,写数据)到各种各样的文件系统中,如kafka 2.flume的采集程序:agent(包括source组件,channel组件,sink组件) 3.flume基本配置:(dir)#定义三大组件的名称ag1.sources=source1ag1.sinks=sink1ag1.channels=c
  • 2023-04-07Serilog.Sinks.Elasticsearch 写username到 ES失败
    Usingthelib:Serilog.Sinks.ElasticsearchandECS-dotnet whichprovidetheecsformat,wecanwritelogintoesinECSformat.Ihavebeenabletooveralllinktrace, now,Iwanttorecordtheusernameifuserhaslogged.Astonoshingly,sometime,itwor
  • 2023-03-17WebApi 单文件发布Serilog 失效
    提问WebApi单文件发布Serilog失效怎么解决回答配置文件Appsetting.json增加Using块"Using":["Serilog.Sinks.Console","Serilog.Sinks.File"],示例{"Seril
  • 2023-03-10如何在NET 6.0使用结构化的日志系统
     在我们的系统里面,有一项技术是必须使用的,那就是日志记录。我们在调试系统或者跟踪系统运行情况,都可以通过日志了解具体的情况。在项目开发中,我们有可能使用系统本身所带