• 2024-07-04doris 数据库与mysql的不同之处
    1.doris与mysqldoris可以使用mysql驱动进行连接,也支持mysql的部分语法。2.具体分析 清空表数据在mysql中,清空表数据有两种方式:一种是deletefromtable_name,一种是truncatetabletable_name。而在doris中,清空表数据只能使用truncatetabletable_name。deletefrom
  • 2024-06-18springboot 使用 doris-streamloader 到doris 防止批量更新 事务卡主
    背景:使用mybatis批量实时和更新doris时经常出现连接不上的错误,导致kafka死信队列堆积很多滞后消费https://doris.apache.org/zh-CN/docs/2.0/ecosystem/doris-streamloader/packagecom.jiaoda.sentiment.data.etl.service.update;importcn.hutool.core.text.CharSequenc
  • 2024-06-17Doris开发手记5:一场链接引发“吊诡”的性能问题
    近期正在对Doris的性能问题展开排查,发现了一个极为“吊诡”的函数执行性能问题。经过一系列的CPU热点代码分析之后,发现“罪魁祸首”居然是libtoolchain中的静态库导致的。借用本篇手记记录下问题的发现,希望记录下一些对于C/C++程序链接问题的分析思路,也希望读者也能有所收获。
  • 2024-06-12使用spark-sql处理Doris大表关联
    背景最近项目上有一个需求,需要将两张表(A表和B表)的数据进行关联并回写入其中一张表(A表),两张表都是分区表,但是关联条件不包括分区字段。分析过程方案一最朴素的想法,直接关联执行,全表关联,一条SQL搞定全部逻辑。想法越简单,执行越困难。由于数据量大,服务器规模较小,尽管各台服务
  • 2024-06-07doris配置自动拉起服务-supervisor
    服务自动拉起本文档主要介绍如何配置Doris集群的自动拉起,保证生产环境中出现特殊情况导致服务宕机后未及时拉起服务从而影响到业务的正常运行。Doris集群必须完全搭建完成后再配置FE和BE的自动拉起服务。Supervisor配置Doris服务​Supervisor具体使用以及参数解
  • 2024-05-28datax 抽取hive表到doris
    datax读取hive表有两种方式,一种是读取hdfs文件路径HDFSReader,因为hive是存储在hdfs上。第二种是读取hive表RDBMSReader。HDFSReader{"job":{"setting":{"speed":{"channel":3},"
  • 2024-05-26使用benthos 实现stream load入库到doris
    下面给出yaml配置,只有input和output,中间可以自定义数据转换pipeline当前的数据从kafka中取出来就是json格式,所以不需要进行处理转换,输出段使用http_client组件,配置批处理提高吞吐量input:broker:copies:9inputs:-kafka:addresses:
  • 2024-05-24Apache DorisDB 线上部署
    ApacheDorisDB线上部署一、机器资源(初始)机器IPHostname内存CPU磁盘172.16.203.151dorisdb203-15116g4核500G172.16.203.152dorisdb203-15216g4核500G172.16.203.153dorisdb203-15316g4核500G二、角色分配机器IP角色172.16.203.15
  • 2024-05-24Doris:数据导入导出
    数据导入导入(Load)功能就是将用户的原始数据导入到Doris中。导入成功后,用户即可通过Mysql客户端查询数据。为适配不同的数据导入需求,Doris系统提供了6种不同的导入方式(Broker、Stream、Insert、Multi、Routine、S3)。每种导入方式支持不同的数据源,存在不同的使用方式(异步,
  • 2024-05-20Doris:概念与基础操作
    Doris一款现代化的MPP分析性数据库产品支持亚秒级响应支持10PB以上数据集兼容MySQL协议基础概念doris有3种基础表:明细表(Duplicate):一张普普通通的表,doris默认表模式,支持数据预排序主键表(Unique):一种特殊的聚合表,如果主键重复,会自动更新其他值聚合表(Aggregate):聚合模
  • 2024-05-16首次尝试SeaTunnel同步Doris至Hive?这些坑你不能不避
    笔者使用SeaTunnel2.3.2版本将Doris数据同步到Hive(cdh-6.3.2)首次运行时有如下报错,并附上报错的解决方案:java.lang.NoClassDefFoundError:org/apache/hadoop/hive/metastore/api/MetaExceptionjava.lang.NoClassDefFoundError:org/apache/thrift/TBasejava.lang.NoClassDe
  • 2024-05-11Doris、StarRocks 压测对比
    先说结论:0、本次测试,未调优二者的参数,开箱起服务,直接测试的,部署架构一致。1、在单表查询下,StarRocks在部分场景下优于Doris,但是二次查询,二者不分伯仲。2、在多表查询下,仅在一个场景下Doris速度逊于StarRocks,大部分场景是Doris优于StarRocks的。3、在cpu和内存的使用上,dori
  • 2024-04-25FLINKCDC 3.0整库同步MYSQL至DORIS(FLINK1.18): 历程
    大数据技术涉及组件较多,各个环境较DEMO又不尽相同,所以参照DEMO进行,任然很多报错信息出现。如下报错处理,尽供参考:1.创建同步配置文件################################################################################Description:SyncMySQLalltablestoDoris#########
  • 2024-04-25Doris安装使用
    1.整体架构2.安装部署2.1资源规划实例名称端口名称默认端口通信方式说明FEhttp_port8030->8034用户/FE<-->FEFE上的http端口web管理界面BEwebserver_port8040->8041BE<-->FEBE上的http端口跟hadoop端口号冲突FEquery_port9030用户<-
  • 2024-03-21OLAP数据库选型指南:Doris与ClickHouse的深入对比与分析
    码到三十五:个人主页心中有诗画,指尖舞代码,目光览世界,步履越千山,人间尽值得!在当今数据驱动的时代,数据的存储、处理和分析变得尤为重要。为了满足这一需求,市场上涌现出了许多优秀的数据处理和分析工具。其中,Doris和ClickHouse是两个备受关注的开源项目。本
  • 2024-03-13doris集群环境部署
    环境:OS:Centos7DB:doris2.1.1192.168.1.101febebroker192.168.1.103febebroker192.168.1.105febebroker 说明:doris2.0开始fe、be、brokser都是使用同一个安装包,解压后分别有fe、be、broker目录1.获取安装介质https://doris.apache.org/zh-CN/download/我这里下
  • 2024-03-11慢慢学doris之【窗口函数】
    窗口函数也叫分析函数,可以用于自定义额外的查询字段,用于分析查询出来的数据。 举例说明,比如说现在有一个资讯浏览量的查询结果 其中sum_counts字段是根据日期分组然后累加的点击量,一般情况下,查询到这里也就差不多了。但是使用窗口函数还可以进一步分析得到的数据。比如,使用
  • 2024-03-11慢慢学doris之【宽表】
    简单整理了一些关于doris宽表的一些知识点。 宽表的定义:宽表是指业务主体相关的指标、维度、属性关联在一起的一张数据库表。 宽表的优势:组织相关和相似数据,采用明细宽表,减少数据扫描,提高明细数据表的易用性,以及查询性能。 组建宽表的注意事项:一张宽表需要有一个大致的
  • 2024-02-25Docker-常见报错和解决办法
    1、问题1: error:RPCfailed;result=18,HTTPcode=200MiB|181.00KiB/s##gitclonehttps://github.com/apache/doris.gitCloninginto'doris'...remote:Enumeratingobjects:505750,done.remote:Countingobjects:100%(30319/30319),done.remote:C
  • 2024-02-24Doris Fe在Mac上搭建开发环境踩坑记录
    1.拉取代码到本地gitclonehttps://github.com/apache/doris.git2.参考Doris的文档,但别全信(信了你就上当了)参考第一篇https://doris.apache.org/zh-CN/community/developer-guide/fe-idea-dev/这里的环境准备jdk必须1.8及以上maven必须3.5.4及以上(否则会报错,不过错
  • 2024-02-17基于Doris构建亿级数据实时数据分析系统
    转载至我的博客https://www.infrastack.cn,公众号:架构成长指南背景随着公司业务快速发展,对业务数据进行增长分析的需求越来越迫切,与此同时我们的业务数据量也在快速激增、每天的数据新增量大概在30w左右,一年就会产生1个亿的数据,显然基于传统MySQL数据库已经无法支撑满足以
  • 2024-02-07当我们一起走过 2023|Apache Doris 年度时刻盘点
    2024年的第一个月已经彻底过去,2023年的回顾总结才姗姗来迟。在过去一年的大多数时间里,我们一直处于忙碌的状态中,紧锣密鼓的代码研发、高速推进的版本迭代、行程紧密的全国之行,众多社区用户与开发者皆是见证。越是忙碌,在年末的这场回顾就越难能可贵。在2024年开端,我们挑选出了
  • 2024-02-01hive doris impala
    Hive、Doris(之前称为 Apache Doris 或 Pala),和 Impala 是三种常用于大数据和分析领域的技术,它们各自有不同的特点和用途:Hive- 概述:Hive 是一个建立在 Hadoop 上的数据仓库工具,用于数据摘要、查询和分析。它将 SQL 查询转换为 MapReduce、Tez 或 Spark 作业来执行
  • 2024-01-29百川终入海 ,一站式海量数据迁移工具 X2Doris 正式发布
    在大数据分析领域,ApacheDoris作为广受认可的开源实时数据仓库,已经在越来越多行业用户的真实业务场景中得到广泛应用,成为许多企业数据分析基础设施的重要基座。尤其在过去一年多的时间里,越来越多企业选择基于ApacheDoris进行升级,将过去基于Hadoop体系的离线数据仓库进行实时
  • 2024-01-29Apache Doris 2.0.4 版本正式发布
    亲爱的社区小伙伴们,ApacheDoris2.0.4版本已于2024年1月26日正式发布,该版本在新优化器、倒排索引、数据湖等功能上有了进一步的完善与更新,使ApacheDoris能够适配更广泛的场景。此外,该版本进行了若干的改进与优化,以提供更加稳定高效的性能体验。新版本已经上线,欢迎大家