首页 > 其他分享 >Databend 开源周报第 106 期

Databend 开源周报第 106 期

时间:2023-08-15 15:12:03浏览次数:55  
标签:Python h3 Catalog Hive Databend 开源 106 email

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

数据脱敏

Databend 新增数据脱敏能力。通过设定脱敏策略(Masking Policy),可以控制敏感数据的显示或访问方式,从而在允许授权用户与数据交互的同时保护机密性。

-- Create a masking policy
CREATE MASKING POLICY email_mask
AS
  (val string)
  RETURNS string ->
  CASE
  WHEN current_role() IN ('MANAGERS') THEN
    val
  ELSE
    '*********'
  END
  COMMENT = 'hide_email';

-- Associate the masking policy with the 'email' column
ALTER TABLE user_info MODIFY COLUMN email SET MASKING POLICY email_mask;

数据脱敏 需要升级至 企业版 。如需了解升级信息,请联系 Databend 团队

如果您想了解更多信息,请查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

为 Python Binding 支持 show() 方法

在 PySpark 、DuckDB、DataFusion 的 Python 绑定/包中均支持了 show() 方法,用于输出前 n 行结果。

Databend 最近也通过 PyO3 为 Python Binding 实现了相应的支持,代码片段如下。

    #[pyo3(signature = (num=20))]
    fn show(&self, py: Python, num: usize) -> PyResult<()> {
        let blocks = self.collect(py)?;
        let bs = self.get_box();
        let result = blocks.box_render(num, bs.bs_max_width, bs.bs_max_width);

        // Note that println! does not print to the Python debug console and is not visible in notebooks for instance
        let print = py.import("builtins")?.getattr("print")?;
        print.call1((result,))?;
        Ok(())
    }

如果您想了解更多信息,请查看下面列出的资源。

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持分布式 REPLACE INTO
  • 支持用于计算向量 2 范数(欧几里得范数)的算符 <->
  • 新增地理位置函数:h3_to_center_child / h3_exact_edge_length_m / h3_exact_edge_length_km / h3_exact_edge_length_rads / h3_num_hexagons / h3_line / h3_distance / h3_hex_ring h3_get_unidirectional_edge
  • 阅读文档 Docs | ALTER TABLE COLUMN 了解如何利用添加、转换、重命名、更改或删除列等操作修改表。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

为 Hive Catalog 添加存储后端支持

此前 Databend 的 Hive Catalog 实现缺反自己的存储后端配置,只能回滚到 Default Catalog 对应的存储后端。导致当 Hive MetaStore 指向的存储服务与 Default Catalog 配置不一致时无法读取数据。

现在计划为 Hive Catalog 引入 CONNECTION 选项,允许对存储后端进行配置,解决异构存储下的 Hive 加速问题。

CREATE CATALOG hive_ctl
TYPE=HIVE
HMS_ADDRESS='127.0.0.1:9083'
CONNECTION=(
    URL='s3://warehouse/'
    AWS_KEY_ID='admin'
    AWS_SECRET_KEY='password'
    ENDPOINT_URL='http://localhost:9000'
);

Issue #12407 | Feature: Add storage support for Hive catalog

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:https://github.com/datafuselabs/databend/releases

Contributors

非常感谢贡献者们在本周的卓越工作。

image.png

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

标签:Python,h3,Catalog,Hive,Databend,开源,106,email
From: https://www.cnblogs.com/databend/p/17631336.html

相关文章

  • K8S故障注入混沌工程开源平台ChaosMesh
    ChaosMesh是针对K8S的云原生混沌工程开源平台。可以用它方便地模拟开发、测试、生产环境中可能出现的各种异常情况,发现系统中潜在的问题。创建者研发支持混合事务与分析处理的开源数据库TiDB的PingCap公司一句话介绍ChaosMesh是针对K8S的云原生开源混沌工程平台。关键特性......
  • 小米发布全新CyberDog 2,体型接近真实小型犬,超80%开源率,100+接口开放
    小米发布全新CyberDog2,体型接近真实小型犬,超80%开源率,100+接口开放2023-08-1508:01:28 来源: 金融界分享到:8月14日,小米发布全新仿生四足机器人CyberDog2。该款产品在继承前代优势的基础上,进行了全面的技术升级:它配备了新一代小米自研高性能电机,提供了更为强大的动态响应......
  • 字节码的终极应用-GitHub高星开源APM项目之Pinpoint
    大家好,我们前面的章节javaagent以及一些字节码修改框架ASM和Javassist,以及他们的一些简单的应用场景.今天重点给大家介绍一款github上开源的APM分布式链路监控产品--Pinpoint.Pinpoint是什么?Pinpoint是一个开源的APM(ApplicationPerformanceManagement/应用性能管理......
  • 社区团购商城拼团秒杀接龙分销团长小程序开源版开发
    社区团购商城拼团秒杀接龙分销团长小程序开源版开发功能介绍:商品管理:增加商品-商品列表-商品分类-商品单/多规格-商品标签订单管理:订单列表-订单挑选-订单导出-订单打印-批量发货-商品评价会员管理:会员列表-会员挑选-会员导出-虚拟会员-会员等级-会员分组-会员分销团长管理:团长列表......
  • 开源数据库Mysql_DBA运维实战 (DCL/日志)
    SQL(StructuredQueryLanguage即结构化查询语言)a.DDL语句 数据库定义语言:数据库,表,视图,索引,存储过程,函数,创建删除ALTER(CREATEDROPALTER) b.DML语句数据库操纵语言:插入数据INSERT、删除数据DELETE、更新数据UPDATEc.DQL语句 数据库查询语言:查询数据SELECTd.DCL语句数......
  • OpenHarmony Meetup 广州站 OpenHarmony正当时—技术开源
     招募令 OpenHarmony Meetup 广州站 火热招募中,等待激情四射的开发者,线下参与OpenHarmonyMeetup线下交流 展示前沿技术、探讨未来可能、让你了解更多专属OpenHarmony的魅力 线下参与,先到先得,仅限20个名额! 报名截止时间8月23日24:00点 1、可获得惊喜开发......
  • ubuntu同一开源库多版本安装使用注意事项
    ubuntu在编译不同程序时有可能需要不同版本的开源库,为不影响一写自带库版本的使用,可将其他版本的库安装在/usr和/usr/local以外的其他路径,如在主目录下新建libs文件夹。在使用find_package前通过设置XXX_DIR或CMAKE_PREFIX_PATH来选择新安装的版本。方式1:set(XXX_DIR"path/to/your......
  • M3U8剪切板辅助下载工具软件SharpClipboard开源了
    M3U8剪切板辅助下载工具软件SharpClipboard开源了。大家可以据此改造出自己需要的功能。giteehttps://gitee.com/binghe021/sharp-clipboardgithubhttps://github.com/binghe021/SharpClipboard......
  • ChatGPT 问答00013 开源项目QGIS
    QGIS(全称QuantumGIS)是一个自由开源的地理信息系统(GIS)软件,它提供了一套功能强大的地图制作、空间分析和数据管理工具。以下是关于QGIS开源项目的一些信息:项目介绍:QGIS是由一个全球性社群共同开发的自由软件项目。它的目标是为用户提供一个易于使用、跨平台、功能丰富的GIS软件......
  • 最流行的开源 LLM (大语言模型)整理
    本文对国内外公司、科研机构等组织开源的LLM进行了全面的整理。LargeLanguageModel(LLM)即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。所谓"语言模型",就是只用来处理语言文字(或者符号体系)的AI模......