首页 > 其他分享 >Databend 开源周报第 110 期

Databend 开源周报第 110 期

时间:2023-09-12 18:45:47浏览次数:44  
标签:count 04 databend Databend 开源 110 2022 result

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

使用 BendSQL 管理 Stage 中的文件

Databend 推荐使用 PRESIGN 来将文件上传到 stage 中或者将文件下载到本地。PRESIGN 会生成一个带有时间限制的预签名 URL ,提供了一种安全高效的数据传输方式,并且减少文件传输的延迟。

对于 BendSQL 客户端的用户而言,可以利用 PUT 命令将文件上传到 Stage 并使用 GET 命令下载 Stage 中的文件。

root@localhost:8000/default> PUT fs:///books.parquet @~

PUT fs:///books.parquet @~

┌───────────────────────────────────────────────┐
│                 file                │  status │
│                String               │  String │
├─────────────────────────────────────┼─────────┤
│ /books.parquet                       │ SUCCESS │
└───────────────────────────────────────────────┘

GET @~/ fs:///fromStage/

┌─────────────────────────────────────────────────────────┐
│                      file                     │  status │
│                     String                    │  String │
├───────────────────────────────────────────────┼─────────┤
│ /fromStage/books.parquet                      │ SUCCESS │
└─────────────────────────────────────────────────────────┘

如果您想了解更多信息,请查看下面列出的资源。

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

在 Jupyter Notebook 中使用 Databend Python Binding

Databend 提供 Python Binding ,无需部署 Databend 实例即可使用,DataFrame 也可以自由转换到 Polars 和 Pandas 格式,方便和数据科学工具集成使用。

只需要执行下面的命令安装即可:

pip install databend

下面的程序展示了如何在 Jupyter Notebook 中使用 Databend Python Binding ,并利用 matplotlib 绘制条形图。

# Create a table in DataBend
ctx.sql("CREATE TABLE IF NOT EXISTS user (created_at Date, count Int32)")

# Create a table in DataBend
ctx.sql("CREATE TABLE IF NOT EXISTS user (created_at Date, count Int32)")

# Insert multiple rows of data into the table
ctx.sql("INSERT INTO user VALUES ('2022-04-01', 5), ('2022-04-01', 3), ('2022-04-03', 4), ('2022-04-03', 1), ('2022-04-04', 10)")

# Execute a query
result = ctx.sql("SELECT created_at as date, count(*) as count FROM user GROUP BY created_at")

# Display the query result
result.show()

# Import libraries for data visualization
import matplotlib.pyplot as plt

# Convert the query result to a Pandas DataFrame
df = result.to_pandas()

# Create a bar chart to visualize the data
df.plot.bar(x='date', y='count')
plt.show()

如果您想了解更多信息,请查看下面列出的资源。

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

支持使用 JavaScript 创建 UDF

PR #12729 | feat: implement udf server in databend 预计会在本周进行合并。这意味着 Databend 即将支持使用 Python 创建用户自定义函数。

CREATE FUNCTION [IF NOT EXISTS] <udf_name> (<arg_type>, ...) RETURNS <return_type> LANGUAGE <language> HANDLER=<handler> ADDRESS=<udf_server_address>

我们期望在这个 PR 的基础上提供对多种语言 UDF 的支持,JavaScript 可能是值得尝试的选项之一。

Issue #12746 | Feature: support javascript udf

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:https://github.com/datafuselabs/databend/releases

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

标签:count,04,databend,Databend,开源,110,2022,result
From: https://www.cnblogs.com/databend/p/17697510.html

相关文章

  • 国内几款开源工作流引擎优缺点对比
    1.ccflow优点:易于集成、使用方便、支持工作流设计和自定义扩展、稳定性好,多种场景都可以配置出来。缺点:功能点比较多,学习需要一定的成本。 2.Activiti优点:适合复杂的业务场景、支持分布式部署和高可用性、文档和社区支持丰富。缺点:配置较为复杂、使用语法较为繁琐。 3.Jbpm优......
  • 外汇110网:曝光宣称多个监管的SSIM阳光市场已跑路
    近期,有多位投资者向我站爆料称SSIM阳光市场跑路了,平台官网无法打开,MT4登录不了,投资者们出金无门。其中一位投资者表示,SSIM阳光市场从今年三月份开始就直接不给出金了,也没有负责人出来说明情况。SSIM虚假宣传多个监管,FX110网一年多前已警示SSIM阳光市场平台域名成立时间为2022年3月2......
  • 多场景PAI-Diffusion中文模型家族大升级,12个模型、2个工具全部开源
    作者:段忠杰、刘冰雁、汪诚愚、邹心怡、黄俊概述在过去几年中,随着AI生成内容(AIGeneratedContent,AIGC)的快速发展,StableDiffusion模型在该领域崭露头角。阿里云机器学习PAI团队为推动这一领域的发展,参考了StableDiffusion的模型结构,结合中文语言的特点,通过大量对模型预训练数据的......
  • 十大Material Design开源项目
    摘要:本文详细介绍了十个MaterialDesign开源项目,从示例、FAB、菜单、动画、Ripple到Dialog,看被誉为“Google第一次在设计语言和规范上超越了Apple”的MaterialDesign是如何逐渐成为App的一种全新设计标准。介于拟物和扁平之间的MaterialDesign自面世以来,便引起了很多人的......
  • AI艺术写真头像二维生成分销公众号小程序开源版开发
    AI艺术写真头像二维生成分销公众号小程序开源版开发以下是AI艺术写真头像二维生成分销公众号小程序的功能列表:用户注册和登录功能:用户可以通过手机或邮箱注册和登录账号。AI艺术写真头像生成功能:用户可以上传照片,通过AI技术生成艺术风格的写真头像。二维生成功能:用户可以将生成的艺......
  • DC/DC电源升压模块直流线性可调高压电压控制输出升压电源5v12v24v转0-100V/110V/200V/
    特点●效率高达70%以上●1*2英寸标准封装●正负电压输出●价格低●电压控制,输出电压随控制电压线性变化●工作温度:-40℃~+85℃●阻燃封装,满足UL94-V0要求●温度特性好●可直接焊在PCB上应用GRA  系列模块电源是一种DC-DC升压变换器。该模块电源的输入电压分为:4.5~9......
  • 开源即时通讯(IM)项目OpenIM源码部署流程
    由于OpenIM依赖的组件较多,开发者需求不一,导致OpenIM部署一直被人诟病,经过几次迭代优化,包括依赖的组件compose的一键部署,环境变量设置一次,全局生效,以及脚本重构,目前OpenIM部署比较丝滑,特写文章分享给大家。OpenIM是什么OpenIM不是一个独立的聊天产品,它不像telegram、S......
  • 程序员 AI 助手来了,蚂蚁正式开源代码大模型 CodeFuse
    9月8日,外滩大会分论坛上,蚂蚁集团首次开源了代码大模型CodeFuse。支付宝小程序云负责人李铮宣布CodeFuse正式开源这是蚂蚁自研的代码生成专属大模型,根据开发者的输入提供智能建议和实时支持,帮助开发者自动生成代码、自动增加注释,自动生成测试用例,修复和优化代码等,以提升研发......
  • OSCAR开源专访 | 企业内源最大的挑战在于改变封闭思维和竞争观念——智网创新中心张东
    开源作为一种开放的、无边界的新型协作模式,是数字经济创新、开放、共享、可持续发展的源头活水。开源的大获成功也启发不少企业将开源软件开发的经验教训应用到组织内部中来,是谓内源。当前内源建设已成为企业提升研发效率、释放产业效能的重要手段,在通信行业亦是如此,同时各项能力建......
  • SSIM阳光市场已跑路!FX110网一年多前曾警示
    近期,有多位投资者向我站爆料称SSIM阳光市场跑路了,平台官网无法打开,MT4登录不了,投资者们出金无门。其中一位投资者表示,SSIM阳光市场从今年三月份开始就直接不给出金了,也没有负责人出来说明情况。SSIM虚假宣传多个监管,FX110网一年多前已警示SSIM阳光市场的平台域名成立时间为2022年3......