首页 > 其他分享 >duckdb

duckdb

时间:2023-10-26 17:33:44浏览次数:21  
标签:execute df %% duckdb time import conn

# %%
import pandas as pd
import glob
import time
import duckdb
# %%
conn = duckdb.connect()
# %%
cur_time = time.time()
df = conn.execute(
    """
            select * from read_csv_auto('*.csv',header=True)
            limit 10
            """
).df()
print(f"time:{(time.time()-cur_time)}")
print(df)
# %%
conn.register("df_view", df)
# %%
conn.execute("describe df_view").df()
# %%
df.isnull().sum()
df = df.dropna(how="all")
# %%
conn.execute("select count(1) from df").df()
# %%
conn.execute(
    """
with a as (select * from df)
             select * from a
             """
).df()
# %%
conn.execute("copy (from read_csv_auto('*.csv',header=True)) to 'aaa.parquet'")
# %%
conn.execute("copy (from 'aaa.parquet') to 'a.csv'(DELIMITER ',', HEADER)")
# %%
conn.execute("SHOW TABLES;").df()
# %%
import pandas as pd
import glob
import time
import duckdb
import sqlite3
conn = duckdb.connect()
df = conn.execute(
    """
            select * from read_csv_auto('a.csv',header=True)
            """
).df()
conn3 = sqlite3.connect('database.db')
df.to_sql('table_name', conn3, if_exists='replace', index=False)
conn3.close()

标签:execute,df,%%,duckdb,time,import,conn
From: https://www.cnblogs.com/yzpopulation/p/17789919.html

相关文章

  • SQL_Duckdb-数据库一些介绍
    数据处理数据处理的本质是:针对不同需求,读取并标准化数据集后,施加不同的变换组合shell-Unix管道也有缺点——只能进行线性的流水线排布SQL-关系型数据库是数据处理系统的集大成者。spark数据集和算子一层层细化数据库基本组件对于一个数据库来说,解析器......
  • SQL_duckdb分析nuScenes数据
    使用duckdb来了解数据usingself-drivingcardatafromthenuScenesdataset,andwritingPythoncodetovisualizeitsroute,IMUacceleration,andperceivedobjects.传统方法:nuScenes官方提供了一个数据集开发工具nuscenes-devkit,封装了数据读取、索引、......
  • dbt-duckdb dbt duckdb 强大的adapter
    dbt-duckdb是一个dbt扩展,功能很强大,同时社区也有相关的文章,使用duckdb替换spark处理一些数据的pipeline因为duckdb具有很不错的olap性能,同时支持不少外部数据集成(比如s3,http,parquet,pg。。。。)dbt-duckdb扩展使用起来很方便,而且对于dbt的兼容是很不错的,以下是老外的一个实践......
  • 数据库_DuckDB_概念梳理和发展趋势
    数据库大致类型C/S关系型数据库引擎高并发数据量超大网络与应用程序分离 MariaDBMySQL,Oracle,PostgreSQL,或者SQLServer mysql:多线程SQL服务器组成的服务器/客户端体系结构-可伸缩性,安全性 PostgreSQL使用称为多版本并发控制或MVCC的技术来维护数据......
  • 数据库_DuckDB—使用阶段和使用方式
    01.图像界面操作数据库duckdb没有服务器端,它是用文件来存储数据,所以我们只需要安装个图形化的管理软件DBeaver就可以直接使用在线安装Connection驱动离线安装Connection驱动Maven库<!--https://mvnrepository.com/artifact/org.duckdb/duckdb_jdbc-->......
  • 数据库_duckdb_本地访问远程数据_ aws s3
    Extensions扩展FullTextSearchHTTPFSJSONPostgresScannerSQLiteScannerpython3-c"importduckdb;duckdb.query('INSTALLhttpfs;');"Loadinganextensionfromlocalstorage 参考https://duckdb.org/docs/extensions/overviewh......
  • 嵌入式数据库-分析型数据库-DuckDB
    数据库按照是否是关系型关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足处理在线的实时交易事务场景,......
  • [​DuckDB] 多核算子并行的源码解析
    DuckDB是近年来颇受关注的OLAP数据库,号称是OLAP领域的SQLite,以精巧简单,性能优异而著称。笔者前段时间在调研Doris的Pipeline的算子并行方案,而DuckDB基于论文《Morsel-Driv......