首页 > 数据库 >[转帖]oracle导出千万级数据为csv格式

[转帖]oracle导出千万级数据为csv格式

时间:2024-01-15 12:22:34浏览次数:39  
标签:DBMS -- 导出 千万级 转帖 FILE SQL oracle csv

当数据量小时(20万行内),plsqldev、sqlplus的spool都能比较方便进行csv导出,但是当数据量到百万千万级,这两个方法非常慢而且可能中途客户端就崩溃,需要使用其他方法。

一、 sqluldr2工具

1. 优缺点

  • 优点:高效;支持功能较多;用户只需有对应表查询权限;可以在从库执行
  • 缺点:目前已没有再维护,只能找到基于oracle 10.2的版本(高版本目前还可以用);密码必须要跟在用户名后面输,安全性不足

2. 下载安装

  • 百度云链接:https://pan.baidu.com/s/1V8eqyyYsbJqQSD-Sn-RQGg 提取码:6mdn

下载完后并解压会生成4个文件

  • sqluldr2.exe  用于32位windows平台
  • sqluldr264.exe  用于64位windows平台
  • sqluldr2_linux32_10204.bin  用于linux32位操作系统
  • sqluldr2_linux64_10204.bin  用于linux64位操作系统

Windows的可以直接用,Linux的需要加执行权限。

chmod +x sqluldr2_linux64_10204.bin

3. 导出csv格式数据

/data/bak目录需要预先建好,oracle用户可写。如果查询语句较复杂,可以建成一个临时视图,通过视图导出,避免写一堆语句。

./sqluldr2_linux64_10204.bin myuser/xxxxxxx query="select * from tmp1201_all_v" head=yes file=/data/bak/tmp1201_all_v.csv

测试700万左右数据导出约12分钟(15:47开始执行),主要是视图查询较慢,导出表应该更快。

二、 利用存储过程

1. 优缺点

  • 优点:效率较高;原生sql、目前无版本问题;可自行增加需要功能
  • 缺点:需要sys权限;只能在主库执行;功能相对较少

2. sys用户建存储过程

代码转载自 https://blog.csdn.net/lxp90/article/details/80926236

  1. CREATE OR REPLACE PROCEDURE SQL_TO_CSV
  2. (
  3. P_QUERY IN VARCHAR2, -- PLSQL文
  4. P_DIR IN VARCHAR2, -- 导出的文件放置目录
  5. P_FILENAME IN VARCHAR2 -- CSV名
  6. )
  7. IS
  8. L_OUTPUT UTL_FILE.FILE_TYPE;
  9. L_THECURSOR INTEGER DEFAULT DBMS_SQL.OPEN_CURSOR;
  10. L_COLUMNVALUE VARCHAR2(4000);
  11. L_STATUS INTEGER;
  12. L_COLCNT NUMBER := 0;
  13. L_SEPARATOR VARCHAR2(1);
  14. L_DESCTBL DBMS_SQL.DESC_TAB;
  15. P_MAX_LINESIZE NUMBER := 32000;
  16. BEGIN
  17. --OPEN FILE
  18. L_OUTPUT := UTL_FILE.FOPEN(P_DIR, P_FILENAME, 'W', P_MAX_LINESIZE);
  19. --DEFINE DATE FORMAT
  20. EXECUTE IMMEDIATE 'ALTER SESSION SET NLS_DATE_FORMAT=''YYYY-MM-DD HH24:MI:SS''';
  21. --OPEN CURSOR
  22. DBMS_SQL.PARSE(L_THECURSOR, P_QUERY, DBMS_SQL.NATIVE);
  23. DBMS_SQL.DESCRIBE_COLUMNS(L_THECURSOR, L_COLCNT, L_DESCTBL);
  24. --DUMP TABLE COLUMN NAME
  25. FOR I IN 1 .. L_COLCNT LOOP
  26. UTL_FILE.PUT(L_OUTPUT,L_SEPARATOR || '"' || L_DESCTBL(I).COL_NAME || '"'); --输出表字段
  27. DBMS_SQL.DEFINE_COLUMN(L_THECURSOR, I, L_COLUMNVALUE, 4000);
  28. L_SEPARATOR := ',';
  29. END LOOP;
  30. UTL_FILE.NEW_LINE(L_OUTPUT); --输出表字段
  31. --EXECUTE THE QUERY STATEMENT
  32. L_STATUS := DBMS_SQL.EXECUTE(L_THECURSOR);
  33. --DUMP TABLE COLUMN VALUE
  34. WHILE (DBMS_SQL.FETCH_ROWS(L_THECURSOR) > 0) LOOP
  35. L_SEPARATOR := '';
  36. FOR I IN 1 .. L_COLCNT LOOP
  37. DBMS_SQL.COLUMN_VALUE(L_THECURSOR, I, L_COLUMNVALUE);
  38. UTL_FILE.PUT(L_OUTPUT,
  39. L_SEPARATOR || '"' ||
  40. TRIM(BOTH ' ' FROM REPLACE(L_COLUMNVALUE, '"', '""')) || '"');
  41. L_SEPARATOR := ',';
  42. END LOOP;
  43. UTL_FILE.NEW_LINE(L_OUTPUT);
  44. END LOOP;
  45. --CLOSE CURSOR
  46. DBMS_SQL.CLOSE_CURSOR(L_THECURSOR);
  47. --CLOSE FILE
  48. UTL_FILE.FCLOSE(L_OUTPUT);
  49. EXCEPTION
  50. WHEN OTHERS THEN
  51. RAISE;
  52. END;
  53. /

3. 创建导出目录

/data/bak目录需要预先建好,oracle用户可写。如果查询语句较复杂,可以建成一个临时视图(sys用户下),通过视图导出,避免写一堆语句。

create or replace directory OUT_PATH_TEMP as '/data/bak'; 

4. 执行存储过程

  1. begin
  2. sql_to_csv('select * from tmp1201_all_v','OUT_PATH_TEMP','tmp1201_all_v.csv');  
  3. end;
  4. /

测试700万左右数据导出约23分钟,主要是视图查询较慢,导出表应该更快。

参考

oracle存储过程(将表导出成csv)_菜鸟冲锋号的博客-CSDN博客_oracle to csv

sqluldr2 学习心得 - 蒙奇D杰 - 博客园

【Oracle】oracle sqluldr2工具使用方法 - 简书

文章知识点与官方知识档案匹配,可进一步学习相关知识MySQL入门技能树数据库组成77575 人正在系统学习中

标签:DBMS,--,导出,千万级,转帖,FILE,SQL,oracle,csv
From: https://www.cnblogs.com/jinanxiaolaohu/p/17964601

相关文章

  • [转帖]美国出口管制法律制度及中国企业风险防范——EAR核心内容解读
    http://bzy.scjg.jl.gov.cn/wto/zszc/myxgzs/202202/t20220221_636006.html 发布时间:2022-01-18一、《美国出口管理条例》(“EAR”)的核心内容解读(一)哪些物项属于适用EAR的“受管制物项”受EAR管辖的物项首先必须是在“出口活动”中被“出口”的物项;其次,在所有......
  • oracle如果想要在两个拼接字段中间加一些字符该怎么写
    如果想要在两个拼接字段的中间添加一些字符,可以使用字符串连接函数CONCAT或者字符串连接操作符||来实现。以下是两种写法的示例:使用CONCAT函数:SELECTCONCAT(字段1,'添加的字符',字段2)AS拼接结果FROM表名;在上述示例中,你需要将字段1和字段2替换为要拼接的实际字段......
  • [转帖]Nginx access log 按日期保存记录
    https://cloud.tencent.com/developer/article/1958304 $time_iso8601  生成格式:2021-09-18T15:16:35+08:00$time_local     生成格式:18/Sep/2021:15:12:13+0800网络流传的nginxaccesslog分割都是写shell脚本然后做定时任务来分割日志,操作中自......
  • 深入理解Oracle SGA和共享内存段
    在Oracle数据库中,SGA(SystemGlobalArea)是一个重要的内存区域,用于存储整个数据库实例共享的信息和数据。SGA由多个不同的区域组成,例如DatabaseBufferCache、SharedPool等。这些区域在操作系统中使用共享内存段来存储,而其中的一个关键参数是shmmax。SGA和共享内存段的关系SGA中的......
  • oracle的事务
    Oracle数据库中的事务具有四个基本特性,也称为ACID特性,包括原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。原子性:事务被视为不可分割的最小操作单位,事务中的所有操作要么全部提交成功,要么全部回滚失败,不会出现部分执行的情况。一致性:事务必须使数据库从......
  • Oracle怎样写一个sql,将一个不同的表结构的数据迁移到另一个表中,其中有字段需要有映射
    要将一个表的数据迁移到另一个表,并且需要进行字段映射和值转换,可以使用以下步骤:创建目标表:CREATETABLE目标表名(目标字段1数据类型,目标字段2数据类型,...);插入数据并进行字段映射和值转换:INSERTINTO目标表名(目标字段1,目标字段2,...)SELECTCASEWH......
  • Oracle 11gR2 中使用expdp导出数据
    一:导出前期准备:1.创建目录对象:CREATEDIRECTORYdump_dirAS‘c:\dump’;2.在操作系统上创建相应的目录。3.把目录的读写权限给用户:GRANTREAD,WRITEONDIRECTORYdump_dirTOscott;二:导出的模型1.导出表expdpscott/tigerDIRECTORY=dump_dirDUMPFILE=tab.dmplogf......
  • oracle清除日志
    近日发现oracle占用的空间很大,经查,发现是/u01/app/oracle/diag/rdbms/orcl/orcl/alert警告日志/u01/app/oracle/diag/rdbms/orcl/orcl/trace跟踪日志这两个目录日志文件太多。占用十几个G用adrci清除日志先确定目录SQL>selectvaluefromv$diag_infowherename='Dia......
  • oracle新增一个表字段
    要在Oracle数据库中新增一个表字段,你可以按照以下步骤进行操作:使用ALTERTABLE语句来修改表结构。例如,如果要向名为"table_name"的表中新增一个名为"new_column"的字段,你可以执行以下命令:ALTERTABLEtable_nameADDnew_columndata_type;其中,"data_type"是新字段的数据类型,比如VA......
  • oracle和mysql语句的异同
    Oracle和MySQL是两个流行的关系型数据库管理系统,它们都有SQL(结构化查询语言)作为主要的查询语言。尽管它们共享许多基本的SQL功能,但它们之间也存在一些关键的差异。以下是一些Oracle和MySQL语句的异同点:数据类型:相同点:两者都有整数、浮点数、字符、日期等数据类型。不同点:Oracle有一......