开发ODPS SQL任务

DataWorks为您提供ODPS SQL节点，可用于周期性调度MaxCompute的SQL任务，并完成与其他类型节点的集成和联合调度。MaxCompute SQL任务采用类似SQL的语法，适用于海量数据（TB级）但实时性要求不高的分布式处理场景。本文为您介绍在DataWorks上开发SQL任务的注意事项及开发指导。

前提条件

已创建ODPS SQL节点，详情请参见创建并管理MaxCompute节点。

背景信息

ODPS SQL用于处理和查询MaxCompute中的数据，支持常见的SQL操作，例如SELECT、INSERT、UPDATE、DELETE等，以及特定的MaxCompute语法和函数。使用ODPS SQL，您可以编写类似于SQL的语句来查询和处理数据，而无需编写复杂的数据处理逻辑，SQL语法详情请参见 SQL概述。

使用限制

DataWorks中开发ODPS SQL节点的限制如下：

分类	说明
注释使用	不支持在关键字（set、use）语句后单独加注释。
	不支持在注释中使用英文分号（;）。
	不支持在已完结的语句结尾加注释。 SQL语句后添加英文分号（;），表示语句已完结。
SQL下发	ODPS SQL不支持单独使用 set、use 语句，必须和具体的SQL语句一起执行。
SQL开发	SQL代码大小不能超过 128KB ，SQL命令条数不能超过 200条。
查询结果	仅支持select和with起始的SQL语句输出格式化的结果集，且最多能显示 10000行结果数据。

注意事项

DataWorks上不同环境运行关键字（set、use）相关语句时，执行顺序不同。

在数据开发DataStudio中运行：将合并当前任务代码内所有的关键字（set、use）语句，作为所有SQL的前置语句。
在调度环境运行：将按照实际编写顺序执行。

假设在节点中定义的代码如下。

set a=b;
create table name1(id string);
set c=d;
create table name2(id string);

不同环境执行顺序如下：

执行SQL	数据开发DataStudio	调度运维
第一条SQL语句	`set a=b; set c=d; create table name1(id string);`	`set a=b; create table name1(id string);`
第二条SQL语句	`set a=b; set c=d; create table name2(id string);`	`set c=d; create table name2(id string);`

编辑代码：简单示例

SQL命令

MaxCompute的SQL命令使用类似标准SQL语法，支持DDL、DML、DQL语句，及MaxCompute的特定语法等命令，各SQL命令的详细语法要求及使用示例请参见 SQL概述。下面以一个简单示例为您介绍SQL命令的开发及运行。

--创建一张分区表test1
create table if not exists students
( id BIGINT,
  name STRING,
  age BIGINT,
  birth DATE)
partitioned by (gender STRING);

--插入数据
INSERT INTO students partition(gender='boy') VALUES (1,'张三',15,DATE '2008-05-15') ;
INSERT INTO students partition(gender='boy') VALUES (2,'李四',17,DATE '2006-07-20') ;
INSERT INTO students partition(gender='girl') VALUES (3,'李霞',20,DATE '2003-04-20') ;
INSERT INTO students partition(gender='girl') VALUES (4,'王兰',21,DATE '2002-01-08') ;
INSERT INTO students partition(gender='boy') VALUES (5,'王五',17,DATE '2006-09-12') ;

```
--开启全表扫描，仅此Session有效
set odps.sql.allow.fullscan=true; 
--查询所有男生的信息，并按照ID进行升序排序
select * from students where gender='boy' order by id;
```

```
--开启全表扫描，仅此Session有效
set odps.sql.allow.fullscan=true; 
select id, name, age, birth, dateadd(birth,1,'mm') as birth_dateadd from students;
```

+------------+------------+------------+------------+------------+
| id         | name       | age        | birth      | gender        |
+------------+------------+------------+------------+------------+
| 1          | 张三         | 15         | 2008-05-15 | boy        |
| 2          | 李四         | 17         | 2006-07-20 | boy        |
| 5          | 王五         | 17         | 2006-09-12 | boy        |
+------------+------------+------------+------------+------------+

+------------+------------+------------+------------+---------------+
| id         | name       | age        | birth      | birth_dateadd |
+------------+------------+------------+------------+---------------+
| 4          | 王兰         | 21         | 2002-01-08 | 2002-02-08    |
| 3          | 李霞         | 20         | 2003-04-20 | 2003-05-20    |
| 2          | 李四         | 17         | 2006-07-20 | 2006-08-20    |
| 1          | 张三         | 15         | 2008-05-15 | 2008-06-15    |
| 5          | 王五         | 17         | 2006-09-12 | 2006-10-12    |
+------------+------------+------------+------------+---------------+