Class DataFrameWriterV2

Interface used to write a DataFrame to external storage using V2 data sources. Provides advanced write operations (create, replace, append, overwrite) with better semantics than V1.

Use DataFrame.writeTo(tableName) to access this.

Stable

Since

1.0.0

See

https://spark.apache.org/docs/latest/sql-data-sources-v2.html

Index

Constructors

Methods

using option options tableProperty partitionBy clusterBy create replace createOrReplace append overwrite overwritePartitions

Constructors

constructor

new DataFrameWriterV2(tableName: string, df: DataFrame): DataFrameWriterV2
Parameters
- tableName: string
- df: DataFrame
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:45

Methods

using

using(provider: string): DataFrameWriterV2
Specify data source provider (e.g., "parquet", "orc", "iceberg", "delta")
Parameters
- provider: string
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:53

option

option(key: string, value: string): DataFrameWriterV2
Add write option
Parameters
- key: string
- value: string
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:61

options

options(opts: Record<string, string>): DataFrameWriterV2
Add multiple options
Parameters
- opts: Record<string, string>
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:69

tableProperty

tableProperty(key: string, value: string): DataFrameWriterV2
Add table property
Parameters
- key: string
- value: string
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:77

partitionBy

partitionBy(...cols: (string | Column)[]): DataFrameWriterV2
Partition by columns. Note: Each call to partitionBy replaces previously set partition columns.
Parameters
- ...cols: (string | Column)[]
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:86

clusterBy

clusterBy(...cols: string[]): DataFrameWriterV2
Cluster by columns (for data sources that support clustering). Note: Each call to clusterBy replaces previously set clustering columns.
Parameters
- ...cols: string[]
Returns DataFrameWriterV2
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:97

create

create(): Promise<ExecutePlanResponseHandler[]>
Create new table

Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:105

replace

replace(): Promise<ExecutePlanResponseHandler[]>
Replace existing table

Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:112

createOrReplace

createOrReplace(): Promise<ExecutePlanResponseHandler[]>
Create or replace table

Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:119

append

append(): Promise<ExecutePlanResponseHandler[]>
Append to existing table

Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:126

overwrite

overwrite(condition: string | Column): Promise<ExecutePlanResponseHandler[]>
Overwrite matching rows
Parameters
- condition: string | Column
Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:133

overwritePartitions

overwritePartitions(): Promise<ExecutePlanResponseHandler[]>
Overwrite partitions

Returns Promise<ExecutePlanResponseHandler[]>
- Defined in src/org/apache/spark/sql/DataFrameWriterV2.ts:140