awslabs
diff --git a/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2Constants.java‎
Lines changed: 1 addition & 0 deletions b/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2Constants.java‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2MetadataHandler.java‎
Lines changed: 85 additions & 13 deletions b/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2MetadataHandler.java‎
Lines changed: 85 additions & 13 deletions
diff --git a/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2RecordHandler.java‎
Lines changed: 64 additions & 0 deletions b/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2RecordHandler.java‎
Lines changed: 64 additions & 0 deletions
diff --git a/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2Util.java‎
Lines changed: 61 additions & 0 deletions b/‎athena-datalakegen2/src/main/java/com/amazonaws/athena/connectors/datalakegen2/DataLakeGen2Util.java‎
Lines changed: 61 additions & 0 deletions
@@ -25,6 +25,7 @@ public class DataLakeGen2Constants
     public static final String DRIVER_CLASS = "com.microsoft.sqlserver.jdbc.SQLServerDriver";
     public static final int DEFAULT_PORT = 1433;
     public static final String QUOTE_CHARACTER = "\"";
+    public static final String SQL_POOL = "azureServerless";
 
     private DataLakeGen2Constants() {}
 }
@@ -227,11 +227,9 @@ protected Schema getSchema(Connection jdbcConnection, TableName tableName, Schem
         String dataType;
         String columnName;
         HashMap<String, String> hashMap = new HashMap<>();
-        boolean found = false;
 
         SchemaBuilder schemaBuilder = SchemaBuilder.newBuilder();
-        try (ResultSet resultSet = getColumns(jdbcConnection.getCatalog(), tableName, jdbcConnection.getMetaData());
-             Connection connection = getJdbcConnectionFactory().getConnection(getCredentialProvider());
+        try (Connection connection = getJdbcConnectionFactory().getConnection(getCredentialProvider());
              PreparedStatement stmt = connection.prepareStatement(dataTypeQuery)) {
             // fetch data types of columns and prepare map with column name and datatype.
             stmt.setString(1, tableName.getSchemaName() + "." + tableName.getTableName());
@@ -242,18 +240,94 @@ protected Schema getSchema(Connection jdbcConnection, TableName tableName, Schem
                     hashMap.put(columnName.trim(), dataType.trim());
                 }
             }
+        }
+
+        String environment = DataLakeGen2Util.checkEnvironment(jdbcConnection.getMetaData().getURL());
+        
+        if (DataLakeGen2Constants.SQL_POOL.equalsIgnoreCase(environment)) {
+            // getColumns() method from SQL Server driver is causing an exception in case of Azure Serverless environment.
+            // so doing explicit data type conversion
+            schemaBuilder = doDataTypeConversion(hashMap);
+        }
+        else {
+            schemaBuilder = doDataTypeConversionForNonCompatible(jdbcConnection, tableName, hashMap);
+        }
+        // add partition columns
+        partitionSchema.getFields().forEach(schemaBuilder::addField);
+        return schemaBuilder.build();
+    }
+
+    private SchemaBuilder doDataTypeConversion(HashMap<String, String> columnNameAndDataTypeMap)
+    {
+        SchemaBuilder schemaBuilder = SchemaBuilder.newBuilder();
+
+        for (Map.Entry<String, String> entry : columnNameAndDataTypeMap.entrySet()) {
+            String columnName = entry.getKey();
+            String dataType = entry.getValue();
+            ArrowType columnType = Types.MinorType.VARCHAR.getType();
+
+            if ("char".equalsIgnoreCase(dataType) || "varchar".equalsIgnoreCase(dataType) || "binary".equalsIgnoreCase(dataType) ||
+                    "nchar".equalsIgnoreCase(dataType) || "nvarchar".equalsIgnoreCase(dataType) || "varbinary".equalsIgnoreCase(dataType)
+                    || "time".equalsIgnoreCase(dataType) || "uniqueidentifier".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.VARCHAR.getType();
+            }
+
+            if ("bit".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.TINYINT.getType();
+            }
+
+            if ("tinyint".equalsIgnoreCase(dataType) || "smallint".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.SMALLINT.getType();
+            }
+
+            if ("int".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.INT.getType();
+            }
+
+            if ("bigint".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.BIGINT.getType();
+            }
+
+            if ("decimal".equalsIgnoreCase(dataType) || "money".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.FLOAT8.getType();
+            }
+
+            if ("numeric".equalsIgnoreCase(dataType) || "float".equalsIgnoreCase(dataType) || "smallmoney".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.FLOAT8.getType();
+            }
 
+            if ("real".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.FLOAT4.getType();
+            }
+
+            if ("date".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.DATEDAY.getType();
+            }
+
+            if ("datetime".equalsIgnoreCase(dataType) || "datetime2".equalsIgnoreCase(dataType)
+                    || "smalldatetime".equalsIgnoreCase(dataType) || "datetimeoffset".equalsIgnoreCase(dataType)) {
+                columnType = Types.MinorType.DATEMILLI.getType();
+            }
+
+            schemaBuilder.addField(FieldBuilder.newBuilder(columnName, columnType).build());
+        }
+        return schemaBuilder;
+    }
+
+    private SchemaBuilder doDataTypeConversionForNonCompatible(Connection jdbcConnection, TableName tableName, HashMap<String, String> columnNameAndDataTypeMap) throws SQLException
+    {
+        SchemaBuilder schemaBuilder = SchemaBuilder.newBuilder();
+
+        try (ResultSet resultSet = getColumns(jdbcConnection.getCatalog(), tableName, jdbcConnection.getMetaData())) {
+            boolean found = false;
             while (resultSet.next()) {
                 Optional<ArrowType> columnType = JdbcArrowTypeConverter.toArrowType(
                         resultSet.getInt("DATA_TYPE"),
                         resultSet.getInt("COLUMN_SIZE"),
                         resultSet.getInt("DECIMAL_DIGITS"),
                         configOptions);
-                columnName = resultSet.getString("COLUMN_NAME");
-
-                dataType = hashMap.get(columnName);
-                LOGGER.debug("columnName: " + columnName);
-                LOGGER.debug("dataType: " + dataType);
+                String columnName = resultSet.getString("COLUMN_NAME");
+                String dataType = columnNameAndDataTypeMap.get(columnName);
 
                 if (dataType != null && DataLakeGen2DataType.isSupported(dataType)) {
                     columnType = Optional.of(DataLakeGen2DataType.fromType(dataType));
@@ -266,21 +340,19 @@ protected Schema getSchema(Connection jdbcConnection, TableName tableName, Schem
                     columnType = Optional.of(Types.MinorType.VARCHAR.getType());
                 }
 
-                LOGGER.debug("columnType: " + columnType);
                 if (columnType.isPresent() && SupportedTypes.isSupported(columnType.get())) {
                     schemaBuilder.addField(FieldBuilder.newBuilder(columnName, columnType.get()).build());
                     found = true;
                 }
                 else {
-                    LOGGER.error("getSchema: Unable to map type for column[" + columnName + "] to a supported type, attempted " + columnType);
+                    LOGGER.error("getSchema: Unable to map type for column[{}] to a supported type, attempted {}", columnName, columnType);
                 }
             }
             if (!found) {
+                LOGGER.error("Could not find any supported columns in table: {}.{}", tableName.getSchemaName(), tableName.getTableName());
                 throw new RuntimeException("Could not find table in " + tableName.getSchemaName());
             }
-
-            partitionSchema.getFields().forEach(schemaBuilder::addField);
-            return schemaBuilder.build();
         }
+        return schemaBuilder;
     }
 }
@@ -18,9 +18,14 @@
  * #L%
  */
 package com.amazonaws.athena.connectors.datalakegen2;
+import com.amazonaws.athena.connector.lambda.QueryStatusChecker;
+import com.amazonaws.athena.connector.lambda.data.Block;
+import com.amazonaws.athena.connector.lambda.data.BlockSpiller;
+import com.amazonaws.athena.connector.lambda.data.writers.GeneratedRowWriter;
 import com.amazonaws.athena.connector.lambda.domain.Split;
 import com.amazonaws.athena.connector.lambda.domain.TableName;
 import com.amazonaws.athena.connector.lambda.domain.predicate.Constraints;
+import com.amazonaws.athena.connector.lambda.records.ReadRecordsRequest;
 import com.amazonaws.athena.connectors.jdbc.connection.DatabaseConnectionConfig;
 import com.amazonaws.athena.connectors.jdbc.connection.DatabaseConnectionInfo;
 import com.amazonaws.athena.connectors.jdbc.connection.GenericJdbcConnectionFactory;
@@ -29,20 +34,27 @@
 import com.amazonaws.athena.connectors.jdbc.manager.JdbcRecordHandler;
 import com.amazonaws.athena.connectors.jdbc.manager.JdbcSplitQueryBuilder;
 import com.google.common.annotations.VisibleForTesting;
+import org.apache.arrow.vector.types.pojo.ArrowType;
+import org.apache.arrow.vector.types.pojo.Field;
 import org.apache.arrow.vector.types.pojo.Schema;
 import org.apache.commons.lang3.Validate;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;
 import software.amazon.awssdk.services.athena.AthenaClient;
 import software.amazon.awssdk.services.s3.S3Client;
 import software.amazon.awssdk.services.secretsmanager.SecretsManagerClient;
 
 import java.sql.Connection;
 import java.sql.PreparedStatement;
+import java.sql.ResultSet;
 import java.sql.SQLException;
+import java.util.Map;
 
 import static com.amazonaws.athena.connectors.datalakegen2.DataLakeGen2Constants.QUOTE_CHARACTER;
 
 public class DataLakeGen2RecordHandler extends JdbcRecordHandler
 {
+    private static final Logger LOGGER = LoggerFactory.getLogger(DataLakeGen2RecordHandler.class);
     private static final int FETCH_SIZE = 1000;
     private final JdbcSplitQueryBuilder jdbcSplitQueryBuilder;
     public DataLakeGen2RecordHandler(java.util.Map<String, String> configOptions)
@@ -76,4 +88,56 @@ public PreparedStatement buildSplitSql(Connection jdbcConnection, String catalog
         preparedStatement.setFetchSize(FETCH_SIZE);
         return preparedStatement;
     }
+
+    @Override
+    public void readWithConstraint(BlockSpiller blockSpiller, ReadRecordsRequest readRecordsRequest, QueryStatusChecker queryStatusChecker)
+            throws Exception
+    {
+        LOGGER.info("{}: Catalog: {}, table {}, splits {}", readRecordsRequest.getQueryId(), readRecordsRequest.getCatalogName(), readRecordsRequest.getTableName(),
+                readRecordsRequest.getSplit().getProperties());
+
+        try (Connection connection = getJdbcConnectionFactory().getConnection(getCredentialProvider())) {
+            String environment = DataLakeGen2Util.checkEnvironment(connection.getMetaData().getURL());
+            if (!DataLakeGen2Constants.SQL_POOL.equalsIgnoreCase(environment)) {
+                // For consistency. This is needed to be false to enable streaming for some database types.
+                // But in Azure serverless, this causes @@TRANCOUNT errors during connection cleanup
+                connection.setAutoCommit(false);
+            }
+            try (PreparedStatement preparedStatement = buildSplitSql(connection, readRecordsRequest.getCatalogName(), readRecordsRequest.getTableName(),
+                    readRecordsRequest.getSchema(), readRecordsRequest.getConstraints(), readRecordsRequest.getSplit());
+                 ResultSet resultSet = preparedStatement.executeQuery()) {
+                Map<String, String> partitionValues = readRecordsRequest.getSplit().getProperties();
+
+                GeneratedRowWriter.RowWriterBuilder rowWriterBuilder = GeneratedRowWriter.newBuilder(readRecordsRequest.getConstraints());
+                for (Field next : readRecordsRequest.getSchema().getFields()) {
+                    if (next.getType() instanceof ArrowType.List) {
+                        rowWriterBuilder.withFieldWriterFactory(next.getName(), makeFactory(next));
+                    }
+                    else {
+                        rowWriterBuilder.withExtractor(next.getName(), makeExtractor(next, resultSet, partitionValues));
+                    }
+                }
+
+                GeneratedRowWriter rowWriter = rowWriterBuilder.build();
+                int rowsReturnedFromDatabase = 0;
+                while (resultSet.next()) {
+                    if (!queryStatusChecker.isQueryRunning()) {
+                        return;
+                    }
+                    blockSpiller.writeRows((Block block, int rowNum) -> rowWriter.writeRow(block, rowNum, resultSet) ? 1 : 0);
+                    rowsReturnedFromDatabase++;
+                }
+                LOGGER.info("{} rows returned by database.", rowsReturnedFromDatabase);
+
+                /*
+                SqlServer jdbc driver is using @@TRANCOUNT while performing commit(), it results below RuntimeException.
+                com.microsoft.sqlserver.jdbc.SQLServerException:  '@@TRANCOUNT' is not supported.
+                So we are evading this connection.commit(), in case of Azure serverless environment.
+                 */
+                if (!DataLakeGen2Constants.SQL_POOL.equalsIgnoreCase(environment)) {
+                    connection.commit();
+                }
+            }
+        }
+    }
 }
@@ -0,0 +1,61 @@
+/*-
+ * #%L
+ * athena-datalakegen2
+ * %%
+ * Copyright (C) 2019 - 2025 Amazon Web Services
+ * %%
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ * 
+ *      http://www.apache.org/licenses/LICENSE-2.0
+ * 
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ * #L%
+ */
+package com.amazonaws.athena.connectors.datalakegen2;
+
+import org.apache.commons.lang3.StringUtils;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;
+
+import java.util.regex.Matcher;
+import java.util.regex.Pattern;
+
+import static com.amazonaws.athena.connectors.datalakegen2.DataLakeGen2Constants.SQL_POOL;
+
+public class DataLakeGen2Util
+{
+    private static final Logger LOGGER = LoggerFactory.getLogger(DataLakeGen2Util.class);
+    
+    private DataLakeGen2Util()
+    {
+    }
+
+    private static final Pattern DATALAKE_CONN_STRING_PATTERN = Pattern.compile("([a-zA-Z]+)://([^;]+);(.*)");
+
+    public static String checkEnvironment(String url)
+    {
+        if (StringUtils.isBlank(url)) {
+            return null;
+        }
+        
+        // checking whether it's Azure serverless environment or not based on host name
+        Matcher m = DATALAKE_CONN_STRING_PATTERN.matcher(url);
+        String hostName = "";
+        if (m.find() && m.groupCount() == 3) {
+            hostName = m.group(2);
+        }
+        
+        if (StringUtils.isNotBlank(hostName) && hostName.contains("ondemand")) {
+            LOGGER.info("Azure serverless environment detected");
+            return SQL_POOL;
+        }
+        
+        return null;
+    }
+}
Original file line number	Diff line number	Diff line change
`@@ -25,6 +25,7 @@ public class DataLakeGen2Constants`
`25`	`25`	`public static final String DRIVER_CLASS = "com.microsoft.sqlserver.jdbc.SQLServerDriver";`
`26`	`26`	`public static final int DEFAULT_PORT = 1433;`
`27`	`27`	`public static final String QUOTE_CHARACTER = "\"";`
	`28`	`+ public static final String SQL_POOL = "azureServerless";`
`28`	`29`
`29`	`30`	`private DataLakeGen2Constants() {}`
`30`	`31`	`}`