Where 절을 무시하는 Redshift 교차 조인 (Redshift Cross join ignoring where clause)


문제 설명

Where 절을 무시하는 Redshift 교차 조인 (Redshift Cross join ignoring where clause)

다음 쿼리가 있습니다.

WITH MY_CTE as
(
select
....
.....
    )
SELECT
MY_CTE.*
,tt.currency as most_used_currency
from MY_CTE
cross join 
     (select t.currency
      from My_CTE t
      group by t.currency
      order by count(*) desc
      limit 1
     ) tt 
where MY_CTE.currency = 'EUR'

하지만 교차 조인이 내 where 절을 무시합니다. 교차 조인 작업을 수행하기 전에 where 절을 처리하도록 하려면 어떻게 해야 하나요?

반환된 샘플 데이터:

![여기에 이미지 설명 입력

SEK 통화를 포함하지 않는다고 말했지만 가장 인기 있는 통화라고 하기 때문에 이것은 분명히 잘못된 것입니다. 저는 이것을 tableau에서 사용할 것이고 사용자가 특정 기준(예: 통화)을 필터링할 수 있어야 하기 때문에 교차 조인 내부에 where 절을 넣을 수 없습니다.


참조 솔루션

방법 1:

WHERE condition in this case has nothing to do with cross join, it just filters rows after join is already performed. If you need to report only single currency there are simplest two options where to add currency filter (added as comments in SQL):

1) Option 1 ‑ add filter already in CTE statement

2) Option 2 ‑ add filter at the end (as already done) and within tt part.

WITH MY_CTE as
(
select
....
.....
/* OPTION 1*/
    )
SELECT
MY_CTE.*
,tt.currency as most_used_currency
from MY_CTE
cross join 
     (select t.currency
      from My_CTE t
     /* OPTION 2 first place*/
      group by t.currency
      order by count(*) desc
      limit 1
     ) tt 
where MY_CTE.currency = 'EUR' /* OPTION 2a second place*/

방법 2:

The alias tt will return the most popular currency overall, which is SEK. If you want to filter for separate currencies, you'll need to put them in the inner query as well as the outer one. However, if that isn't an option, you'll want to return all currencies with their popularity, and filter on the most popular one you allow.

....
....
SELECT
LAST_VALUE(MY_CTE.customer_id) 
           OVER (partition by customer_id 
           ORDER BY tt.popularity
      rows between unbounded preceding and unbounded following) 
.... /* rest of your columns */
, LAST_VALUE(tt.currency) 
           OVER (partition by customer_id 
           ORDER BY tt.popularity
      rows between unbounded preceding and unbounded following) 
from MY_CTE
cross join 
 (select t.currency,
         count(*) popularity
      from My_CTE t
      group by t.currency
      order by count(*) desc
      /* removed limit 1 */
     ) tt 
where MY_CTE.currency = 'EUR' 
  AND tt.currency IN ('EUR') /* Added tt.currency filter */

(by LilzEdgars T.trafficone)

참조 문서

  1. Redshift Cross join ignoring where clause (CC BY‑SA 2.5/3.0/4.0)

#amazon-redshift #cross-join






관련 질문

AWS Redshift JDBC 삽입 성능 (AWS Redshift JDBC insert performance)

데이터 웨어하우스에는 어떤 종류의 데이터가 저장됩니까? (What kind of data gets stored in data warehouses?)

임시 자격 증명을 사용하여 Redshift COPY 명령을 실행하는 동안 액세스 거부 오류가 발생했습니다. (Access denied error while runnig Redshift COPY command using Temp credential)

Firebase에서 Amazon Redshift로 데이터 로드 (Load data from firebase to amazon redshift)

PL/pgsql DDL을 작성하여 redshift에서 스키마를 생성한 다음 ddls를 반복하여 각 스키마에 테이블을 생성하는 방법은 무엇입니까? (How to write PL/pgsql DDL to create schemas in redshift and then looping the ddls to create tables in the respective schemas?)

redshift에서 데이터 프레임을 저장할 수 없습니다 (Unable to save dataframe in redshift)

Redshift에서 id가 일련의 값보다 작은 행의 쿼리 수 (query count of rows where id is less than a series of values in Redshift)

[Amazon](500310) 잘못된 작업: "$$ 또는 그 근처에서 종료되지 않은 달러 인용 문자열 ([Amazon](500310) Invalid operation: unterminated dollar-quoted string at or near "$$)

Redshift JDBC DatabaseMetaData.getDatabaseMajorVersion()이 최신 값을 반환합니까? (Does the Redshift JDBC DatabaseMetaData.getDatabaseMajorVersion() return an up to date value?)

Where 절을 무시하는 Redshift 교차 조인 (Redshift Cross join ignoring where clause)

AWS Redshift는 RECORD에서 열 이름을 동적으로 선택합니다. (AWS Redshift dynamically select column name from RECORD)

여러 열을 기반으로 중복을 제거하고 하나의 고유한 레코드를 선택하도록 조건을 설정합니다. (Remove duplicates based on multiple columns and set conditions to choose one unique record)







코멘트