ClickHouse에서 JupySQL 사용하기
Community Maintained
이 가이드에서는 ClickHouse와의 연동 방법을 보여줍니다.
JupySQL을 사용하여 ClickHouse에 대해 쿼리를 실행합니다. 데이터가 로드되면 SQL 기반 플로팅으로 시각화합니다.
JupySQL과 ClickHouse 간의 연동은 clickhouse_sqlalchemy 라이브러리를 사용하여 구현됩니다. 이 라이브러리는 두 시스템 간의 손쉬운 통신을 제공하며, ClickHouse에 연결하고 SQL dialect를 지정할 수 있도록 해줍니다. 연결이 완료되면 ClickHouse 기본 UI나 Jupyter 노트북에서 직접 SQL 쿼리를 실행할 수 있습니다.
참고: 업데이트된 패키지를 사용하려면 커널을 다시 시작해야 할 수도 있습니다.
다음 단계로 진행하려면 ClickHouse가 실행 중이며 정상적으로 접속 가능한 상태인지 반드시 확인해야 합니다. 로컬 버전 또는 Cloud 버전 중 어느 것이든 사용할 수 있습니다.
참고: 연결하려는 인스턴스 유형에 따라 연결 문자열(connection string)을 조정해야 합니다(URL, 사용자, 비밀번호). 아래 예제에서는 로컬 인스턴스를 사용했습니다. 자세한 내용은 이 가이드를 참고하십시오.
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
- clickhouse://default:***@localhost:8123/default 완료.
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
| count() |
|---|
| 1999657 |
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
| pickup_ntaname |
|---|
| Morningside Heights |
| Hudson Yards-Chelsea-Flatiron-Union Square |
| Midtown-Midtown South |
| SoHo-Tribeca-Civic Center-Little Italy |
| Murray Hill-Kips Bay |
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
| round(avg(tip_amount), 2) |
|---|
| 1.68 |
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
| passenger_count | average_total_amount |
|---|---|
| 0 | 22.69 |
| 1 | 15.97 |
| 2 | 17.15 |
| 3 | 16.76 |
| 4 | 17.33 |
| 5 | 16.35 |
| 6 | 16.04 |
| 7 | 59.8 |
| 8 | 36.41 |
| 9 | 9.81 |
- clickhouse://default:***@localhost:8123/default 완료되었습니다.
| pickup_date | pickup_ntaname | number_of_trips |
|---|---|---|
| 2015-07-01 | Bushwick North | 2 |
| 2015-07-01 | Brighton Beach | 1 |
| 2015-07-01 | Briarwood-Jamaica Hills | 3 |
| 2015-07-01 | Williamsburg | 1 |
| 2015-07-01 | Queensbridge-Ravenswood-Long Island City | 9 |
- clickhouse://default:***@localhost:8123/default 실행을 건너뜀...

