Dataflow Java runner
ClickHouse Supported
Dataflow Java Runner를 사용하면 사용자 정의 Apache Beam 파이프라인을 Google Cloud의 Dataflow 서비스에서 실행할 수 있습니다. 이 방식은 최고 수준의 유연성을 제공하며, 고급 ETL 워크플로에 적합합니다.
작동 방식
-
파이프라인 구현 Java Runner를 사용하려면 공식 Apache Beam 커넥터인
ClickHouseIO를 사용하여 Beam 파이프라인을 구현해야 합니다. 코드 예제와ClickHouseIO사용 방법은 ClickHouse Apache Beam을 참조하십시오. -
배포 파이프라인을 구현하고 구성한 후에는 Google Cloud의 배포 도구를 사용하여 Dataflow에 배포할 수 있습니다. 보다 자세한 배포 방법은 Google Cloud Dataflow documentation - 「Java Pipeline」에 나와 있습니다.
참고: 이 방식은 Beam 프레임워크에 대한 이해와 코드를 작성할 수 있는 전문성을 전제로 합니다. 노코드(no-code) 솔루션을 선호하는 경우 ClickHouse의 사전 정의된 템플릿 사용을 고려하십시오.