본문으로 건너뛰기

핵심 개념

D.Hub를 제대로 쓰려면 먼저 알아둘 핵심 개념들을 정리했습니다. 각 구성 요소가 어떤 역할을 맡고 서로 어떻게 맞물리는지 알면 플랫폼에 훨씬 빨리 익숙해집니다.

낯선 용어가 보이면 용어 사전에서 뜻을 바로 확인할 수 있습니다. 아래 본문에서도 주요 용어에는 사전 링크를 걸어 두었습니다.

구성 요소 관계도

아래 다이어그램은 D.Hub의 핵심 구성 요소들이 어떻게 연결되는지 보여줍니다.

Collection (컬렉션)

컬렉션은 D.Hub에서 리소스를 논리적으로 그룹화하는 최상위 컨테이너입니다. 프로젝트, 부서, 주제 등 원하는 기준으로 관련 리소스들을 하나로 묶어 관리할 수 있습니다.

하나의 컬렉션에는 다음 6종 리소스를 포함할 수 있습니다:

  • Dataset — 구조화된 데이터 테이블
  • Code — 재사용 가능한 코드 아티팩트
  • Pipeline — 데이터 처리 워크플로우
  • Knowledge — 비정형 문서 지식 저장소
  • Dashboard — 데이터 시각화 대시보드
  • Agent — LLM + 도구 기반 자율 실행 단위

6종 자원은 모두 폴더 안에 넣을 수 있고, 컬렉션 트리에 개별 항목으로 노출됩니다(컬렉션 = 자원의 거주지). 컬렉션 단위로 묶어두면 팀이나 프로젝트별로 데이터 자산을 정리하고 접근 권한도 한꺼번에 관리할 수 있습니다.

컬렉션은 또한 온톨로지의 스코프 단위이기도 합니다 — 1 컬렉션 = 1 온톨로지 스코프. 컬렉션을 만들면 거기에 맞는 온톨로지 스코프가 함께 생기면서, 의미 레이어가 컬렉션 경계와 맞아떨어집니다.

예시: "마케팅 캠페인 분석" 컬렉션 하나에 광고 성과 데이터셋·주간 집계 파이프라인·성과 대시보드를 함께 담아 팀 단위로 관리합니다.

→ 자세히 알아보기: 컬렉션 관리

Dataset (데이터셋)

데이터셋은 구조화된 데이터를 저장하고 관리하는 단위입니다. D.Hub에서는 데이터셋을 버전 관리되는 테이블 형식으로 저장하기 때문에, 버전과 스키마가 자동으로 따라갑니다.

데이터셋을 생성하는 방법:

  • 빠른 추가 — 컬렉션 상세의 + 항목 추가 ▾ → 빠른 추가… 에서 CSV, JSON, Parquet 같은 파일을 빠르게 업로드해 데이터셋으로 등록합니다
  • 데이터셋 생성+ 항목 추가 ▾ → 데이터셋에서 서브타입과 스키마를 지정해 데이터셋 구조를 구성합니다
  • API 호출 — REST API를 통해 프로그래밍 방식으로 생성합니다

데이터셋마다 고유한 버전 이력이 쌓이고, SQL이나 Python 쿼리로 데이터를 조회하고 분석할 수 있습니다. 데이터셋 상세 화면에서는 데이터와 스키마, 참조 관계를 한눈에 확인합니다.

예시: 매월 받는 "서울시 지하철 승하차 인원" CSV를 업로드하면, 변경 이력(버전)이 자동으로 쌓이는 테이블로 저장됩니다.

→ 자세히 알아보기: 데이터셋 위자드

Code (코드)

코드는 D.Hub 안에서 재사용 가능한 코드 아티팩트를 관리하는 리소스입니다. Python 스크립트나 SQL 쿼리를 작성해두고 이를 파이프라인의 노드로 연결하면 데이터 처리에 그대로 쓸 수 있습니다.

지원하는 코드 유형:

유형용도
Python데이터 변환, API 호출, 복잡한 비즈니스 로직 구현
SQL데이터 조회, 집계, 테이블 간 조인 처리

AI Assistant의 코드 생성 기능을 쓰면 자연어로 요구사항만 설명해도 코드가 자동으로 만들어집니다.

예시: "매출 데이터에서 이상치를 걸러내는 Python 함수"를 한 번 저장해두고, 여러 파이프라인에서 노드로 가져다 재사용합니다.

→ 자세히 알아보기: 코드 위자드

Pipeline (파이프라인)

파이프라인은 데이터 처리 과정을 시각적으로 설계하고 실행하는 워크플로우 시스템입니다. 노드 기반 편집기에서 드래그 앤 드롭으로 데이터 흐름을 짜면, 워크플로우 엔진이 이를 자동으로 실행합니다.

파이프라인의 핵심 구성:

  • 노드(Node) — 개별 처리 단계 (데이터 읽기, 변환, 저장 등)
  • 엣지(Edge) — 노드 간의 데이터 흐름 연결
  • 실행(Run) — 파이프라인의 단일 실행 인스턴스

직접 실행하는 것 말고도 스케줄이나 이벤트로 자동 트리거할 수 있어서, 반복되는 데이터 처리는 통째로 자동화해버릴 수 있습니다.

예시: 매주 월요일마다 지난주 서울시 교통량 데이터를 수집·정제해 데이터셋으로 저장하도록 자동 실행되게 만듭니다.

→ 자세히 알아보기: 파이프라인 워크플로우 편집기

Ontology (온톨로지)

온톨로지는 데이터 사이의 의미적 관계를 엔티티(Entity)관계(Relationship)로 모델링하는 기능입니다. 이렇게 정의한 모델은 그래프 데이터베이스에 저장되므로, 복잡하게 얽힌 데이터 관계도 직관적으로 따라가며 탐색할 수 있습니다.

온톨로지의 주요 구성:

  • 엔티티(Entity) — 실세계의 객체를 표현 (예: 사용자, 제품, 센서)
  • 관계(Relationship) — 엔티티 간의 연결을 정의 (예: "소유한다", "위치한다")
  • 속성(Property) — 엔티티와 관계에 부여되는 세부 정보

온톨로지 빌더에서 모델을 시각적으로 구성한 뒤, 그래프 탐색기에서 관계 네트워크를 직접 눌러가며 살펴볼 수 있습니다.

예시: "고객—(주문한다)→상품" 관계를 정의해두면, 한 고객이 최근 3개월간 주문한 상품을 그래프에서 연결을 따라가며 탐색할 수 있습니다.

→ 자세히 알아보기: 온톨로지 개요

Knowledge (지식 관리)

Knowledge는 비정형 데이터를 모아 지식으로 만들어 AI 기반 검색과 대화에 쓰는 기능입니다. 웹 페이지 크롤링, 파일 업로드, 수동 문서 작성처럼 여러 방법으로 문서를 모으면, 이를 자동으로 청킹(Chunking)·임베딩(Embedding)벡터 데이터베이스에 저장합니다.

이렇게 모은 지식은 RAG(Retrieval-Augmented Generation) 기반의 AI 채팅으로 자연어로 물어볼 수 있습니다. 질문이 들어오면 관련 문서를 찾아내고, LLM이 그 문맥에 맞는 답변을 만들어 줍니다.

지원하는 문서 수집 방법:

  • 웹 크롤링 — URL을 지정하여 웹 페이지 자동 수집
  • 파일 업로드 — PDF, DOCX, TXT 등 문서 파일 직접 업로드
  • 수동 문서 — 에디터를 통한 수동 문서 입력

예시: 사내 제품 매뉴얼 PDF 수십 건을 올려두고 "환불 규정이 어떻게 되나요?"라고 자연어로 물으면, 관련 문단을 찾아 답변해 줍니다.

→ 자세히 알아보기: 지식 관리 개요

Dashboard (대시보드)

대시보드는 데이터를 시각적으로 보여주고 모니터링하는 기능입니다. 대규모 데이터에 맞춘 분석 엔진을 사용하므로, 대량의 데이터도 실시간으로 집계하고 빠르게 시각화합니다.

대시보드의 핵심 기능:

  • 위젯(Widget) — 차트, 테이블, 지표 등 다양한 시각화 컴포넌트
  • 데이터 연결 — SQL 쿼리 또는 간단 모드로 데이터셋과 연결
  • 실시간 갱신 — 데이터 변경 시 자동으로 시각화 업데이트

위젯 라이브러리에서 원하는 차트 유형을 고르고 데이터셋 컬럼을 매핑하면, 보기 편한 대시보드를 금세 만들 수 있습니다.

예시: 일별 매출은 꺾은선 차트로, 지역별 매출은 지도 위젯으로 한 화면에 모아 실시간으로 모니터링합니다.

→ 자세히 알아보기: 대시보드 개요

Agent (에이전트)

에이전트LLM과 도구를 묶어 사용자의 요청을 실행 가능한 작업 흐름으로 바꾸는 단위입니다. 컬렉션 안의 자원과 함께 관리하며, 배포하고 나면 AI Assistant나 HITL 승인 흐름에 연결할 수 있습니다.

에이전트의 핵심 구성:

  • 에이전트 정의 — 이름, 설명, 실행 방식, 사용할 모델과 도구 구성
  • 도구(Tool) — 에이전트가 호출할 수 있는 외부 기능 또는 내부 작업
  • 액터(Actor) — 특정 역할을 맡아 실행 흐름을 분담하는 단위

예시: 고객 문의가 들어오면 관련 지식을 검색해 답변 초안을 만들고, 환불 건은 담당자 승인을 거쳐 처리하도록 구성합니다.

→ 자세히 알아보기: 에이전트 개요

다음 단계

핵심 개념을 익혔다면 이제 직접 플랫폼을 써볼 차례입니다.

  • 첫 화면 둘러보기 — D.Hub의 화면 구성을 살펴봅니다
  • 퀵스타트 — 5분 만에 데이터셋 업로드부터 대시보드까지 완성합니다
  • 역할별 가이드 — 본인의 역할에 맞는 학습 경로를 선택합니다
  • 용어 사전 — 문서에 등장하는 용어의 뜻을 한곳에서 찾아봅니다