콘텐츠 및 데이터 수집

성공을 위한 인덱스

Elastic은 모든 유형의 데이터와 콘텐츠를 위한 강력하고 유연한 수집 메커니즘을 구축하기 위한 기본 툴 또는 API를 통해 필요한 모든 도구를 제공합니다. 빠른 설정, 데이터 강화, 변환 및 조작을 위한 다양한 옵션이 제공되므로 강력한 검색 애플리케이션을 구축하는 데 집중할 수 있습니다.

Elastic 웹 크롤러를 사용하면 PDF를 포함한 모든 웹 콘텐츠를 쉽게 얻을 수 있습니다.

설명서 보기

개발자 API 및 사전 구축된 도구를 사용하여 검색 애플리케이션 구축을 시작하세요.

자세히 보기

모든 유형의 도구와 모든 종류의 데이터에 연결할 수 있는 모든 방법을 확인하세요.

통합 보기

데이터 수집 엔진

다양성은 수집의 맛

데이터를 색인 및 관리할 수 있는 강력한 사전 구축형 데이터 수집 도구와 노출된 API를 통해 수집 파이프라인을 완벽하게 제어하세요.

  • 데이터 추출

    PDF를 포함한 모든 웹사이트 콘텐츠를 검색, 추출, 인덱싱 및 동기화하세요! Elastic의 웹 크롤러를 사용하여 웹 페이지를 검색 가능한 데이터로 변환하세요.

  • 데이터 커넥터

    기본 커넥터와 커넥터 클라이언트를 널리 사용되는 생산성 도구와 편리한 API를 사용하여 데이터 소스용 커넥터를 구축할 수 있습니다.

  • 수집 API

    편리한 인덱싱 엔드포인트를 사용하여 JavaScript, Java 및 Python과 같은 인기 있는 언어 클라이언트를 사용하여 사용자 정의 수집 파이프라인을 구축할 수 있습니다.

  • 데이터 파이프라인

    기존 Elasticsearch 인덱스 또는 Elasticsearch 쿼리 구문을 사용하여 데이터 수집 파이프라인 및 관리를 유지하세요.

웹사이트에 검색을 추가하세요

웹 콘텐츠를 색인하는 가장 빠른 방법

직관적인 UI, 유연한 API 또는 둘 다 사용하든 상관없이 원하는 방식으로 크롤을 구성할 수 있습니다. 또한 크롤링 작업 및 기록을 완벽하게 파악할 수 있으므로 색인 성능을 명확하게 파악할 수 있습니다.

videoImage

자신있게 크롤링하세요

크롤링 제어 완료

웹 크롤링을 설정, 유지, 추적 및 개선하세요.

  • 관리

    도메인 및 진입점을 관리하고, 탐색 규칙을 지정하며, 내용 내에 탐색기 지시사항을 포함합니다.

  • 모니터링

    크롤링을 실시간으로 감시하고 이벤트 및 시스템 로그를 통해 크롤링을 완료한 후 감사를 크롤링합니다.

  • 문제 해결

    탐색 안정성, 콘텐츠 검색, 콘텐츠 추출 및 색인에 영향을 미치는 모든 문제를 식별하고 해결합니다.

통합 검색 애플리케이션

하나의 콘텐츠 소스, 모든 것

데이터베이스 또는 콘텐츠 관리 시스템의 문서, 파일, 필드, 메타데이터 및 기타 주요 정보를 유연하고 효율적으로 캡처, 색인 및 동기화합니다. API 수집, 사전 구축된 커넥터 또는 구성 가능한 커넥터 패키지를 사용하여 이 데이터를 Elastic으로 빠르게 수집합니다. 데이터를 수집하는 동안 직관적인 UI와 간단한 규칙을 사용하여 동기화할 개체와 시기를 선택하세요.

  • Box

    저장된 파일, 메타데이터 등

  • Confluence

    스페이스, 페이지, 블로그 게시물 등

  • Dropbox

    저장된 파일, 메타데이터 등

  • GitHub

    문제, 풀 리퀘스트, 리포지토리 등

  • Gmail

    제목줄, 이메일 내용 등

  • Google Drive

    Google Workspace, 저장된 파일 등

  • Jira

    에픽, 프로젝트, 문제 등

  • 네트워크 드라이브

    데이터 추출 및 동기화

  • OneDrive

    저장된 파일, 메타데이터 등

  • Salesforce

    연락처, 채용 정보, 잠재 고객, 샌드박스 등

  • ServiceNow

    사용자, 인시던트, 기사 등

  • SharePoint

    사이트, 저장된 파일 등

  • SharePoint Server

    사이트, 저장된 파일 등

  • Slack

    채널, 대화 등

  • Zendesk

    티켓 내용, 상태, 우선 순위 등

  • 다른 모든 것

    사용자 정의 소스 API를 다른 모든 데이터 소스에 연결

자신있게 연결하세요

검색 환경을 위한 연결 조직

중요한 데이터 원본에서 콘텐츠를 연결하고 동기화하는 여러 보안 경로를 통해 색인이 필요한 모든 도구에 대한 수집 파이프라인을 사용자 정의할 수 있습니다.

  • 기본 제공

    인기 있는 콘텐츠 소스에 미리 구축된 커넥터를 활용하여 색인 및 동기화를 능률화합니다.

  • 원하는 프로토콜을 직접 구축하세요

    사용자 정의 커넥터 패키지 및 API를 통해 자체 개발 데이터 플랫폼, 레거시 시스템 등에 쉽게 연결할 수 있습니다.

  • 액세스 제어

    올바른 사용자가 올바른 내용을 볼 수 있도록 문서 수준의 권한으로 적절한 액세스 권한을 확보합니다.