콘텐츠 및 데이터 수집

성공을 위한 인덱스

Elastic은 모든 유형의 데이터와 콘텐츠를 위한 강력하고 유연한 수집 메커니즘을 구축하기 위한 기본 도구 또는 API를 통해 필요한 모든 도구를 제공합니다. 빠르게 설정할 수 있으며, 데이터를 보강, 변환 및 조작할 수 있는 다양한 옵션이 제공되므로 강력한 검색 애플리케이션을 구축하는 데 집중할 수 있습니다.

Open Web Crawler는 베타 버전입니다. 크롤링 및 추출 규칙을 설정하고 시맨틱 텍스트 검색과 결합하는 방법을 알아보세요.

자세히 보기

Elasticsearch API를 사용하여 데이터 색인 시작하기

안내서 보기

모든 유형의 도구와 모든 종류의 데이터에 연결하는 방법을 확인하세요.

통합 보기

데이터 수집 엔진

다양성은 수집의 맛

데이터를 색인 및 관리할 수 있는 강력한 사전 구축형 데이터 수집 도구와 노출된 API를 통해 수집 파이프라인을 완벽하게 제어하세요.

  • 데이터 추출

    PDF를 포함한 모든 웹사이트 콘텐츠를 검색, 추출, 색인 및 동기화하세요! Elastic Open Web Crawler를 사용하여 웹 페이지를 검색 가능한 데이터로 변환하세요.

  • 데이터 커넥터

    널리 사용되는 생산성 도구에 커넥터를 활용하고 편리한 API로 데이터 소스용 커넥터를 구축할 수도 있습니다.

  • 수집 API

    편리한 색인 엔드포인트를 사용하여 JavaScript, Java 및 Python과 같은 인기 있는 언어 클라이언트를 사용하여 사용자 정의 수집 파이프라인을 구축할 수 있습니다.

  • 데이터 파이프라인

    기존 Elasticsearch 인덱스 또는 Elasticsearch 쿼리 구문을 사용하여 데이터 수집 파이프라인 및 관리를 유지하세요.

웹사이트에 검색 추가

웹 콘텐츠를 색인하는 가장 빠른 방법

유연한 API를 사용하여 원하는 방식으로 크롤링을 구성하세요. Elastic의 Open Web Crawler를 사용하면 크롤링을 제어할 수 있습니다.

Video thumbnail

Elasticsearch - 가장 널리 배포된 벡터 데이터베이스

복사하여 2분 내에 로컬에서 시도

curl -fsSL https://elastic.co/start-local | sh
Read docs
또는

프로덕션을 위한 배포

Start free cloud trial

또는, download on-prem

지금 크롤링을 시작하세요!

터미널과 Elasticsearch로 웹 콘텐츠용 크롤러를 설정하고 배포하세요.

  • Docker 이미지 실행

    Source 또는 Docker에서 실행하여 자체 인프라에 웹 크롤러 코드를 배포하세요.

  • 크롤링 URL 설정

    크롤링하려는 URL을 하나 이상 설정합니다.

  • 구성 및 연결

    탐색 안정성, 콘텐츠 검색, 콘텐츠 추출 및 색인에 영향을 미치는 모든 문제를 식별하고 해결합니다.

통합 검색 애플리케이션

하나의 콘텐츠 소스로 모든 것을

데이터베이스 또는 콘텐츠 관리 시스템의 문서, 파일, 필드, 메타데이터 및 기타 주요 정보를 유연하고 효율적으로 캡처, 색인 및 동기화합니다. API 수집, 사전 구축된 커넥터 또는 구성 가능한 커넥터 패키지를 사용하여 이 데이터를 Elastic으로 빠르게 수집합니다. 데이터를 수집하는 동안 직관적인 UI와 간단한 규칙을 사용하여 동기화할 객체와 시기를 선택하세요.

  • Azure Blob Storage

  • Confluence Cloud 및 Sever

  • Dropbox

  • GitHub 및 GitHub Enterprise Server

  • Google Cloud Storage

  • Google Drive

  • Jira Cloud 및 Server

  • Microsoft SQL

  • MongoDB

  • MySQL

  • Network drive

  • OneDrive

  • Oracle

  • PostgreSQL

  • S3

  • Salesforce

  • ServiceNow

  • SharePoint Online

  • Box

  • 맞춤형 커넥터

  • Gmail

  • Outlook

  • SharePoint Server

  • Slack

  • Teams

  • Zoom

자신있게 연결하세요

검색 환경을 위한 연결 조직

중요한 데이터 원본에서 콘텐츠를 연결하고 동기화하는 여러 보안 경로를 통해 색인이 필요한 모든 도구에 대한 수집 파이프라인을 사용자 정의할 수 있습니다.