Aryn.ai

Aryn は、PDF、HTML、プレゼンテーションなどの複雑な非構造化データに対応するAIを活用したドキュメント解析およびETLシステムです。30種類以上のファイル形式を処理し、表や画像などを高品質で抽出できます。Arynを使用して、ドキュメントのチャンク化、メタデータの抽出、ベクトル埋め込みの作成、高品質のデータを使用したElasticsearchベクトルおよびキーワードインデックスのロードを行うことができます。

ArynのドキュメントETLシステムには2つのコンポーネントがあります。

  • Aryn DocParseは、ドキュメントのセグメント化とラベル付け、光学文字認識(OCR)の実行、表と画像の抽出を行うサービスです。各ドキュメントの構造化された出力(JSONまたはMarkdown形式)を返すことができ、タイトル、表、表の行と列、画像、および通常のテキスト用のラベル付きバウンディングボックスを提供します。DocParseは、PDF、Microsoft Word、Microsoft PowerPoint、テキストなど、30種類以上のドキュメント形式を処理できます。Aryn Partitionerと、8万件以上の企業ドキュメントでトレーニングされた最先端のオープンソースディープラーニングAIモデルを活用します。DocParseは、生成AIアプリのドキュメントETLパイプラインで使用したり、テーブル抽出やドキュメント処理のワークフローのみを目的として(この動画のように)使用できます。
[@portabletext/react] Unknown block type "block", specify a component for it in the `components.types` prop

使い始める

  1. ブログ:Aryn DocPrep、DocParse、Elasticsearchベクトルデータベースを使用した高品質RAG
  2. ノートブック:Elasticsearch用ArynによるRAG。

最先端の検索体験を構築する準備はできましたか?

十分に高度な検索は 1 人の努力だけでは実現できません。Elasticsearch は、データ サイエンティスト、ML オペレーター、エンジニアなど、あなたと同じように検索に情熱を傾ける多くの人々によって支えられています。ぜひつながり、協力して、希望する結果が得られる魔法の検索エクスペリエンスを構築しましょう。

はじめましょう