ハイランド「ナレッジエンリッチメント」とは
「ナレッジエンリッチメント」はハイランドのAI駆動型ソリューションで、未加工の非構造化コンテンツを意味のある構造化データに変換して、AI、自動化、分析、ソリューション構築のために利用可能な状態にします。例えば、重要エンティティの抽出、メタデータの適用、コンテキスト情報との関連付け、初期状態で機械での読み取りと実用が可能な状態にするなどのアクションを実行します。
ナレッジエンリッチメントは主に次の2つのコンポーネントで構成されています。
- 「データキュレーション」の主な役割は、非構造化データを構造化、正規化することであり、使用可能な最終形にします。このプロセスの原動力となるのがハイランドドキュメントフィルターです。この点検・抽出・変換ツールは600種類以上のファイル形式のデータを構造化しつつ、元の文書のコンテキストを維持します。
- 「コンテキストエンリッチメント」は非構造化データの内容を充実させるために、関連するコンテキスト情報と関連付け、検索可能性とAI処理、意思決定を向上させます。
ナレッジエンリッチメントで業務手法を変える方法
データを構造化された最終形にするために処理後に複数の手順を実行する代わりに、ナレッジエンリッチメントはワークフローの早い段階でインテリジェンスを組み込みます。これによりコンテンツは取り込まれ次第、下流アプリケーションに合わせて最適化されます。
ナレッジエンリッチメントの仕組み:やや技術的な説明
ナレッジエンリッチメントのAPIは、堅牢な技術と自動化機能を組み合わせることで、質の高い構造化データを確実に出力する仕組みになっています。
定評あるツールによるデータのキュレーション機能
文書フィルターは600種類以上のファイル形式のコンテンツを抽出、正規化、構造化します。下流アプリケーションで利用可能なデータは一貫性のある最終形になるうえ、文書の論理的構造は維持されます。これにより組織は、多様な文書タイプのデータを、元の意味や意図を失うことなくシームレスに統合できます。
メタデータの自動タグ付け機能
メタデータの自動タグ付け技術により、画像を分析して、オブジェクト、場面、テキストなどの主な要素を特定したうえで、メタデータを生成して検索可能性とAIモデルの精度を向上させます。この機能により画像の分類と検索の効率が高まり、コンテンツへのアクセスしやすさと関連度を高めることができます。
データの正規化と構造化機能
ナレッジエンリッチメントは、非構造化テキストを標準形式に変換することで、コンテンツを機械学習、分析、自動化ワークフローで利用可能な状態にします。変換プロセスには、重複排除、形式標準化、インテリジェントコンテンツのセグメント化が含まれます。
固有表現認識(NER)
固有表現認識(NER)は、人、組織、場所といった基本的なエンティティを文書から特定し、コンテキストに応じた意味を割り当てる技術です。この技術により、分類作業の合理化とインテリジェントワークフローの自動化が可能になります。
ナレッジエンリッチメントで上記プロセスを自動化すると次の成果が得られます。
- 手動でのデータ準備作業の比率が下がる
- データの一貫性が高まる
- AIと分析アプリケーションによるインサイト生成が迅速化する
ナレッジエンリッチメントの導入実例
製品検出率の向上から保険請求処理の合理化や患者記録の構造化まで、ナレッジエンリッチメントは組織がより良い成果を実現し、シームレスに拡張するのに貢献しています。以下では、この製品がデータに関する複雑な課題の解決に真価を発揮している実例をご紹介します。
小売業:メタデータ生成を自動化
ある小売り大手企業は、メタデータの生成を自動化し、製品カタログ全体で固有表現を特定するためのソリューションを必要としていました。ナレッジエンリッチメントは、メタデータに一貫したタグ付けを適用し、コンテキストに応じた説明を作成しました。その結果、文書に関するデータの正確性向上、自然言語による検索の効率アップ、推奨エンジンの改善という成果を挙げることができました。
利用したナレッジエンリッチメントの機能:
- データキュレーションは、多様な文書形式にわたる製品情報の抽出と構造化に利用されました。
- コンテキストエンリッチメントは、ブランド、仕様、分類などの主な属性の特定に利用されました。
- メタデータの自動タグ付けは、検索精度と製品検出率を向上するために利用されました。
上記の強化機能により、製品データの信頼性と検索結果の関連性が高まるとともに、よりパーソナルな推奨が可能となりました。
21
企業が使用するコンテンツリポジトリの平均数
65%
非構造化データは組織内でほぼ未開拓の機会であると回答した率
89%
コンテンツインテリジェンスにAIを最大活用していない組織の割合
— 『The Rise of Content Intelligence: A New Era of Innovation in ECM』、Forrester、2025年
保険業:保険請求処理を改善
毎日数千件の保険請求を処理している保険会社を思い浮かべてください。従来、こうした請求にはさまざまな構造の書式と構造化されていない関係文書(診断書や写真など)が含まれます。ナレッジエンリッチメントがなければ、請求処理には膨大な手作業と不必要に時間のかかる承認手続き、高額の運用費が必要になったことでしょう。
ナレッジエンリッチメントの実装で利用可能になった機能:
- データキュレーションは多様なファイルタイプからコンテンツを抽出し、構造化する一方で、文書のコンテキストは維持します(写真、文書、メールなどが含まれる保険金請求ファイルは典型例と言えます)。
- コンテキストエンリッチメントは、保険金請求者、医療機関、車両の詳細などの主なエンティティを特定し、関連する保険契約と請求データと関連付けます。
- 画像分析は、提出画像に含まれる、車両のメーカーとモデル、損害の程度、請求との食い違いといった重要な要素を検出し、不正発見と請求の検証に役立ちます。
ナレッジエンリッチメントの利用は、保険請求処理の迅速化、手作業負担の軽減、不正発見率の向上につながります。
ヘルスケア業:患者記録を構造化してインサイトの質向上
医療提供者が扱う構造化されていない患者データは、医師のメモ、病歴、処方薬、検査結果など膨大な量に及びます。こうした記録から手作業で意味のある情報を抽出するのは、時間がかかるうえ、ミスが起こりがちです。
ナレッジエンリッチメントの実装で利用可能になった機能:
- コンテキストエンリッチメントは多様な医療文書から診断、投薬、アレルギー、検査結果などの重要な情報を抽出します。
- データキュレーションは患者データを標準形式に構造化して、電子カルテ(EHR)システム全体にわたる相互運用性を確保します。
- ナレッジエンリッチメントは、AI駆動型分析、予測モデリング、臨床判断の支援といった目的で重要な患者情報をすぐ利用できるようにして、意思決定の質を向上させます。
構造化されていない患者記録を実用可能な構造化データに変換することで、医療提供者は運用効率の向上、患者の転帰の改善、規制要件の準拠の合理化を達成できます。