- 2006/12/01 掲載
東芝ソリューション、自然言語処理機能を搭載し検索性能を向上させたXMLデータベース TX1 V2を発売
東芝ソリューションは、自然言語処理機能の搭載で検索性能を向上し、RDBやNotesなどさまざまな形式のデータをXML形式に変換し登録する機能を搭載した、XMLデータベース TX1の新バージョンV2を商品化し、コンテンツ管理システムやデータ統合システムに向けて販売開始した。
今回商品化されたTX1V2は、コンテンツ管理システムやデータ統合システムに適した二つの機能を新たに搭載する。
一つ目の機能として、形態素解析方式の検索が行える自然言語処理機能を搭載し、単語の意味に着目した検索ができる。Nグラム方式と形態素解析方式を型番や本文といったXMLのタグ単位で使い分けられる。 例えば「東京都港区」というデータの場合、「東京/京都/都港/港区」という単位で索引化するNグラム方式では「京都」で検索した結果が含まれてしまうが、形態素解析方式では「東京/都/港/区」と単語に意味を持つ単位で索引可能だ。型番などの英数字列はNグラム方式、長い文章からなる本文などは形態素解析方式と使い分けることが理想的となる。
![]() |
Nグラム方式と形態素解析方式のXMLの要素単位での使い分けの例 |
二つ目の機能として、RDB、Notesなど企業内の様々な形式のデータをXML形式に変換しTX1に登録する、データ連携機能を新たに搭載。元データからXML形式へのデータ変換方法を指定して実行することで、TX1へXMLデータとして登録することができる。これにより、既存システムをそのまま運用しながら、複数システムに分散したデータを一元管理するデータ統合システムを構築可能となる
![]() |
データ連携機能を活用したデータ統合システムの例 |
関連コンテンツ
PR
PR
PR