A CNET SITE CNET Japan

2007年8月2日 10時15分 

画期的な日本語解析製品(開発コード)「マリモ」を提供開始

From News2u.net

辞書メンテナンス不要で高精度な形態素解析を実現。あらゆる新語に対応。

ムーター株式会社(本社:東京都渋谷区、代表取締役社長:稲村尚志)は、最新のアイデアと技術に基づき開発された日本語解析エンジン(開発コード「マリモ」)の提供を開始します。
昨今のインターネットは掲載されている内容に連動した広告を提供するなど、日本語の解析とそれに基づくサービスの提供が普通に行われるようになりました。「マリモ」は一般的な辞書を必要とせず、そのために従来とかく人手に頼っていた辞書のメインテナンスを不要にする画期的な日本語解析技術です。
近年、商品の購入やサービスの提供を受けた後で、その感想をブログ・SNSや掲示板に書き込むという行動が、消費者の日常的な行動パターンとなってきています。消費者は商品のカタログ以上にそれらの書き込みを参考にする傾向が有ります。また、携帯コンテンツ・掲示板・電子メールなどで使われている言葉は、口語をそのまま書き込むという傾向があり、新聞や国語教科書などの日本語からからかけ離れた文法も多く見受けられます。そのような独自の文章・語句を解析するのに従来の辞書に依存する形態素解析では正確を期することができませんでした。そこで、ムーターは未知語登録の必要が無く、新しい文法の構文解析ができるムーター形態素解析エンジン「マリモ」を開発いたしました。
日本語解析はインターネット検索サービスを始めとして日本語の自動認識が必要な様々な分野に利用されています。従来の日本語解析はまず形態素(品詞)ごとに文章を区切り、それぞれの区切りを辞書と比較することで名詞や動詞などの品詞を確定して日本語を解析しています。この方法では辞書に出てこない新しい言葉をコンピュータが理解することは不可能で、そのため人手による辞書のメインテナンスが常に求められていました。
マリモはインターネット上の様々なカテゴリのテキスト文書を収集して単語候補を選別し、さらに選別された単語候補から不適切なものを排除して必要な単語だけを抽出し新造語を含む一億語以上の単語を学習しています。また、マリモ最大の特徴である、単語の前後関係から品詞を判断する品詞予測アルゴリズムは流行し始めた新語の品詞を特定することができます。これにより日々進化し続ける新しいテクノロジーやサービスに伴って生まれてくる言葉に的確に対応できる唯一の日本語解析として「マリモ」が登場しました。
「マリモ」は製品開発者向けのデベロッパライセンスとユーザー向けのサーバライセンスとして販売され、日本語を活用する様々な環境で利用されることを想定しています。何れのライセンスも従来のレベルより使いやすい価格設定となっており、サーバライセンスが1CPUあたり100万円以上を予定しています。客先としては、インターネットで検索サービスを提供しているポータルサイト各社を始め、構文解析が重要な割合を占めるコンテンツマッチ広告提供先やバイラルリサーチ(口コミ情報の解析)、トレンド調査、スパム対策、新造語の波及度合い調査などに容易に応用が可能であり、日本語処理が必要な企業内検索システムを提供する各社その他に初年度1億円の売上を見込んでいます。製品は移植性が高く、Windowsサーバ、Linuxサーバが標準でサポートされます。
Mooterはインターネット検索エンジン Mooter (リンク)やモバイル検索エンジン Mooter (リンク)のサービスを提供しています。検索結果を全て一覧表示する従来の検索エンジンとは異なり、検索結果のリストとともに、ソフトウェアが自動的に分類したクラスター(情報の分類)が表示され、膨大な情報から瞬時に検索の応用知識がなくても自分が求めている情報分野を把握できて、すばやく、正確に欲しい情報までたどり着くことができる世界最速級のクラスタリングサーチエンジンです。
Mooter とは、Moot(討論する)に由来しており、ヒトとソフトウェアとの価値観を近づけることを開発理念として、デジタルライフサイクルにおける IT コンシェルジュを目指しています。
以上
■ 本リリースに関するお問い合わせ先
製品に関わるお問い合わせ
E-Mail: info@mooter.co.jp
Tel: 03-5464-9699
製品担当: 田中