プロフェッショナルが語る FAXOCR システム
公開:2013年08月01日
多変量解析法を用いた高性能文字認識エンジンの搭載により入力効率を向上し、エントリー業務を支援
食品メーカーでの受発注や、金融機関での審査申請など、幅広いビジネスで利用されているFAXOCR。エントリー業務の効率化など生産性を高める観点から、文字認識率の向上に対するニーズは、高まりを見せています。そこで三菱電機インフォメーションシステムズ株式会社(MDIS)は、FAXOCRの核となる文字認識エンジンを新たに開発。FAXOCRシステム「MELFOS(メルフォス)」に、高性能文字認識エンジンを追加搭載しました。これにより、入力業務の一部自動化を実現し、入力時間を約20%削減しました。
200社以上の導入実績を有するFAXOCRシステム MELFOS
「FAXOCRのビジネスを展開するなかで、多くの方からFAXを使った業務の将来について質問をいただきます。FAXは今でも、メーカーや通信販売の受注業務、人材派遣業での勤怠管理、金融業でのカード審査申請受付などで利用されています。特に、書類を重視する日本企業では、インターネットやEDI(電子データ交換)の普及が今後さらに進んだとしても、FAXを活用した業務は引き続き行われていくはずです」と、ITソリューション事業部 ITプロダクト部 部長の福田隆氏は語ります。
FAXOCRシステム MELFOSは、FAXで送られてきた手書きの文字を自動認識してテキストデータに変換し、各種システムへの入力を支援するシステムです。
発売以来、FAXによる受発注、集計、報告、管理まで幅広い業務で活用されてきました。ITソリューション事業部 ITプロダクト部 CTI課 課長の滝田健司氏は「独自のノイズ除去技術を搭載したMELFOSは、他社のFAXOCRと比べてFAX特有の文字のカスレ、伸縮、変形、画像のつぶれ、縦線ノイズなどに強く、現場の方から高い評価をいただいています。専用のOCR帳票でなくとも、WordやExcelで作成した黒枠の帳票であれば読み取れるので、運用コストの削減にも効果的です」と説明します。
MELFOSがリリースされたのは1997年のことでした。それまで高価な専用機で提供されていたFAXOCRを、Windows版のアプリケーションとして発売。専用機による高価なFAXOCRが、普及価格帯のソフトウェアとして提供されたことで人気を博しました。
ITソリューション事業部 ITプロダクト営業部 部長の小野健一氏は「食品メーカーや携帯電話の加入申請業務を行う通信キャリアなどから多くの引き合いをいただきました。以降、様々な業種・業態で採用され、これまでに200社以上のお客様に導入・活用いただいています」と語ります。
さらなる効率化に向けて高性能文字認識エンジンを搭載
発売以来、16年にわたり多くの企業で利用されているMELFOS。ユーザーからは入力業務のさらなる効率化に向けた要望が寄せられるようになりました。
実際にFAXが利用される環境は、OCRにとって理想的な状態ではなく、くせのある手書き文字はすべて正しく識別できるわけではありません。例えば、数字の「3」は、「2」や「8」、数字の「7」は「1」や「9」のように誤認識されることが考えられます。そこで、エントリー業務では帳票に記載された手書き文字と、FAXOCRで読み取った入力情報を、人手を介して確認することが求められます。
MDISでは今回、こうした確認・修正作業の負担を軽減し、入力業務を効率化・自動化することを目的に、数字の誤読率を従来の3分の1以下に抑えた高性能文字認識エンジンを開発しました。これによってFAXOCRによる入力業務を一部自動化し、入力時間を約20%削減します。
「エントリー業務のミスは企業の信用問題に関わります。そこで全件チェックを行うわけですが、その生産性を高めるためには、OCRによる『誤読』をなくすことがポイントになります。新開発の文字認識エンジンでは、判別が難しい文字はあえて判読することなく人手による確認が必要だということを示すことで、正読と不読を明確に分離できるようにしました。これにより、人手による確認・修正作業はMELFOSが『不読』と判別した数字だけに絞られ、今まで1時間かかっていた作業なら、約50分程度に短縮されます」(滝田氏)
BCP(事業継続)対策への声に応えるためシステムの広域化や仮想化に対応
MELFOSのもう1つの特長が、Web方式による広域対応です。従来のMELFOSは、導入拠点以外でFAXOCRの結果を確認したり、修正したい場合、導入拠点に専用サーバーと専用ソフトを導入する必要がありました。
ところがWeb方式に対応した新バージョンでは、専用設備なしでMELFOSにアクセスして入力・確認業務を行うことができます。「東日本大震災以降、BCP(事業継続)対策の観点から、サーバーを安全なデータセンターに移設して受注センター間をWeb接続(イントラ)とする企業が増えてきました。こうした企業ニーズにわずかなコストで柔軟に対応できます」と福田氏は語ります。
また、従来は物理サーバーに限定されていたFAXサーバーが、仮想サーバーに対応。数百回線のFAX受注業務が1台の物理サーバーで利用できるようになりました。その結果、サーバーの集約による省スペース化も実現します。
このように、文字認識率が向上し、利便性が向上したMELFOSは、今まで以上にFAXを使った業務の効率化に貢献することは間違いありません。最後に小野氏はMELFOSの販売戦略と将来展望をこう語りました。
「自動入力に対応した新しいMELFOSは、新規導入のお客様だけにとどまらず、既存のFAXOCRシステムの更新を迎えたお客様にも積極的に提案していく予定です。MDISでは、オンプレミス型(自社導入型)のMELFOSに加え、IP-VPN(通信事業者による広域IP通信網)経由で利用できるサービス型(SaaS型)のMELFOS on Demandを2年前にリリースし、一定の期間だけFAXOCRを利用したいお客様等の声にも応えてきました。今後も利用者のニーズに応え、より使いやすい形で製品・サービスを提供していきます」
100万件の手書き文字辞書を搭載する新開発の文字認識エンジン
従来のMELFOSは、文字の変形やカスレに強い「輪郭解析法」と「特徴マッチング法」の2つの方式を併用して数字や英字を認識していました。新バージョンのMELFOSでは、大規模な文字データから「多変量解析法」を用いて特徴を抽出した、文字認識エンジンを追加搭載しています。新しい認識方式について、研究開発を担当した三菱電機 情報技術総合研究所 音声・言語処理技術部の伊谷裕介氏は次のように説明します。
「多変量解析法とは、複数のデータを基に、これらの相互関係を解析する方式で、音声認識などにも採用されています。新バージョンのMELFOSでは、1つの文字から元となる特徴量を抽出し、多変量解析法により識別に有用な特徴量を抽出し、この特徴量を用いて認識辞書を作成しました。
100万件と大規模な手書き文字データから作成した辞書とマッチングさせて最も相関性の高い文字を正読として表示しています。この大規模な手書き文字データから多変量解析で文字の特徴を抽出しているため、従来の2方式と比べて認識率が高く、誤読率の大幅な低減を実現しました。この辞書は、MELFOSを実際に使っていただいているお客様の協力・許可を得た実際の手書き文字データから作成したものです」
大量の情報を分析する多変量解析法を採用した背景には、CPUやメモリーなどハードウェアのスペック向上とコストの削減がありました。さらには長年の実績から実運用に即した文字サンプルを集められたことも大きな要因だったといいます。
「開発時は、大量の手書きデータから特徴的でかつ実務で使われやすいサンプルを選ぶように配慮しました。学習データについては、少なすぎると認識率は高くなりませんし、闇雲に増やしても、処理が増えるだけで認識精度が大きく変わることはありません。100万件という数は、処理量的にも認識の正確さからも適切なデータ量です」(伊谷氏)
記事について
メールマガジン登録
上記コラムのようなお役立ち情報を定期的に
メルマガで配信しています。
コラム(メルマガ)の
定期購読をご希望の方はこちら