今回の「多言語情報処理環境」に係る海外調査では、マレーシア、シンガポールを訪問した。訪問先は、国家標準機関、大学等である。
調査内容は、「文字・カラー表現調査」である。同行者は「多言語調査」の担当であり今回の調査中行動を共にした。
マレーシア、シンガポールは他のアジアの国々とは趣を異にしている、なぜなら、英語を主体とした国であり、また多言語処理に関してはそのお国柄から自然発生的な需要が在り、多言語に基づくシステムの開発も進んでいるからである。よって、今回の調査としては、その実態と、要求を把握することが主たる目的である。
以下は、報告書のダイジェスト版であるが、報告書の詳細版も参照願いたい。
マレーシア、シンガポール、文字・カラー表現調査 報告
(ダイジェスト 版)
マレーシア 編
(1) 調査者および同行者
中出 秀樹 CICC 研究員
石崎 俊 慶応義塾大学教授(多言語調査 担当)
小林 龍生 株式会社ジャストシステム デジタル文化研究所 ディレクター(多言語調査 担当)
(2) 調査日程
平成10年2月24日〜2月27日
(3) 訪問先
University Sains Malaysia
Dr. Zaharin Yosoff(Prof.), Dean of School of Computer Sciences.他2名
National Universiti of Malaysia
Dr. Abdul Razak Hamdan(Prof.), Dean of Faculty of Information Science
& Technology. 他3名
SIRIM Berhad
Mr. Rajinder Raj, General Manager of Standards Management Department,
SIRIM Berhad. 他2名(SIRIM Berhad)
Mr. Ahmad Hishamuddin Abdullah, Director of INFOLAB, KOLEJ MELAYU KUALA
KANGSAR.
Assoc. Prof. Dr. Ahmad Zaki Abu Bakar, Manager of Integrated Graduate
Development Scheme(IGDS), Business & Advanced Technology Center.
書店(資料購入および視察)
(4) 入手資料
Jawi文字規格集 3種類
各国言語処理ソフトウェア・リスト
国内規格カタログ
Jawi文字規定集 2種類
新聞 6種類
(5) 調査結果
1) カラー表現
今回、マレーシアにおいては、2つの国立大学の情報系の学部とSIRIM Berhad(Standards
and Industrial Research Institute of Malaysia)という、マレーシア国家系(Minister
of Finace Incorporated)の標準機関を訪問した。
大学においては、カラーの専門家ではないが情報系の学者として、文化・習慣的な問題と、コンピュータ・サイエンスででのように扱うかという2つのアプローチの重要性について議論を行った。また、SIRIMにおいては、現在マレーシアの国内規格としてはカラーに関する標準はよく分からないということで、カラーに関する興味はあまり感じられなかった。アンケートについては即答できないということで、後程送付してくれるとのこと。
マレー語においては、Pink色に対してグァバレッドが当てられているそうであるが、実際のグァバレッドは果実の色でオレンジに赤みが掛かった色であり、Pinkとは少し色合いが違うということである。また、NavyあるいはDark
Blueに相当する色表現は難しいらしく複数の答えが返ってきた。
16色集合はRGB各色の離散の幅が一定であり、生活に根づいた色表現とはその幅が合わないようである。16色集合に直接マレーシア語の色名を対応させるのは、難しい色があるとのことであった。
2) 文字表現
マレーシアでは、マレー語、インド語、中国語が使用されており、インド語はタミール文字を、中国語は漢字(簡体字、繁体字)を使用している。マレー語は通常ラテンアルファベットを用いて表現するが、アラビア系文字であるJawi文字を使用することもある。
マレーシアは14の州からなるが、いくつかの州はJawi文字が公用語となっており、通常のビジネスもJawi文字が使われているということである。今回訪問したペナン、クアラルンプールにおいても街の新聞販売店にJawi文字の新聞が並んでおり、日刊、週刊で刊行されている。
Jawi文字はアラビア文字を起源にもつ文字で、ほとんどの文字がアラビア文字と同様であるが、6文字のJawi文字特有の文字がある。マレーシアでは、1994年に、ISO/IEC
8859のラテン=アラブ面を拡張する形で、Jawiに対応する文字コードを正式に制定しているが、まだ正式に8859に登録されていない。また、ISO/IEC
10646には、Jawiに独特なキャラクター6文字が、既に収録されているということである。
文字表現という意味ではアラビア文字と同等の表現であり、ラテン=アラビックの面へのJawi文字の拡張により、その実装が容易に実現できるであろう。そのためには、内部的にはUnicode化が進展すると思われるが、短期的にはユーザインタフェースの部分にISO/IEC8859
に対応する形でのコードページの切り換えが存続すると考えられるため、ISO/IEC
8859に対するJawi文字の登録が非常に有効であると考えられる。
シンガポール 編
(1) 調査者および同行者
中出 秀樹 CICC 研究員
石崎 俊 慶応義塾大学教授(多言語調査 担当)
小林 龍生 株式会社ジャストシステム デジタル文化研究所 ディレクター(多言語調査 担当)
(2) 調査日程
平成10年2月27日〜3月3日
(3) 訪問先
National University of Singapore, Kent Ridge Digital Labs.
Dr Low Hwee Boon, Senior Director, Strategy.
Cao Ling, Ph.D, Project Leader, Senior Software engineer.
Leong Mun Kew, Ph.D, Associate, Research Staff.
Dr. Paul Wu Horng Jyh, Associate, Research Staff.
Star+Globe Technologies Pte. Ltd.
Ms. Theresa V. Chan, Sales Account Manager.
Mr. Chong Chiah Jen, Product Line Manager.
Mr. Lee Sun Pin, Senior Software Engineer.
National Museum(視察)
(4) 入手資料
新聞 3種類
マルチリンガル・ソフトウェア資料 2種類
(5)調査結果
1) カラー表現
今回シンガポールにおいては、国立シンガポール大学のケンリッジ・ラボにてマルチリンガルを研究分野とする研究室と、その研究室から派生したシンガポールのベンチャー企業であるスターグローブ社を訪問した。
大学においては、専門外ということで質問には答えられないということだったが、われわれが調査している内容、および、その目的を説明した。印刷分野においては、パントン規格が産業として使われているということであるが、国家規格といういみでは存在しないとの話しであった。
アジア諸国においては、多くの国が国内規格の策定とその普及および国際規格への登録等に関し予算的な問題やノウハウの欠如により、その成果が期待できない状態であるが、ここシンガポールは特異な国と考えることが出来る。独自の言語としてはマレー語、中国語、タミール語等が存在するが、通常使われるのは英語である。実際訪問した本研究室では、中国系の人々が多く家庭では両親とマンダリンで会話をするということであるが、職場ではほとんどが英語であるということである。
色表現には、標準的な表現と慣用的な表現があるが、ここシンガポールでは、ほとんどの生活は英語で行われているため、色名の交換も英語によるものが普通であり、慣用表現的な色名も独自の言語には存在するであろうが、現時点では社会的には問題にならないのであろう。実際、マルチリンガル・アプリケーションを開発しているスターグローブ社においても、ほとんど気にされていないという状態であった。しかし、シンガポールは社会自体が英語を母体としたマルチリンガル社会であり、政府の情報化政策とあいまってマルチリンガル処理が発達しておりマルチリンガル先進国と考えることができる。よって、今後、シンガポールとの関係を強化することは日本にとって有効なことと考える。
2) 文字表現
シンガポールは英語を主体とした国ではあるが、マレー語、中国語、インド語の新聞等も存在し、政府の言語政策および情報化政策により、多言語処理が発達している。今回訪問した大学、ベンチャーにおいては、多言語キーワード検索、多言語高速テキスト検索、コンバージョン・エンジン等が研究課題であり製品である。
これらの多言語アプリケーションは中国語(繁体字、簡体字)、タミール語はもちろん、各国語をサポートする予定であり、その販売形態はアメリカ、ヨーロッパ等のデータベース会社等がそのシステムにバンドルして多言語システムとして販売するというものであり、既にアメリカ、ヨーロッパはもちろん、インド、スリランカなどとも取り引きがあるという。
このように、シンガポールの基本は英語社会でありUnicodeによるインプリメンテーションを基本とするが、マルチリンガル先進国としてインド系文字はもちろん世界各国の言語をサポートしようとしており、その技術の蓄積は多言語文字表現を考える際に大いに参考になる。
こうした状況から、シンガポールの東南アジアの経済的拠点としての役割や、ISO/IEC
JTC1/SC2のPメンバーであるという政治的な力も勘案すると、シンガポールの協力が得られれば、さまざまなメリットがあるであろう。
ここにおいて、シンガポールのこの必要に応じた多言語処理ではあるが、今後シンガポールとの協力関係を持って、アジア諸国に対する技術的、経済的、政治的支援を行うことは非常に有効であると考える。
If you have comments or suggestions, email me at nakade@mri.co.jp
This page created with Netscape Composer