一太郎Arkを様々な視点から見ていただく「Arkレビュー」、今回は、日本IBMの三上吉彦さんに、マルチリンガル処理の面から、一太郎Arkの今後の可能性に言及していただきます。なお、英語での紹介ページも作成していただきましたので、どうぞご利用ください。




In English(英語版)


三上 吉彦(日本IBM ソフトウェア事業部)

もうその道の古典になってしまった「電脳外国語大学」(技術評論社、1991)の編著者に名を連ねてから、約10年。社内・社外から毎週「私の担当しているお客様から、今度xx国へ工場を移すことになったのでxx語の処理を教えてくれと言われたが、分らない。助けて!」というような質問をもらい、それに答えているうちに、私のコンピューターによる外国語処理への理解もさらに進みました。質問への回答には、自分のホームページ「世界の言葉」を使ったり、共著で啓蒙書「マルチリンガルWEBガイド」(オライリー・ジャパン、1997)を書いたり、メーリングリスト「MULCO」(Multilingual Computing Users Group)でみなさんと一緒に考えたりしています。

写真はインドネシア・ヨグヤカルタ近郊のプランバナンのヒンドゥー教寺院遺跡前で。


一太郎Ark 1.0の主な機能の1つに「世界中の言語に対応、しかも、複数言語の混在可能」とある。どの程度使えるものでしょうか。実は私はこの件について以前から興味があって、Arkが提供するワープロ機能も、普段エディターで作る私のホームページのHTML言語の機能範囲そっくりで、私にぴったりと感じていましたが、去年夏のPreviewプログラムは私のJava技術能力を超えていると思い参加できませんでした。

私は普段、ノートパソコン(ThinkPad 570Z、300MHz、96MB、Windows 98日本語版)に日本語FEP、フランス語キーボード、ロシア語キーボード、中国語簡体字(中国)・繁体字(台湾)のFEPを入れていて、左Alt-Shiftを押す度に、日本語FEP・ロシア語・フランス語・中国語FEPと次々に切り替わるようにして使っています。ここで、一太郎Arkでどのようにしたらマルチリンガル処理できるかを、昨年12月発売以来の私の短期間の経験から、みなさん大多数がお使いのWindows 95/98の上で探ってみようと思います。 Arkは聖書(The Bible)の「創世記」(Genesis)にある、人類滅亡の洪水から救ったノアの箱舟(Noah's Ark)のArkだそうで、マルチリンガル処理のサンプルとして聖書の「創世記」の出だし(下の図)を書いてみました。各国語の聖書は、日本でもほとんどの洋書店に置いてありますから、各国語の文字は洋書店で実際に確かめられます。私も新宿駅南口近くの有名洋書店で、立ち読みしながら写してきました!また、一太郎Ark「開発の現場から」シリーズの第4回「一太郎Arkの国際化」も合わせて参照してください。

一太郎Arkをインストール、起動したら、まず日本語と英語のテキストを入力してみましょう。最初に、メニューバーの書式、文書のプロパティーで文書のタイトルに「The Bible in Various Languages」と入力します。これはあとでHTMLに変換するときに<HEAD>部分に<TITLE>The Bible in Various Languages</TITLE>として変換され、ブラウザーで見ると画面上部にタイトルとして表示されます。同じく文書プロパティーの画面で、本文の言語はこれから6か国語を入れるので「標準」を選び、背景色にチェックマークを付けて、黄色を選びます。この色の背景で、ふだん使う黒色の文字が映えるようです。

私はフランス語を学生時代、後にNHKラジオでおなじみになった福井芳男先生から、上級会話まで習いました。フランス人は英語を知っていても話さないと聞いていましたが、米国で大学院・仕事で暮らす期間にパリへ出張になり、ホテルのフロントでフランス語でたどたどしく話しかけたら、流暢な英語で答えられて、以来世界でのビジネスは英語で済ませてきました。最近やっとまた、フランス語を多少習いはじめたところです。

フランス語のアルファベットは英語と同じですが、英語と違うところは、母音の上に鋭アクセント(')・鈍アクセント(`)・曲がりアクセント(^)・トレマ(分音符号、形はドイツ語のウムラウトに似ている)とC/cの下にひげを付ける(セ・セディーユ)ことです。フランス本国では大文字になるとこれらの符号は普通省略し、カナダ・ケベック州では絶対省略しないといった一般原則もあります。

Windows 95/98では、コントロールパネルからキーボード、言語、追加で、フランス語(カナダ)、左Alt-Shift(Ctrl-Shiftを選んでもよかった)を選んでOKとして、Windows CD-ROMからカナダ・フランス語用キーボード・リソースを入れられます。ここでフランス語(フランス本国)キーボードに指定しなかった理由は、フランス語(カナダ)キーボードは日本語JIS/米国ASCIIキーボードと同じQWERTY配列であるが、前者はフランス独特のAZERTY配列になり、AとZが入れ替わり、MがLの右側にきていて不便だからです。

一太郎Arkで、メニューバーのツール、言語・フォントの設定で、「追加」を「フランス語/カナダ」でOKとし、「標準」フォントのところに「Arial」を指定して、準備が完了です。これが日本語や以下に述べる言語でのフォントとバランスがいいように思います。Alt-Shiftでフランス語(カナダ)キーボードを出して(Windowsデスクトップの右下に「Fr」と出る)本文を入力して行くわけですが、まずテキストエリアを書式、フォント・言語、設定でフランス語(カナダ)、default(Arial)に指定します。フランス語のアクセント文字入力は、E/eアクサンテギュ(鋭アクセント)はMキーの右3つ目、その他のアクセント符号やセディーユ(C/cの下のヒゲ)はLまたはPの右側のキーにあるので探して、そこをキーインしてから該当文字を押すといい。テキストが各行の右端へ達したら、語全体を次の行に送るワード・ラップ(Word wrap)機能も一太郎Arkではうまくいっているようです。

細かい話になりますが、フランス語の伝統的句読点法は、文章の中のコンマ virgule (,)とピリオド point (.) はその直前の語にくっつけて置きますが、コロン deux-points (:) とセミコロン point-virgule (;) と疑問符 point d'interrogation (?) と感嘆符 point d'exclamation (!) については、直前の語との間にスペースを1つ置きます。実は1950年代までに英国で出版された英語の書籍も、ほとんどがこのルールを守っていて、ペンギン叢書(Penguin Classics、ロンドンのPenguin Books Ltd出版)の1950年代以前に出版された書籍もそうなっています。私は現在のアメリカ式句読点法「the Modern American Punctuation Method」に対して、これを伝統的英仏句読点法「the Traditional Anglo-French Punctuation Method」と呼んでいます。後者では、ワードラップも1スペース置かれているのに前の語と共に行ない、HTMLでは &nbsp; (non-break space) を挟んで句読点が行頭にこないようにしています。これはフランス語のワープロソフトには必ずあるオプションで、今後一太郎Arkでも検討するといいと思います。

Windowsのドイツ語キーボード・リソースは私は使っていませんが、YとZキーが入れ替わっており、UのウムラウトはPキーのすぐ右、OとAのウムラウトはLキーの右側に並んでいて、エスツェットβはゼロ0キーのすぐ右にあります。フランス語の時にフランス語(カナダ)キーボードと選んだと似たような理由で、ドイツ語(スイス)キーボードを選ぶのはあまり得策ではありません。後者でも、YとZキーが入れ替わっているのは変らず、βはスイスでは使わなくてssで済ますので、どうしても使いたい時はWindowsの常套手段であるAlt-nnnn(nnnnはコードテーブルの10進数番号を数値キーパッドから入力、ノートパソコンの時はNmLkキーにしてから)を使って、Alt-0223をキーボード右側の数値キーから入力するしかありません。DOS/Vの時代にはMS DOS/PC DOS英語モードでAlt-nnnと数字3桁を使いましたが、WindowsでAlt-nnnnと数字4桁になったのです。


我々の学生時代は、自然科学と技術分野をソ連が米国と張り合っており、ロシア語を習う学生も多く、モスクワ大学へ行けなくても、パトリス・ルムンバ名称民族友好大学くらいならと、ソ連へさまざまな形で留学を真剣に考える学生もいました。それでなくとも、ロシアは我が国の隣国、ロシア語の基礎を知っているのは大切だと思います。

ロシア語のアルファベットは、アーа、ベーб、ヴェーв、ゲーг、デーдで始まるもので、JISの全角文字セットにもギリシャ語のアルファα、ベータβ、ガンマγ、デルタΔと同様に入っていて、通常日本語FEPで「ロシア」と入れれば(ギリシャ語文字は「ギリシャ」)、何回か変換キーを押せば出てきます。ロシア語やブルガリア語などに用いられる文字をキリール文字(Cyrillic Characters)と呼ぶのは、ギリシャ語が公用語の東ローマ帝国から始めて聖書をスラブ語に翻訳してキリスト教を布教した聖キリ−ル(St. Cyril)と聖メフォーディー(St. Methodius)兄弟を記念して名付けられています。

Windowsにロシア語フォントを入れるには、コントロールパネルからアプリケーションの追加と削除、多国語サポート、キリル言語サポートを選んでOKとすると、Windows CD-ROMからキリル文字系のフォントが入ります。またコントロールパネルのキーボードからロシア語を選ぶとロシア語キーボードのリソースが入ります。JISキーボードのQWERTYの位置に、ロシア文字イークラトコエй(短いイーи、つまりy)、ツェーц(ts)、ウーу(u)、カーк(k)、イェーе(ye)、エヌн(n)の文字が並んでいます。

一太郎Arkを起動してロシア語処理の前に、2つやることがあります。まず、画面上のメニューバーで表示、画面表示設定、本文表示で「テキストアンチエイリアス」にチェックマークを付け、OKとします。次に、メニューバーのツール、言語・フォントの設定で「ロシア語」でOK,「標準」フォントに「Arial」を指定します。これが終ったら、ロシア語本文を入力できるようになります。Alt-Shiftでロシア語キーボードを選び(Windowsデスクトップの右下に「Ru」と出る)、テキストエリアを書式、フォント・言語、設定でロシア語、default(Arial)に指定して、あとは自由にロシア語を入力できます。

ここでフォントを「標準」に選んでからキーインすると、あとで述べるHTML変換した時に、Internet Explorerでの表示はOKであるが、Netscape Navigatorでの表示が全角ロシア語になってしまうため、そのような予定があるユーザーは「serif」に「Arial」を指定してからやるといいと思います。ロシア語キーボードのイョー(Ёё)は1キーのすぐ左ですが、そこに半角/全角キーがありうまく動作しないパソコンもあるので、ドイツ語のβの時のようにAlt-0168, 0184で入れられることも覚えておきましょう。


中国語は、丁度10年前に台湾の政府機関III(Institute for Information Industry、資訊工業策進會)との合弁会社のソフトウェア技術指導で台北へ2年ほど駐在になり、そこで覚えました。タクシーをよく利用したので、日本人は通常運転手と筆談で済ませるところを、「ヨゥツァーン」(右転、右折せよ)、「ツォツァーン」(左転、左折せよ)、「イーチーツォー」(一直走、まっすぐ)、「クォーマールー、ティンチャー!」(過馬路、停車!この大通りを過ぎて、止まる!)などを覚えて得意になって使っていましたから、いまでもタクシー用語は私の中国語の原点です。その後、永年勤続の4週間休暇で、中国・上海大学文学部で中国語上級を習いました。

中国・台湾は多民族国家ですが、多数派の漢民族が話す中国語も、多くの方言に分れています。ただし、書き言葉は基本的に北京語をもとにしていて、中国語の学校教育も北京語で行なわれています。台湾・香港では伝統的な中国語繁体字(Traditional Chinese、つまり旧漢字)を使っているのに対して、大陸内では中国語簡体字(Simplified Chinese)を使っています。例えば、中国という文字は、台湾・香港では「中國」と書くのに対して、大陸では「中国」と書きます。簡体字で一番よく使われるコード体系がGB-2312(GBは国家標準Guojia Biaozhunの略)で、繁体字ではBig5(5大アプリケーションでこのコードを使っていこうという計画が台北市電脳同業公會TCAにあった)です。

Windows用の中国語簡体字フォントとそのIME(中国大陸用)、中国語繁体字フォントとそのIME(台湾用)は、Global IME 5.01 for Simplified Chinese and the Language Pack、Global IME 5.01 forTraditional Chinese and the Language Packとして、最新版を日本語画面

http://www.microsoft.com/windows/ie_intl/ja/ime.htm
または英語画面
http://www.microsoft.com/windows/ie/features/ime.asp
からダウンロードできますから、特に後者は海外の方に聞かれたら教えてあげてください。ファイル名はscmono.exeとtcmondo.exeで、大きさはそれぞれ約4.1MBと3.8MBです。(韓国語フォントとIMEも同様にして入手できますが、ここのJapanese Languageは、悲劇がまっているので、絶対にWindows日本語版へインストールしないこと。)

これで、Microsoft Input Method Manager対応の多言語ソフト(Outlook Express、Wordなど。正式にはOutlook 98またはOutlook Express 4.0以上、Word 2000以上とある)で、中国語が入力できます。まず、簡体字はAlt-Shiftで左に「中」、右に「オ并」(手へんに并)の文字があり、中に月と点のマークがある浮動タスクバーが表示された状況で行ないます。これは通常ピンイン(漢字でオ并音)と呼ばれる入力方法で、いわゆる北京式ローマ字ですから、「上海」は「shang」、「hai」などと入れて行けばよい。ピンインは日本人が通常日本で中国語を習う時に使うので、なじみやすいでしょう。

Global IMEには、繁体字の入力方法が2つ入っています。Alt-Shiftでまず出てくる「半」または「全」と「ケ」(「包」の上部分)または「A」がある浮動タスクバーは「注音輸入法」と呼ばれている初心者向けのもので、浮動タスクバーを右クリックすると表示される「螢幕小鍵盤」(画面上のキーボード)の文字は、台湾で幼稚園・小学生から一般的に習う中国語の注音字母、通称「ボポモフォ」(カタカナみたいだが、実際には子音と母音)です。「bpmf」に相当する表音文字が、キーボードの左上から下へ「1QAZ」の順にアサインされています。難しいように見えますが、台湾へ中国語を習いに行くと必ずこれを習わされるもので、私も台北駐在期間に習ってマスターしたので、便利に使っています。

中国語繁体字の入力方法にはもう1つあり、Alt-Shiftで「半」または「全」と「倉」または「A」がある浮動タスクバーが出るは「倉頡(そうけつ)輸入法」と呼ばれているプロ向けのもので、やはり浮動タスクバーを右クリックして「螢幕小鍵盤」を表示すれば分るように、漢字の基本的構成部分26文字(日月火水木金土竹廿など)を使った入力方法です。倉頡(中国語では「ツァンチエ」)は、中国第3代皇帝、黄帝の時代に鳥の足跡を見て漢字を発明したといわれる伝説上の人の名前です。

一太郎Arkを起動したら、まず中国語/中国と中国語/台湾ではフォントを「MS Hei」(黒体)または「MS Song」(宋体)に設定するが、一太郎Arkでの中国語文字はあまりきれいではなくて、前者の方が良いと思います。中国語入力は、一太郎Arkへ直接できなくて、上述のOutlook Expressで作成を選び、書式、エンコードで「Unicode (UTF-8)」を選び、e-mailの本文部分にAlt-Shiftで中国語FEPに切り替え、簡体字または繁体字を入れられるので、ここからカット&ペーストで一太郎Arkへ張りつけて多言語文書にすることができます。カット&ペーストの操作で、特に簡体字の簡略文字が入りにくい場合もあるので、Outlook Expressで簡体字(GB 2312)にして中国文字を入力してテキストで掃きだし、一太郎Arkへテキストで読みこませることも必要でした。

このようにして、一太郎ArkへはGlobal IMEは直接入力できないが、日本では高電社のChinese WriterなどがWindows日本語版上のアプリケーションで中国語が直接使えるようにしているので、これを使うのもいいでしょう。これらのパッケージは、中国語繁体字をピンインで入力できる(この方法はWindows 98中国語繁体字版にはすでにある)など、日本人に便利な機能が入っています。また、このレビューをみなさんが読むころはWindows 2000が発売されていて、マルチリンガル環境も大きく前進することが期待されているので、この状況もあとで追加したいと思います。

一太郎Arkはアラビア語やヘブライ語などの右から左へ書く言語に対応していないのと、アジアの言語ではインド諸語やタイ語などのような音節表記言語には対応していません。ただし、ベトナム語については、Vietnam NetのダウンロードページからもリンクされているVietKey 4.08が、一太郎Arkで使えるという報告もあり(文書を英語にしておく)勇気のある方々は自分の責任でチャレンジしてみてください。また、Windows英語版やその他の版で動いたというような報告も聞いたり、メニューバーの表記を中国語や韓国語やその他の言語に変えるプラグ・インも進行中ということで、みなさんでぜひ「Ark QA」や上記「MULCO」メーリングリストで、お互いの情報を交換しましょう。


一太郎Arkでは、ワープロ機能が少数精鋭の概念で含まれています。これでいい、ワープロをこれ以上複雑にしないで欲しい。画像の挿入もできるし、箇条書きと表作成でマルチリンガル処理も上記言語ではできています。HTML変換はファイル、名前を付けて保存で、ファイルをHTML 4.0、文字セットをUnicode(utf-8)にすると簡単にできます。このHTMLとの親和性は、一太郎ArkのソースがXHTMLでセーブされているので当然であろうが、一太郎Arkの大きな強みである。他のワープロソフトのHTML変換に不満を持っている人も、多いと思います。

マルチリンガル文書の印刷は、比較的中級以上のプリンターでやるのがおすすめのようです。低級機種はパソコン側のアウトラインフォントをプリンターフォントで置き換えて高速化を図っているものがあり、TrueTypeフォントをきれいに出す機能がうまくきかず、ロシア語がうまく出力できないなどの弊害を経験しました。プリンター付属のドライバーでなく、最新のドライバーをwebからダウンロードして使うのも、コツであると思います。


一太郎Arkを短期間にいろいろと使った感じでは、Java2とXMLの現状に照らし合わせても、よくまぁここまで来たということで、これからも一太郎Arkの発展に注目したい。今年3月あるいは6月までに、JDK 1.2または1.3が全OSで出て、各OSでJava対応の同一のソフトが使えるようになれば、便利この上もない。各OSにアプリケーション・ソフトをポーティングしなければならないという現代人の滅亡の危機を救う、文字通りのノアの箱舟になる可能性を秘めているといえます。

マルチリンガルの視点からは、20年前にパソコン使用が始まって以来、マルチリンガル処理をあまりに複雑にしてきたと思います。昨年10月にMac OS 9でこれまでLanguage Kitとして別売してきたものをすべてOSに含めて配布し、今年2月にWindows 2000が出荷されて、さらに多くのユーザーが比較的容易にマルチリンガル処理をできる状況になってきています。JDKでUnicodeが基礎になっているのは、マルチリンガル処理のほんの第1歩で、我々自身も実際に使ってみて経験を深める必要があると思います。

日本は、ひと昔前は大都会であればある程アメリカ人・ヨーロッパ人がいて、多少ともマルチリンガルでした。1960年代〜1980年代の経済繁栄を経て、現在の日本は、田舎町へ行けば行く程、そこの工場で働く人たちは、アジア・南アメリカを中心とする外国人で、外国製商品を満載した食料品店があり、レストランがあり、急速に多言語・多文化が進んでいるような、興味ある状況になってきています。こうした中で、一太郎Arkは我々自身がマルチリンガル処理を学ぶためのすばらしい教材を与えてくれていると思います。





三上 吉彦 2000年2月23日


4回にわたりお楽しみいただいたArkレビューは、ひとまず今回で完結します。