« 米国:ファイルシェアリングを規制する法律制定への動き | トップページ | EU:児童を危険なコンテントやふるまいから保護するためのガイドライン »

2009年7月30日 (木曜日)

NICT:最大4人の別言語の者が同時に会話できる自動音声翻訳システムを開発

NICTは,アジア圏の言語に対応する自動音声翻訳システムを開発したとのことだ。

 NICT、アジア8言語に対応したネット音声翻訳システムを開発
 Internet Watch: 2009/7/29
 http://internet.watch.impress.co.jp/docs/news/20090729_305672.html

おそらく,通常の日常会話程度であれば,自動音声翻訳は有用性を発揮できるだろうと思われる。しかし,やや複雑な会話や専門的事項を含む会話ではうまくいかないことが予想される。

このような意見に対しては,「辞書を充実させれば大丈夫だ」との反論が予想される。

しかし,例えば,法律の分野に限定してみても,すべての法律用語がきちんと定義されているわけではないし,民法,刑法その他の領域において異なる用語が意図的に用いられていたり,逆に同じ「語」であっても別の意味・概念を有することが多々あるので,状況や文脈などを自動識別できない限り,日本語としての「語」の意義を確定することができず,したがって,それを翻訳することもできないということになる。このような作業は,法律の専門家が必死になってもうまくいかないことがむしろ普通であるので,自動翻訳では実現不可能であることが当然予測できる。

システムエンジニアはそのようには考えないかもしれない。

しかし,それは,コンピュータ分野のエンジニアは,予め明確に定義された人工言語を用いて仕事をしていることによる職業某の一種だと言って良い。コンピュータで処理可能な言語やデータは,定義されたものでなければ処理できない。

これに対し,自然言語では,語や文法などが予め定義されている必要が全くない。ある会話の当事者はそれぞれ自分勝手に解釈することが許されているし,自然言語による会話というものは最初からそのような相互の思い込みだけで成立しているのが普通だ。それは語彙のレベルでも文法のレベルでもそうだ。

たしかに,文法学者は定義された文法の存在を主張するかもしれない。けれども,それは当該文法学者の一つの意見(主観)に過ぎず,その文法学者の脳内にある言語体系でのみ妥当するものかもしれないというのが真相だと考えられる。

人工知能研究が頓挫する最大の理由はここにある。人間は恣意的な動物であり,恣意的な解釈によって世界を理解する。予め完全に定義された言語など世界にただの一つもない。仮に人工的に標準語を生成したところで,生成された次の瞬間から,人間が自由にそれを使い始め,予め定義されているところとは異なる状況,意味,方法でそれを使用し始めるので,常に定義または体系の完全性・健全性が根底から失われ続けることになる。

ちなみに,私が知っている限り,完全に信頼してよいと評価できる法律用語辞書はただの1冊も存在しないし,これからも存在し得ない。したがって,市販の辞書をデータ化すれば大丈夫という発想では,決して自動翻訳システムを実現することはできない。法律用語に関する限り,システムの構築者自身が相当に優れた法律家であり,かつ,「言語」に対して非常に厳格な姿勢を貫いている者でなければ,そもそも無理だ。そして,そのことは,法律以外のすべての分野についても妥当する。

それにもかかわらず,世の中のほぼすべての人間は,自分が「会話」できていると信ずることができる。それは,それぞれの者の能力に応じ,個々の主観に依拠して世界を理解し,納得し,あるいは,自己満足することが許されているからだ。この点においては,全く平等であるというべきだろう。

というわけで,要するに,世の中には「主観」しか存在しない。

その「主観」がどれだけ有用性を発揮できるかは,その主観の担い手である個の生態的能力に大きく依存しており,その能力を共有することはできない。

そして,特定の「主観」を世間の中に強要するためには,権力または財力などが必要であり,かつ,それだけで足りる。つまり,世間では,少しも言語学的な問題とは関係のない実力という要素によってものごとが動いているのだ。


[追記]

この記事を書き終えてから,自宅の居間をとおりかかったら,NHKの番組が流れていた。皆既日食に関する英語報道のようなものがあり,その内容の中から重要なフレーズを覚えるというような具合の番組だった。もちろん,人間が担当している。しかし,間違っていた。「日本で前に皆既日食が観察されたのは46年前」という意味を伝えようとしているフレーズが「first observed」となっていたのだ。厳格には誤りだ。「previously observed」とすべきだろう。46年前の皆既日食は日本国の領土内で観察された歴史上最初の皆既日食ではない。

何を言いたいかというと,要するに,意味を正確に伝えるためには,語彙の選択が非常に重要になってくるのだが,正確性を重視しない話者ではそこらへんが曖昧になってしまう。このことは,ネイティブスピーカーでも同じだ。要するに,正確性というものは,話者または書き手の能力・資質に大部分を依存しているのであって,辞書に従って自動的に変換可能なようなレベルのものではないということだ。

なお,誤解を招かないように付言しておくと,通訳や翻訳家にもいろんな人がいるけれども,これまでの人生の中で本当に「舌をまく」という表現がぴったりと言ってよいレベルの優れた人々と出遭ったことが何度もある。それらの人々は,すべて大変な勉強家ばかりだった。自分が通訳または翻訳する対象そのものについて深く勉強し,その分野に特有の語彙やジャーゴンなどを理解しようと努力していた。そのような姿を目にするにつけ,人間による翻訳または通訳を機械による自動翻訳が凌駕することはあり得ないと常に思ってきた。機械が自分の意志で対象を任意に選択し,深く学習して自分なりのシソーラスのようなものを自動生成し,それを職務遂行の中で応用することはできない。ただし,コスト削減の圧力によって,本来人間でなければ業務遂行できないような職種の職場が徐々に奪われたり,あるいは,不当に労働強化のような状況に陥ったりするということは十分にあり得る。


[追記2]

自動翻訳(自動通訳)と関連する非常に面白い記事をみつけた。

 Humans central in Spinvox patents
 BBC: 29 July 2009
 http://news.bbc.co.uk/2/hi/technology/8174721.stm

|

« 米国:ファイルシェアリングを規制する法律制定への動き | トップページ | EU:児童を危険なコンテントやふるまいから保護するためのガイドライン »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 米国:ファイルシェアリングを規制する法律制定への動き | トップページ | EU:児童を危険なコンテントやふるまいから保護するためのガイドライン »