14
ロンゴロンゴとイースター島の古謡の シラブル列との統語論的対応づけ 山口文彦 中川正樹 情報考古学第 18合併号 2012 12 22日発行

ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

ロンゴロンゴとイースター島の古謡の

シラブル列との統語論的対応づけ

山口文彦 中川正樹

情報考古学第 18合併号

2012年 12月22日発行

Page 2: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ 25

-論文

ロンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ*

山口文彦** 中川正樹***

ロンゴ口ンゴと呼ばれる記号の列を刻んだイースター島の木製品が遣されている。口ンゴ口ンゴが文字である可能性も指摘

されているが、未解読である。著者は口ンゴ口ンゴが歌を歌うように読まれたという記録があることから、ロンゴロンゴの

記号列と現地の古い歌が対応するか否かを、全探索を基とする手法によって統語的に調べる研究を行った。注目した対応関

係は、ロンゴロンゴにおける記号の出現11頂序と、古謡の歌詞におけるシラブルの出現1I震序が一致するか否かである。しかし、

来解読言語が対象であるために正解を設定できず、結果を直接評価することが難しい。そこで、提案手法を日本語の漢字仮

名混じり文と片仮名文の対応づけに適用し、高い再現率が得られることと、頻度2以上の記号が多く出現するときに適合

率が高くなることを確認した。その上で、ロンゴ口ンゴの記号列と古謡のシラブルの列の対応を調べた。結果として、いく

つかの口ンゴロンゴの行と古謡の歌詞の聞で、記号とシラブルの出現順序に対応が見られる一方、ほとんどの組合せで対応

がないことが示された。

キーワード:解読・口ンゴロンゴ・自然言語処理

1 はじめに

イースター島では、かつて鰍密な記号の列を彫りつけ

た木製品が作られた。この記号は、ロンゴロンゴと呼ば

れ、文字であるかも知れないと言われているが、未解説

である。

イースター島に到達した最初の西欧人は、オランダ人

ロッへヴェーンで 1722年のイースター(復活祭)の

日のことである。その後、 1770年にスペイン探険隊が

訪れた際、島民が領有文書に記号を書き記した。しかし、

記号が彫りつけられた木製品の存在が報告されたのは、

1864年の宣教師 E.エイロー (Eyraud)によるものが最

初である。ロンゴロンゴについて、K.エモリー (Emory)

は、島民がスペイン人の書類を見たことから刺激を受け

て作り出したもので、歌を明際な形で残すために工夫・

創造されたものであると推察している (Emory:1972,

Bellwood著池野訳:1985)。

S.R.フィッシャー (Fischer) はロンゴロンゴに関す

る記録や研究を一冊の本にまとめている (Fischer:1997)。

記録の中には、ロンゴロンゴが歌を記録したものである

ことを示唆するものがある。 19世紀タヒチへ伝道に赴

いたジョーセン (Jaussen) は、ロンゴロンゴが刻まれ

た木製品をいくつか所有していた。彼はメトロ (Metoro)

という名のイースター島出身者に出会い、ロンゴロンゴ

を読ませたところ、メトロは歌うように読んだという。

しかし、メトロ自身も、ロンゴロンゴが読まれる本来の

Syntactic Correspondence between Rongorongo and the

Syllable Sequences of Ancient Chants from Easter Island

** Fumihiko YAMAGUCHI 慶膝義塾大学理工学部

Masaki NAKAGAWA 東京農工大学工学部

様子を真似ただけであり、ロンゴロンゴで古かれた内容

を理解していたわけではなかった。

J.H.サリナス (Salinas)はイースタ一向に残る歌を収

集し、その音をラテン文字列で記録した (Salinas)。こ

の記録は歌の読みを音韻を表す記号によって記録したも

のと言える。

もし、ロンゴロンゴが文字であるならば、記号のそれ

ぞれは音韻の列であるような読みを持っと考えられる。

もし、ロンゴロンゴの記号列がある歌の歌詞やその一部

を表しているとしたら、記号がロンゴロンゴ列の中に登!

場するのと同じ順序で、その記号の読みである音韻が歌

詞の中に登場すると考えられる。本論文の目的は、その

ような出現順序の関係によって、ロンゴロンゴの行と現

地の古謡の歌詞が対応づけられるか否かを調べることに

ある。

近年、失われた言語を対象に、計算機を用いて情

報を抽出しようとする研究が盛んである (Knightet

al.:2009)。しかし、未解読の言語と音韻列との対応を調

べた研究は少ない。計算機を用いた失われた言語の解説

に関連する研究としては、 B.スナイダー (Snyder) ら

によるウガリット文字の解説についての研究 (Snyderet

al.:201O)がある。この研究では、ウガリット文字とへ

プライ語が地理的にも時代的にも近く、また言語として

も近いことを用いて、ウガリット誇の単語と、へプライ

語における同根語のペアを抽出することに成功してい

る。ウガリット文字そのものの解説はすでに進んでおり、

計算機を用いて得られた結果が正しいか否かを評価する

ことができる。その点で彼らの研究は、失われた言語で

はあっても未解読の言語を対象とした研究であるとは言

えない。自然言語処理の手法の中には、言語特有の性質

に依存しないと考えられるものも多く、未解説な言語や

Page 3: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

26情報考古学Vol.18NO.1・2.2012

金約得>>~飢穏総包色彩銭繍 ~~ß)7伊約問符2的問鎚〉滋制図 1 口ンゴロンゴの例.MamariのA面2行目

暗号を扱うには、そうした手法が有効であると考えられ

る。 K.ナイト(Knight) らは、換字暗号を隠れマルコ

フモデル (HiddenMarkov Model)に基づいて解読する

手法を提案した (Knightet al.:2006)。この手法は、文字

のコーパスと話し言葉を書き表したコーパスを用いる。

これら 2つのコーパスは対応しているとは限らないが、

対応する部分を見つけることにある程度成功している。

しかし、ナイトらの手法は考古学的なデータに適用され

ていない。

隠れマルコフモデルなどの統計的な手法は、特にコー

パスが大規模な場合に、有効であると考えられる。一方、

出現頻度が小さい文字や語などに対しては、特別な配慮、

が必要である。現存するロンゴロンゴはコーパスとして

小さく、出現頻度の小さな記号を多く合む。このような

コーパスを対象とする場合には、統計的な手法の利点、が

生かせないと考えられる。そこで本論文では、統計的な

手法ではなく、全探索に基づいた方法を用いる。全探索

を用いることで、計算時間を多く要する代わりに、洩れ

や近似のない結果が得られると期待できる。

本論文では、記号と音がそれぞれの列の中で登場する

順序だけを考慮し、記号や歌の意味については考えない

ものとする。このように統語的に調べるための、対応づ

けを見つけるアルゴリズムを提案する。しかし、未解説

な言語を対象としているため、正解を設定することがで

きず、このアルゴリズムの性能を直接評価することが難

しい。そこで、既知の言語を用いて、手法そのものの評

価を行う。この実験では既知の言語として、漢字仮名混

じりの文と、それを片仮名のみで表した文を用いる。そ

の上で、ロンゴロンゴの記号列とイースター島の古謡の

歌詞であるシラブルの列が対応するか否かを調べる。

本論文の構成は次の通りである。 2節で本論文で対象

とするロンゴロンゴとイースター島の古謡のそれぞれに

ついて述べる。 3節で対応づけを見つけるアルゴリズム

を提案する。 4節では、提案したアルゴリズムを用いた

日本語での予備実験について述べたのち、ロンゴロンゴ

と古謡の対応づけについて述べる。 5節で実験結果につ

いて議論し、最後にまとめる。

2 口ンゴ口ンゴと古謡

サリナスによって収集されたイースター島の古謡は

89のタイトルである。ほとんどのタイトルが3から 5

編の歌詞を含み、いくつかはコーラスのパートを持つ。

合計で 372編の歌詞がある。

ロンゴロンゴが彫られた木製品は 26個が現存してお

り、そのほとんどが板状のものである。両面に記号が彫

られており、便宜上、一方の面に Rectoまたは A,他方

にVersoまたは Bなどの名前をつけて区別している。

ロンゴロンゴの記号は 木製品の表面に牛耕式の順序

で彫り付けられている。図2に、 lから 40までの数字

を牛耕式の順序で記した例を示す。左下から読み始め、

最初の行を左から右に進み、次の行は右から左に進む。

さらに行を変えるごと記号が 180度回転する(行末で板

を回転することで、常に左から右へ進むことになる)。

図 lにロンゴロンゴの記号列の例を示す。ロンゴロン

図2 牛耕式の筆記順序

ゴの記号のそれぞれは、植物、魚、鳥などの自然物を象

形しているように見える。 A.メトロワ (Metraux)はロ

ンゴロンゴの記号を約 120種類に分類し(Metraux:1940)、

表意文字としては文字の種類が少な過ぎ、表音文字にし

ては多過ぎると指摘した。そこで本論文では、ロンゴロ

ンゴがシラ 7+ルを表しているか、あるいは表意文字とシ

ラブルを表す文字が混在していると仮定する。一方、古

謡の歌詞についてもシラプルに分割する。古謡をシラプ

ルに分けるにあたっては、タヒチ語のシラブルの構成を

参考にした。 P.ベルウッド (Bellwood)のポリネシア諸

語の系統樹 (Bellwood著池野訳:1985, Bellwood著植木

ら訳 :1989)によれば、タヒチ語とイースター島の言葉

は原中部ポリネシア語を祖とする比較的近縁の関係にあ

る。また、現在イースター島で話されている言葉もタヒ

チ語に影響を受けている。タヒチ語のシラプルは、母音

一つかあるいは子音ーっと母音一つから成り、サリナス

による古謡の歌詞についても、ほとんどが同様の方法で

シラプルに分割することができる。この方法でシラブル

に分割できない例には、日本語の嬢音便に相当する nと

mがある。これらについては、単体で一つのシラプルと

して扱う。このほかに、母音を伴わない子音として、 k

が4箇所(いずれも‘kraver、ita'という単語で)、 sが

2箇所(いずれも‘Mas' という単語で)、 t,b, rがそれ

ぞれ l箇所ずつ登場する。以下の実験では、これらにつ

いては例外として、単体で一つのシラブルを構成するも

のとして扱う。これらの例外的にシラ 7ル扱いされる子

音は、一つの歌詞に 2回以上は登場していない。そのた

Page 4: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

口ンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ 27

め、後述するように、本論文での実験には影響しない。

対象とする古謡全体で 118種類のシラ 7'ルを含み、 1j編

の歌詞には平均で 35.0個のシラフゃルが含まれる。

T.S.パルテル (Barthel)はロンゴロンゴの記号をその

形状によって分類し、 3桁の数字で表した (Ba此hel:

1958a,Barthel: 1958b)。この数字列をパルテルコードと

呼ぶ。パルテルコードを用いることで、ロンゴロンゴを

計算機可読なテキスト情報として扱うことができる。 111

口らはロンゴロンゴの画像情報からパルテルコードの列

を作る作業を支援するツールを開発した (Yamaguchiet

al.:2003)。本論文で用いるパルテルコード列はこのツー

ルを用いて作られたものである。元になるロンゴロンゴ

の画像情報は rongorongo.o培からダウンロードした。本

論文の実験で用いたロンゴロンゴは比較的大きな 4つの

木製品に刻まれたものである。これらは ArukuKurenga,

Tahua, Mamari, Keitiと呼ばれ、かつてジョーセンが所有

していたものである (Fischer:1997)。これらには合計で

83行のロンゴロンゴが刻まれており、パルテルコード

で441種類の記号が含まれる。 l行には平均で 60.5個

の記号が含まれる。

3 対応づけ

ロンゴロンゴが表音文字であるか表意文字であるかに

かかわらず、それぞれの記号には少なくとも一つの読み

があると考えられる。すなわち、ロンゴロンゴが文字で

あれば、記号の列に対応する読みの列が存在すると考え

られる。

あるロンゴロンゴの行全体(記号の列)が、ある歌詞

corres(iR, ic, H) : =

の一部(シラフ。ルの列)を表したものであるとすると、

それぞれの列の中で記号が出現する順序とシラ 7'ルが出

現する順序が等しくなるような、記号とシラ 7-ルの組の

集合が存在すると考えられる。ロンゴロンゴの各行と古

謡の各歌詞について、そのような集合が存在するか否か

を全探索によって調べることを考える。

ただし、ロンゴロンゴとシラブルが l対 lに対応する

とは限らない。一つの記号が複数のシラプルから成る読

みを持つかも知れないし、他の記号を修飾する機能を持

つ記ー号などであれば、シラプルてー表されるような読みを

持たないかもしれない。そこで、各記号が0個以上のシ

ラフツレから成る読みを持っと仮定する。記号とシラプル

の対応づけは排他的ではない。すなわち、異なる記号が

同じシラ 7'ルに対応するかも知れない。しかし、同じ記

号が複数回出現する場合には、毎回同じシラプルに対応

すると考える。ある行の中に一度しか現れない記号やシ

ラプルは、記号とシラプルが同じ順序で出現するか否か

に関して制約とならないので、頻度 2以上の記号および

シラフツレのみを考慮する。以下では、これらをそれぞれ

頻出記号および頻出シラプルと呼ぶことにする。ある頻

出記号に対応づけられた頻出シラプルは、その記号の読

み、あるいは読みの一部を表していると考える。

あるロンゴロンゴの行が、ある歌詞に対応づけられる

か否かを判定するアルゴリズムの疑似コードを図 3に示

す。このアルゴリズムは、ロンゴロンゴの行(記号列)

と歌詞(シラブル列)のそれぞれをある位置まで読んだ

とき、それまでに仮定された頻出記号と頻出シラプルの

対応づけに矛盾しないような、以降の記号列とシラブル

列の対応付けがあるか否かを調べる再帰的なアルゴリズ

1: if iR ~ lengthR then return true endif;

2: if icとlengthcthen return false endif ;

3: if the frequency of R [i RJ三1then return corres(iR + 1, ic, H) endif;

4: if the frequency of C [icJ ~ 1 then return corres(iR, ic + 1, H) endif;

5: if there exists X such that (R [iR], X)εHthen

6: if X = C[icJ then

7: if RestR [iRJ > Res~フ [icJ 七hen return false endif ;

8: if corres(句+1, ic + 1, H) then return true endif

9: endif;

10: else

11: if RestR [iRJ ~ Restc [ic]七hen

12: if corres(iR+1,ic+1,HU{(R[iR],C[icJ)}) then return trueendif

13: endif;

14: endif;

15: return corres(in, ic + 1, H).

図3 口ンゴロンゴの行と古謡の歌詞の対応の有無を判定する疑似コード

Page 5: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

28情報考古学Vol.18NO.1・2,2012

ムである。

ここで、 RとCはロンゴロンゴの行と古謡の歌詞を

表す。 R[iR]はRの iR番目の記号を表し(先頭の記号を

R[O]とする)、 lenglhRはその行に含まれる記号の個数を

表す。 Cについても同様である。関数 corresの引数は、

それぞれの列を何番目まで読んだかを表すインデックス

らと icおよび、記号とシラフールの対応づけの仮説Hで

ある。Hは記号とシラプルの組を要素とする集合である。

corresは、ロンゴロンゴの記号と古謡のシラフ'ルをそ

れぞれら個、 ic個読んだ時点、で、それまでに Hに含ま

れる組に示される対応づけが仮定されているとすると

き、ロンゴロンゴの行のら個目以降と古謡のシラプル

列の ic個目以降に H と矛盾しない対応づけがあるか否

かを返す。 corres(0, 0, (})という呼び出しは、 trueも

しくは falseを返す。 trueが返されるとき、 RとCが対

応づけられると判定されたことになり、白lseが返され

るときには対応がないと判定されたことを意味する。こ

の疑似コードの詳細については、付録 Aに述べた。

図4に、このアルゴリズムが対応づけを見つける様子

を、 MamariのB面2行目のロンゴロンゴ記号列の最後部

と、“Katea mai te niho"の4番の歌詞の最後部を例に挙げ

て示す。ロンゴロンゴ記ー号列はパルテルコード列に、歌

調はシラプル列にそれぞれ変換してからアルゴリズムを

適用する。頻出記号のパルテルコードは、 064,660, 379,

013の4種類であり、頻出シラブルは、 a,ka,vaの3種

類である。頻出記号と頻出シラブルには下線を付した。

最初、頻出記号と頻出シラフールは登場したI1債に対応

づけが仮定される。頻出しない記号を読み飛ばした後、

corres (1, 0, (})という呼び出しにおいて、 R[I]とC[O]

を読み、これらは頻出記号と頻出シラブルなので、対応

を仮定する (12行目)0 R[ 1]の064とC[O]のa,R[2]の

660とC[4]のkaが対応すると仮定して(図 4A)、次

(R[3]とC[5]) を読むと、 064はすでに aと対応する

と仮定されているので、シラプル列の方だけを読み進め

る。同様に C[6]の ka,C[7]のvaについても、 064と

対応づけると仮定に矛盾するので、読み飛ばす。 C[lO]

のaはR[3]の064と対応するとしても仮定に矛盾しな

いので、記号列とシラフ'ル列の両方を読み進めることが

できる。頻出記号で次に登場する R[4]の660はすでに

kaと対応が仮定されており、シラブル列は kaが次に

登場する C[14]まで読み進められる。こうして R[4]を

C[14]と対応づけるとすると(図 48)、残りの頻出記号

列379013 379013を残りの頻出シラ 7'ル列vakavaに

対応づけようとするが、頻出記号が余ってしまう(シラ

ブル列を先に読み終えてしまう)ので、うまくいかず、

白Iseが返される。同様に R[4]をC[16]と対応づけても、

白Iseが返される。この結果から、 corres(1, 0, (})の

12行目における corres(2, 1, {(064, a)})が白Iseになる。

そこで、 corres(1, 0, (})の 15行目において、シラプ

ル列だけを読み進めた場合である corres( 1, 1, (})を調

べることになる。 C[リ以降に登場する頻出シラプルは

C[4]の kaである。そこで、 R[1]の 064とC[4]の ka

の対応づけを仮定すると、 (R[8]とC[10]を対応づけて

失敗した後で)図 4Cにあるように対応づけることで、

抑制創剣術劇!る蹴鎚パルテルコード列:

“Ka tea mai te niho"の 4番の最後: aI・ikihe kavakava mau祖 a0 te kavakava.

↓R[3] 400 064 660 064 660 380 001 370 379 013 379 013 A.

/ ¥↓C[5] a ri ki he ka va ka va ma u a na 0 te ka va ka va

B. 400 064 660 064 660 380 001 370 379 013 379 013

/ ¥ ~ -------- 対応づけに失敗する

a ri ki he ka va ka va ma ua na 0 te Ka va ka va

C. ペマ付0仰 mヤ吋図4:提案アルゴリズムが対応づけを調べていく様子

Page 6: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

ロンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ 29

記号列を読み終えることができ、 trueが返される。

このアルゴリズムは、各頻出記号についてそのとき読

んでいる頻出シラ 7'ルを対応させる場合とさせない場合

の2つの場合を調べている。そのとき読んでいる頻出記

号に対応する頻出シラブルがすでに仮定されている場合

は、シラブルのその出現と対応させる場合とさせない場

合を調べている。したがって、 Rがn個の頻出記号を含

み、 Cが m 個の頻出シラフ'ルを含むとき、このアルゴ

リズムは O(m2n)の計算時間を要する。ただし、 2つの

場合の先に調べた方が trueを返す場合はもう一方の場

合を調べず、また、付録Aで説明するように枝刈りが

できるので、この計算量は最悪の場合の計算量である。

また、このアルゴリズムは、 R[iR]の記号と C[ic]の

記号との対応を仮定して失敗したときには、 Rの IR番目

以降の記号列と Cのic+ 1番目以降のシラフ'ル列での対

応を調べている。また、 Rを読み終えた|時点で (Cが残

っていても)trueを返すので、 Rに対応するシラフ。ル列

が Cの一部として含まれていれば、その対応づけを発

見することができる。このように記号列の対応づけの開

始位置について頑健である。

このアルゴリズムは、頻出記号と頻出シラフールの出現

ごとの対応づけが、それまでに得られた対応づけと矛盾

しないことを確認していくものである。そこで、出現ご

との対応づけが矛盾しないときに、その対応を記録して

おけば、記号列を最後まで読み終えたときに、対応する

頻出記号と頻出シラフツレの出現位置を確認することがで

きる。また、各頻出記号についてそのとき読んでいる頻

出シラプルを対応させる場合とさせない場合の両方を必

ず調べ、最後まで対応づけが矛盾しなかった場合の数を

合計することで、出現位置ごとの対応づけが何通りある

かを数えることができる。以下の実験では、詳細な検討

をするために、このように変更したアルゴリズムを用い

ている。この変更後のアルゴリズムについては、付録 B

に詳細を示した。

4 実験結果

未解読の言語を対象とする場合には正解を設定するこ

とができないため、結果の評価が難しいという問題があ

る。そこで手法を評価するために、既知の言語を用いた

実験を行う。ここでは、表意文字とシラ 7'ルを表す文字

の混在する文字列として漢字と平仮名の混じった文を用

い、シラプルを表す文字の列として片仮名のみからなる

文を用いることにする。

4.1 漢字仮名混じり文と片仮名文の対応づけ

数学の読みもの (Zeits著、 LLr日ら訳:2010) から無

作為に取り出した漢字仮名混じり文 20文について、そ

のそれぞれを片仮名で表記した 20文を用意した。漢字

仮名混じり文の長さは 21文字から 41文字である。漢字

仮名混じり文と片仮名文に含まれる文字集合は重複しな

い(漢字仮名混じり文は句読点を含むが、片仮名文では

代わりにピリオドとカンマを用い、記号の集合が重視し

ないよう留なした)。それらの全組合せ 20X20= 400通

りについて、 3節のアルゴリズムで対応があると判定さ

れるか否かを調べた。実験の結果、漢字仮名混じり文と

その仮名表記である片仮名文の組合せ 20通りについて

は、すべて対応があると正しく判定された。また、対応

していない組合せ 380通りについて、対応していないと

正しく判定したものが 211通りであった。

一方、対応していない組合せであるにもかかわらず対

応していると誤判定されたものが 169通りあった。この

169通りの中には、次のような例がある。ここで、上段

が入力された漢字仮名混じり文、下段が片仮名文であり、

その聞の線は対応を示している。

良い問題は、謎めいていて面白いものである。

コふシイカぶぶ:三泳三五言シ山図5 対応づけを誤判定した例

この例で見つかった文字同士の対応づけは次の通りで

ある。

表 1 図 5における頻出文字と片仮名の対応づけ

漢字仮名混じり文に出現する頻出文字

片仮名文に出現する頻出文字

この例では、漢字仮名混じり文に出現する頻度 2以上

の文字(頻出記号)が2種類しかない。このように、頻

出記号の種類が少ない入力については、対応しない組合

せについて誤って対応すると判定する傾向にある。ここ

までの実験で用いた 20文を漢字仮名混じり文に含まれ

る頻出文字の種類数で分けると、 l人5,8種類のもの各

l文, 2積類のもの 6文、 3種類のもの 3文、 6種類のも

の2文、 7種類のもの 5文であった。

表 2 漢字仮名混じり文に含まれる頻出文字の種類数と

誤判定された組合せの数

守品題t~豊2文字翌五の 号親室書せ 再現(略問 適合(%率) F値

2種類 74 100 11.9 0.213

3種類 67 100 13.0 0.230

4種類 56 100 15.2 0.263

5種類 23 100 30.3 0.465

6種煩 16 100 38.5 0.556

7樋類 9 100 52.6 0.690

8極類 6 100 62.5 0.769

Page 7: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

30情報考古学Vol.18NO.1・2.2012

そこで、漢字仮名混じり文に出現する頻出文字の種類

数ごとにそれぞれ 10文ずつを用意して実験した。そのそ

れぞれを片仮名で表記した 10文を用い、頻出文字の種類

数ごとに IOX10 = 100通りの全組合せについて、対応づ

けが見つかるか否かを判定した。その結果を表2に示す。

この表の各列は、頻出記号の種類数ごとの結果である。

それぞれ、漢字仮名混じり文と片仮名文のペア 100個に

ついて判定しており、正しく対応しているペアをそれぞ

れ 10個ずつ含む。正しく対応しているぺアのうちで対応

していると判定されたペアの割合を再現率、対応してい

ると判定されたペアのうちで正しく対応しているペアの

割合を適合率、再現率と適合率の調和平均を F値と呼ぶ。

これらの指標は、情報検索の分野などで性能の指標とし

て用いられている。実験の結果、頻出文字の種類数によ

らずに、再現率は 100%であった。すなわち、対応があ

るのに無いと判定した回数はいずれも Oであった。誤判

定はいずれも、対応しないペアについて対応すると判定

したもので、適合率・F値ともに、この誤判定が少ない程、

高くなる。この結果をみると、頻出文字の種類数が多い

ほど誤判定の回数が少ない傾向にあることが分かる。

また、上記実験で無作為に選んだ文の中には含まれな

かったが、複数の読みを持つ漢字が漢字仮名混じり文に

頻出し、その漢字の異なる読みが片仮名文に含まれる場

合には、対応するペアであるにもかかわらず、対応しな

いと誤判定する例もあった。これは、同じ記号が複数回

出現する場合には、毎回同じシラブルに対応するとした

仮定の反例である。このように一つの文字が複数の読み

を持つのは、表意文字に特有の性質であると考えられる。

4.2 ロンゴロンゴと古謡の対応づけ

ロンゴロンゴの 83行と歌詞 372編のすべての組合せ

30,876 = 83 X 372通りについて、対応づけがあるか否かを

調べた。実験に用いた計算機は、Pentium4.3GHzのCPUと、

2GBのメモリを搭載したものである。 3節で述べたよう

に、ロンゴロンゴが頻出記号を多く含む場合に計算量が

指数的に増加する。 30,876通りのすべてについて対応づ

けの有無を調べるのに要した時間は、 103時間0分 20秒

である。このうちの 30,857通り (99.94%) については、

いずれも 5分以内で計算を終えており、残り 19通りの計

算に 99時間 31分49秒を要した。実験の結果、 618通り

については、対応づけがあると判定された。

残りの 30,258通りについては、対応づけが無いと判

定された。なお、時間のかかった 19通りのうちに対応

があると判定された組合せは無かった。

提案手法は全探索をしているので、頻出記号とシラブル

に一致する出現順序がある場合については、すべて対応す

ると判定することが期待できる。しかし、ロンゴロンゴが

歌調を表していない組合せについても対応すると判定する

可能性がある。日本語による実験から、頻出記号の種類が

多いほど、このような誤判定が減ることが分かっている(日

本語を用いた予備実験では、表2に見られるように、漢字

仮名混じり文が頻出記号を 7種類以上含む場合には、適合

率が50%を超え、 6種類以下しか含まない場合に比べて誤

判定が少ないことが分かっている)。実験に用いたロンゴ

ロンゴ 83行のうち、 69行には頻出記号が7種類以上含

まれている。この 69行に限ると、対応づけがあると判

定されたのは 39通りである。この 39通りに含まれるロ

ンゴロンゴは、いずれも頻出記号を 8種類含むものであ

表3 口ンゴロンゴの行と対応すると判定された古謡の歌調

Aruku Kurenga, Verso, line 1 1. E Ira e, e Raparenga e #5 (16通り) 17. Ka u manu a roto #1 (104通り)2. E Renga Mariki #3 (104通り) 18. Ko Tongariki #2 (1,636通り)3. E mea tino mamahi rua e桝 (5通り) 19. Ko Tongariki #3 (134通り)4. E nui te tamu #2 (720通り) 20. Kraverita #1 (330通り)5. E nui te tamu #3 (93,804通り) 21. Kraverita #1 coro (3通り)6. 1 he a Hotu Matu'a e hura nei #4 (6通り) 22. M剖 runga#3 (44通り)7. Ka e'a te neru #2 (37,138通り) 23. M町 laReina#lc(6or1o通(8り通)り)8. Ka haro au i vai a repa #1 (164通り) 24. Maria Reina #2 (61 iIIlJ) 通9. Ka haro au i vai a repa #2 (144通り) 25. 0 mea 0 te hare #1 (231 り)10. Ka memea(l) #1 coro (219通り) 26. 0 mea 0 te hare #3 (148通り)11. Ka memea(l) #3 (18通り) 27. Poio nuinui a百lki#3 (190通り)12. Ka memea(2) #1 coro (219通り) 28. Renga mitimiti #3 (656,035通り)13. Ka memea(2) #3 (15通り) 29. Renga varevare #4 (148通り)14. Ka memea(2) #4 (2,730通り) 30. Tamaiti puai rahi #3 (4通り)15. Ka tea mai te niho #4 (1,050,648通り) 31. Te pito #1 (549通り)16. Ka tere te vaka(2) coro (15通り) 32. Thki horo pari #2 (210通り)Mam町 i,side A, line 2 1. E Ira e, e Raparenga e #5 (8通り) 4. Ka tea mai te niho #4 (306通り)2. E nui te tamu #3 (724通り) 5. Ko Tongariki #2 (20通り)3. Ka e'a te neru #2 (1,868通り)

Mamari, side B, line 2 1. Ka e'a te neru #2 (1,658通り) 2. Ka tea mai te niho #4 (26,309通り)

Page 8: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

口ンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ 31

った。言い替えると、対応づけがあると判定された 618

通りのうちの 579通りについては、頻出記号を 6種類以

下しか含まない行についての結果であり、誤判定の可能

性が高いと考えられる。上記の比較的有意であると考え

られる 39通りについて ロンゴロンゴの行ごとに対応

があると判定された歌調のリストを表3に挙げる。各歌

詞には、ロンゴロンゴの行ごとに通し番号を付しであ

る。歌詞は、タイトルとそのタイトルの何番目の歌詞で

あるかを示す番号で表されている。例えば、“EIra e, e

Raparenga e" というタイトルの古謡の 5番の歌調を“E

Ira e, e Rapa陀 ngae #5" と表している。また、“coro"の

表記があるものはコーラスパートの歌詞を表す。なお、

歌詞名右の括弧内に書かれた数字は、以下で述べる出現

位置の対応づけの組合せの数である。

この結果を見ると、ロンゴロンゴの行と古謡の歌詞の

対応づけは必ずしも l対 lではない。 ArukuKurengaの

Verso側 l行目は 32編の歌詞と、 MamariのA面2行目

は5編の歌詞と、 MamariのB面2行目は 2編の歌詞と、

それぞれ対応すると判定されている。また、“Kae'a te

neru非2"は、 ArukuKurengaのVerso側 1行自の 7番目、

MamariのA面2行目の 3番目、 MamariのB面 2行自

の l番目に挙げられており、 3つの行と対応すると判定

されている。また、“Katea mai te niho #4" も、 Aruku

KurengaのVerso側 1行目の 15番目、 MamariのA面2

行目の 4番目、 MamariのB面2行目の 2番目に挙げら

れており、やはり 3つの行と対応すると判定されている。

表4 図6の例における記号とシラブルの対応づけ

コード記号シラブル コード記号シラブル

700 a 008 問 a

200 ~ mo 022 e

600 ぷ a 405 ~ a

049 Q 1 069 3 nu

出現位置の対応は何通りあるかを、表3の歌調名の後

ろに括弧つきで掲載している。対応があると判定された

行と歌調について、記号の出現位置とシラブルの出現位

置を対応づけて表した例を図 6に示す。図 6には、ロン

ゴロンゴの画像 (ArukuKurengaのVerso側 l行目)と

そのパルテルコード列、および“EIra e, Raparenga e #5"

の歌調を示している。パルテルコードと歌調を結ぶ直線

は、記号の出現位置とシラプルの出現位置の対応を示し

ている。ここで示されている記号とシラプルの対応づけ

を表4に示す。表4は、パルテルコードと、そのコード

が表す記号の例、および対応するシラブルを示している。

記号とシラフツレの出現位置の対応づけについては組合

せ論的に多くの対応づけが考えられる。例えば、 Aruku-

Kurenga Verso側 l行日と“EIra e, e Rap訂engae #5"の

対応づけにおいて、図 6では、最後から 7つ目の記号(パ

ルテルコード 600) とシラフ'ル aを対応づけている。こ

こで、対応づけられている aは財政iaの3文字目に出

現しているものだが、パルテルコード 600の記号の同

表 5 古謡の歌詞に含まれるシラブル数

歌調 シラプル数(個)

Renga mitimiti #3 92

Ka tea mai te niho #4 84

En凶 tetamu #3 79

Ka onga ira #3 63

E nui te tamu #1 62

Ka tere te vaka( 1) #3 62

Ko Tongariki #2 61

Kraverita # 1 61

Te pi色0#1 61

Tuki horo pari #2 61

Tuki horo pari #3 61

A似品U例拶給条#伐〉与野開i森桝健r!~~

淑P刊さ夢幻総創部制JM

図6 対応づけの例、 ArukuKurengaのVerso側 1行目と宅 Irae, e Raparenga e #5n

Page 9: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

32情報考古学Vol.18NO.1・2.2012

じ出現を、 kiakiaの6文字目の aと対応づけたとして

も、出現順序が一致していると言える。

なお、 2番目に多くの歌調を対応づけられたロンゴロ

ンゴの行である M抑制の A面2行目は図 lに示されて

いる。

表6 図7の例における記号とシラブルの対応づけ

コード記号シラブル コード記号シラフ"'J~700 a 008 問 ka

200 * e 022 e

600 ぷ 七a 405 ~ a

049 住 ke 069 3 。

5 議論

前節で見たように、ロンゴロンゴの行に合まれる記号

の出現順序と古謡の歌詞に含まれるシラフツレの出現順序

の聞に対応づけられるものが見つかった。しかし、その

対応は多対多のものであるため 直接解説につながると

は考えにくい。

出現順序が一致するようなロンゴロンゴの記号と:歌詞

のシラブルの組があるとしても ロンゴロンゴがそのi歌

詞を表しているとは限らない。しかし、本論文で用いた

手法は全探索であるため、対応しないと判定された組に

は、次の三つの仮定の下で対応づけが無いことが磁認さ

れた。その仮定とは、ロンゴロンゴがシラブルから成る

読みを持つ文字であること、ロンゴロンゴの文字が複数

の読みを持たないこと、ロンゴロンゴの 1行が歌詞の一

部を表していること、である。全探索をしているために

非常に高い再現率が得られると期待できるので、対応づ

けが無い場合には、ロンゴロンゴの l行が歌詞の一部を

表していないものと考えられる。イースター島の古い話

し言葉に関する記録は少なく、とくに古謡以外のコーパ

スはあまり見られないため、 30,258通りの組合せにつ

いて対応づけが無いことが確認できたことは、意味のあ

る結果であると考えられる。

本論文で提案した手法においては、未解読言語を対象

とすることを目的としているために、一つの記号の読み

に含まれるシラブル数(またはその平均値)について、

何も仮定していない。そのため、一つの記号が非常に多

くのシラフVレから成る読みを持つことを示唆するような

不自然な対応づけも見つけられる。例えば、図 6におい

ては、最後から 3番目の記号(パルテルコード 022) と

2番目の記号(パルテルコード 069) は、連続して出現

する記号であるにもかかわらず、歌詞の上では離れた位

置にあるシラブルに、それぞれ対応づけられている。も

ともと、一つの記号の読みがいくつのシラフ'ルから成る

かについての仮定を置いていないために、このような対

応も許している。対応づけられた頻出シラフ*ルの間にあ

るシラフ。ルは、直前または直後で対応づけられた頻出シ

ラフ。ルと共に一つの記号の読みを構成することが期待さ

れるが、その場合は対応付けられていないシラブルも頻

表 7 図8の例における記号とシラブルの対応づけ

コード記号シラブル コード記号シラブル

700 pa 008 問 te

200 号F u 022 1

600 ぷ 七a 405 ~ tu

049 a a 069 a

A術品。慰問州各I(伶器i~掠碍お初際都700 003 027 700 607 006 204 200 208 092 244 405 r 307 207 311・r008 306 074 141/ 200 302 022 600 I

抽 araka topa ki rarわkite~ãinga hek咋ゐkangao p訂 ivari I I I

one Anakena e ka iri e papa vere e ki te puku huenga tau'a

淑P*警告炉色3総ぷ路樹タJM

図 7 Aruku KurengaのVerso側 1行目と“Rengamitimiti #3"の対応例 1

Page 10: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

ロンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ 33

出するはずである。また、歌詞の単語の区切りについて

は考慮していないので、図 6の末尾の例のように、歌詞

中の複数の単語 (haveavea0 te) が対応する記号を持

たないような対応づけも見つけてしまうが、ロンゴロン

ゴが歌詞そのものを表しているとしたら、これは不自然

な対応づけであると思われる。しかし、ロンゴロンゴが

歌詞そのものではなく、歌の概略を記憶するために作ら

れたものであるとする説もある(植木ら:1999)。その

場合は、歌詞の断片的な記録である可能性があり、歌詞

中のシラプルや単語が対応する記号を持たないことが考

えられる。提案手法は、そのような場合でも対応を見つ

けることができる。

一方で提案手法は、このように歌詞の中でシラプルが

どれだけ離れて出現しでも、すべての頻出記号がそれぞ

れ同じシラブルに対応、すれば、行と歌詞が対応すると判

定する。そのため、歌詞が充分に長ければ(そしてロン

ゴロンゴの行が短ければ)、必ず対応すると判定してし

まうものと考えられる。

表 5に、 370編の歌詞のうちで、含まれるシラフール数

の多いものの上位を挙げる。例えば、 3つの行との対応

がみられた“Katea mai te niho #4"は84個のシラブルを

含み、 370編の歌詞のうちで 2番目に多くのシラブルを

含んでいる。また、同様に 3つの行との対応がみられた

“Ka e'a te neru #2"は(シラブル数の上位 10編には入ら

なかったものの)比較的多い 60個のシラブルを合む。

このように、対応すると判定された組合せのいくつか

については歌詞が長いことが原因で、実際には対応して

いないにもかかわらず、誤判定されたものもあると考え

られる。しかし、例えば“Kaonga ira #3"は比較的多く

のシラフ'ルを含んでいるにもかかわらず、どのロンゴロ

ンゴの行とも対応づけが見つからなかった。全体でみる

と、 30,876通りのうちの 618通りという、わずかな組

合せに対してのみ対応があると判定されている。このこ

とから、どんな組合せに対しても対応を見つけてしまう

状況を避けられる程度には、ロンゴロンゴの l行が含む

記号の個数が十分に多く、また歌詞が含むシラ 7+ルの個

数が十分に少なかったと言える。

対応が見つかった行と歌調についてシラブルと記号の

出現位置の対応づけを調べてみると、やはり、歌詞が長

い場合に多くの対応、が見つけられる傾向にある。本論文

で対応があると判定されたロンゴロンゴの行と古謡の歌

詞について、それに含まれる記号とシラブルには、同じ

記号が異なるシラ 7+ルに対応しないという条件の下で、

組合せ論的に多くの出現位置の対応づけが考えられる。

例えば、“Rengamitimiti #3"は92個のシラプルを含み、

370編の歌調のうちで、最も多くのシラプルを含

む。この歌詞と ArukuKurengaの Verso側 l行目には、

656,035通りの対応づけが見つかっている。これらの対

応づけの中から 2例を図?と図 8に示す。表6と表7は、

それぞれの図で示されている記号とシラフ。ルの対応づけ

を表している。この 2つの図に挙げた歌調は同じものだ

が、対応する記号とシラフ'ルの出現位置が異なるため、

歌詞を折り返す位置を変えて示している。ここで、図 7

は、歌詞のできるだけ前半に出現するシラフ'ルに対応づ

けた例であり、図 8は、歌詞のできるだけ後半に出現す

表 8 図9の例における記号とシラブルの対応づけ

コード記号シラプy コード記号シラプJy700 a 008 問 n

200 * 七u 022 a

600 ぷ l 405 ~ ra

049 a go 069 3 ma

Aふ?品。毎PJDl)}給条l((.o税関与5誌初陣f京都

淑P3墜さ歩色3総ぷ勝義OM

図8 Aruku KurengaのVerso側 1行目と“Rengamitimiti #3"の対応例 2

Page 11: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

34情報考古学Vol.18No.l・2,2012

るシラフ'ルに対応づけた例である。

一方、表3に挙げた歌詞の中で、最も少ないシラブ

ルを含むものは“Tamaitipuai rahi #3" (Aruku Kurengaと

対応する歌詞の 30番目)で、 42個のシラプルを合む。

この歌調と ArukuKurengaの対応は 4通り考えられる

が、その一つを図 9に示す。表 8には図 9に示されて

いる記号とシラフツレの対応づけを示す。ここで、 Aruku

KurengaのVerso側 l行目をパルテルコードで見ると

405,008,049という記号列が繰り返されている(図 9

の2段目の左側)。繰り返し出現しているので、これら

は頻出記号である。一方、“Tamaitipuai rahi #3"の歌詞

にも rangorangoという繰り返すシラフやル列が現れてお

り、これらが対応づけられていることが分かる。しかし、

ロンゴロンゴの記号列を見ると、最初の 405,008,049

では 008と049が合字のように連続して描かれている

のに対し、この記号列の次の出現では、 405と00Sが

連続して描かれ、さらに 049は次の 069と連続して描

かれている。このような記号の描かれ方の違いは、ロン

ゴロンゴをパルテルコードの列として扱った段階で無視

されている。そこで、より細かい違いを表すことのでき

るコード化を用いることも考えられる。そのように細か

い違いを考慮することによって、見つけられる対応づけ

は、より少なくなるものと考えられる。

6 結論

ロンゴロンゴの行ごとに、記号の出現順序が、イース

ター島の古謡の歌詞におけるシラブルの出現順序と一

致するか否かを調べた。結果として、行と歌詞の組合

せ618通りについて、対応が見られた。この中には、対

応していないにもかかわらず、頻出記号と頻出シラブル

の順序がたまたま一致したために対応していると誤判定

されたものも含まれていると考えられる。既知の言語を

用いた実験から、頻出記号の種類数が多いほど誤判定の

可能性が低いと考えられる。本稿では頻出記号の種類数

が多い 3つの行との対応づけ 39通りを、実際に対応し

ている可能性が高い組合せとして挙げた。一方、 30,258

通りの組合せについては、いくつかの仮定の下で対応が

無いことが示された。

今後の課題としては、異なる行と歌詞の組合せに対し

て、記号とシラプルの同じ対応づけによって出現順序が

一致するものがあるかどうかを調べることが挙げられ

る。さらに、対応づけられた記号同士およびシラプル同

士の距離などを参考に、記号とシラ 7.ルのもっともらし

い対応づけを抽出することが考えられる。これは、記号

の読みの抽出であり、もし記号の読みが仮定できるので

あれば、イースター島で現在も残っている言葉などから、

記号の意味を推測できるのではないだろうか。こうした

試みが最終的にロンゴロンゴの解読につながることが期

待される。

謝辞

本論文中の図で用いられているロンゴロンゴは、

Cercled Etudes s町 l"Ilede Paques et la Polynesieによ

る画像を rongorongo・0唱 (www.rongorongo.org) よ

り2003年にダウンロードしたものを使わせて頂き

ました。このサイトは 2012年 12月現在、閉鎖され

ています。

また、データの整理に協力してくれた、東京理科大

学の松岡則彦、大段智広の両君に感謝します。

本研究は MEXT科研費 12006473の助成を受けたも

のです。

A待??制例拶給条#(伶与野開i~詩併協調

伊即時ザ匂総級協の/万

図9 Aruku KurengaのVerso側 1行目と寸amaitipuai rahi #3"の対応例

Page 12: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

口ンゴロンゴとイースター島の古謡のシラブル列との統語論的対応づけ 35

付録

A. 対応の有無を判定する疑似コードの詳説

図3のアルゴリズムは、ロンゴロンゴ記号列とシラプ

ル列を lつずつ読み進めていく。ある時点、で、注目して

いる記号R[ら]が頻出記号であって、注目しているシラ

ブ伊ル C[ん]が頻出シラフ'ルであるとき、この 2つが対応

すると考えられるときは、記号列とシラフ'ル列の両方を

読み進める。もし対応しないと考えられるときは、シラ

プル列だけを読み進める。すべての頻出記号に頻出シラ

70

ルを対応づけようとしているので、 (R[ら]が頻出記号

であるときに)記号列だけを読み進めることはない。

もし、ロンゴロンゴ記号列をすべて読んだとすると、

すべての頻出記号がシラフ'ル列中の頻出シラフールに対応

していることになるので、加eを返す (1行目)。ロン

ゴロンゴ記号列を読み終わっていないにもかかわらず、

シラプル列を読み終えてしまった場合には、頻出シラプ

ルに対応しない頻出記号が残っているので、白lseを返

す (2行目)。ロンゴロンゴの記号も古謡のシラブルも

頻出するもののみを対象としている (3,4行目)。ここで、

頻出しないものについて、シラプルよりもロンゴロン

ゴ記号の方を先に読み飛ばしている (3行目)ので、 2

行目でシラプル列が読み終わると判定されるときには、

corresCoun七(iR,ic,H):=

1: if iR ~ lengthR七hen

2: printResul tO ; return 1

3: endif;

4: if ic三lengthcthen return 0 endif;

R[iR]が必ず頻出記号となっており、 falseを返すときは

対応づけられずにいる頻出記号が l個以上あることが保

証される。

5行目以降では、 R[ら]と C[ん]はそれぞれ頻出記号お

よび頻出シラプルである。ここで、 Hの中に R[iR] と対

応するシラプルがある場合 (6-9行目)と無い場合 (11-13

行目)に場合分けする。ここで、 7行目と 11行目は無

駄な計算を減らすための工夫であって、本質的ではない。

この工夫については、後述する。

対応するシラフソレがある場合、 C[iclがR[ら]と対応

するのであれば、 RのiR番目の記号と Cのic番目のシ

ラ7"ルが対応、することが考えられる。このとき、両方を

読み進めて、残りの記号列とシラブル列が対応するので

あれば、trueを返す (8行目)0Cの ic番目のシラブルが、

R[ら]と対応すると (H中で)仮定されているシラフ事ル

と同じものであっても、 Rのら番目の記号は、 Cのic+

l番目以降に出現する同じシラフ@ルと対応する可能性が

ある。また、 C[ic]が、 R[ら]と対応すると仮定されてい

るシラプルと異なる場合にも、やはり Rのら番目の記

号がCの Ic+ 1番目以降にシラフゅルと対応する可能性を

調べる必要がある。そこで、 C[ん]がR[iR] と対応が仮

定されているシラブルと同じか否かにかかわらず、シラ

プル列の方だけを読み進めたときの結果を返す (15行

目)。

5: if the frequency of R [i R] $ 1 then retぽ ncorresCount (i R + 1, ic, H) endif;

6: if the frequency of G [ic]三1then return coロesCount(印,ic+ I,H) endif;

7: count = 0 ;

8: if there exists X such that (R [iR], X)ε H then

9: if X = G[ic] 担 dRestR [i R] $ Resi(フドc]then

10:ωr[iR] = ic ;

11: ∞unt = corresCount(iR + 1, ic + 1, H) 12: endif;

13: cor[iR] = None ;

14: else

15: if RestR [iR] $ Resi(フ[ic]then

16:ωr[iR] = ic ;

17: count = corresCount(句+1, ic + 1, H U {(R[iR], G[ic])})

18: endif;

19: cor[iR] = None ;

20: endif;

21: count = count + corresCount(iR, ic + 1, H)

22: return count.

図 10 ロンゴロンゴの行と古謡の歌詞に何通りの対応があるかを数え、記号とシラブルの対応を記録する疑似コード

Page 13: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

36情報考古学Vol.18No.1・2.2012

Hの中に R[iR]と対応するシラフ'ルが無い場合、 R[iR]

とC[ん]が対応するという仮定を新たに付け加えて、記

号列とシラブル列の両方を読み進めたとき、矛盾のない

対応づけがあれば、回eを返す (12行目)。もしくは、

シラ 7.ル列の方だけを読み進めたときの結果を返す (15

行目)。

ここでは、与えられたロンゴロンゴの行に含まれる全

ての頻出記号が、与えられた古謡の歌詞に出現する頻出

シラプルと対応付けられるか否かを調べているので、あ

る時点以降に出現する頻出記号の方が頻出シラ 7.ルより

も多い場合には、必ず失敗する。ここで、それぞれの頻

出記号や頻出シラブルが末尾から数えていくつ自の登場

であるかは、あらかじめ調べておくことができる。そ

こでロンゴロンゴの行のら番目に登場する記号R[ら]と

同じ記号が、 iR以降末尾までに含まれる個数を RestR[iR]

とする。古謡の歌調に含まれるシラ 7ルについても同様

にRestdic]を定義する。このとき、 R[ら]と C[ん]の対

応が仮定されているときに RestR[iRtRestc[ic]であれば

falseを返すことで、計算時間を大幅に削減することが

できる (7行目)。また、 R[iR]とC[iC]対応するという

仮定を付け加えるのは、 RestR[iR]とRestdidの場合に限

ることで、計算時間を大幅に削減することができる (11

行目)。

B. 対応の個数と出現位置の対応づけを記録する疑似

コード

図3の疑似コードで示したアルゴリズムは、対応づけ

の有無を判定するものだが、対応づけが何通りあるかに

ついて、また、どの頻出記号と頻出シラフ'ルが対応して

いるかについても、同様の考え方に基づくアルゴリズム

を用いて調べることができる。その疑似コードを図 10

に示す。図 10の疑似コードでは、大きさ lenglhRの整数

の大域の配列 corと、 corresCount内に整数を範囲とす

る局所変数 countを用意する。

corは記号とシラフ'ルの出現同士の対応を記録するた

め用いられる。ある時点、までに、ロンゴロンゴ記号列

Rのi番目の記号が、シラプル列の cor[i]番目のシラブ

ルに対応すると仮定されていることを表す。 corの全要

素には、最初、どのシラフ'ルの出現とも対応していな

いことを表す値 Noneを入れておく。 Noneは具体的に

は、 -1などの定数である。 corに記録された対応づけ

が仮定でなく、矛盾の無い対応づけがあると判明するの

は、 Rを最後まで読んだ時である。 printResultはcor

を参照しながら結果を適宜出力するための関数であり、

corresCountはRを最後まで読んだ時に printResultを

呼んで、 1を返す。

countには、ロンゴロンゴ記号列のら番目以降とシラブ

ル列のた番目以降に、(対応づけの仮定Hの下で)何通り

の対応づけがあるかを合計するために用いる。 corresCount

の最後ではこれを返戻値とする (23行目)。

図 10のcorresCountが 1以上であるか否かを調べれ

ば、対応づけの有無が判別できるが、 corresCountは

図3のcorresよりも大きな計算量を要する。なぜな

ら、 corresは、対応づけが見付かった時点で加eを返

した(図 3の8行目および 13行目)が、cor問 sCountは、

R[ら]と C[ic]が対応する場合と対応しない場合を、た

とえ一方が l以上であっても、両方とも計算するからで

ある。そこで実験では、 corresで対応づけがあると判

明した組合せについてのみ、 corresCountを用いて詳細

に調べた。

参考文献

山口文彦

2010 rRongorongo符号列とイースター島古謡音韻列の

対応J,情報処理学会自然言語処理研究会報告,

Vol. 2010・NL-196,No. 20.

20日「小規模なコーパスを用いた仮名漢字混じり文と

仮名文の対応づけj,情報処理学会自然言語処

理研究会報告, Vol. 2010・NL-200,No. 6.

Barthel,τnomas S.

1958a Grundlagen zur Entzierung der Osterinsel-schlψ,

Abhandlungen a凶 demGebeit derAuslandskundeω,

Reihe B, vol. 36,出m-burg:Crnm, de Gruy町&Co.

1958b Talking Boarc.台ofEaster Island, Scientic American,

198,pp.61・68.

Bellwood, Peter著,池野茂訳

1985 rポリネシアj,大明堂

Bellwood, Peter著,植木武,服部研二訳

1989 r太平洋一一東南アジアとオセアニアの人類史一一j,

法政大学出版局

Fischer, Steven Roger

1997 RONGORONGO-the Easter Island script-, Clarendon

Press, Oxford, Oxford Studies in Anthropological

Linguistics, vol. 14.

http://www .rongorongo.org/

一一一一Rongorongoor the Hierogl)同s01 the Easler

Island Table釘, (2003年当時)

Emory, K.P.

1972 Easter Island's position in the prehistory of Polynesia,

Jounal of Polynesian Society, vol. 81, pp. 57・69.

Knight, Kevin, Anish Nair, Nishit Rathod, and Ke吋i

Yamada

2006 Unsupervised analysis for decipherment problems,

In the Proceedings of the COLING/ ACL 2006, pp.

499・506.

Knight, Kevin, and Richard Sproat

2009 Writing systems.translileralion and dec伊herment,

NAACL Tutorial.

Metraux, Al仕'ed

1940 Ethnology of Easter Is/and, Bishop Museum Press,

Page 14: ロンゴロンゴとイースター島の古謡の シラブル列との統語論 …nakagawa/pub/2012/pdf/yamaguchi...ロンゴ口ンゴとイースター島の古謡のシラブル列との統語論的対応づけ

ロンゴロンゴとイースター島の古掘のシラブル列との統語論的対応づけ 37

Bemice P. Bishop Museum Bulletin 160, Honolulu.

Salinas, Jorge Hotus

一一一一一CantosAntiguos de Rapa Nui, Archive of Museo

Antropologico (Chile, Easter Island), the year of

production is w也noWs.

植木武,服部研二, Christopher Stevenson, Peter Bell-

wood,林徹,木村学,湯浅浩史

1999イースター島新たなる発見一一南太平洋の孤

島の謎にいどむ一一,植木武,服部研二監修,

ニュートン 1999年3月号, pp.50・77.

Snyder, Be吋amin,Regina Barzilay, and Kevin Knight

2010 A Slalislical Model戸川oslLanguage Dec伊herment,

ACL 2010, Proceedings ofthe 48血AnnualMeeting

of the Association for Computational Linguistics,

pp. 1048・1057

Yamaguchi, Fumihiko, Shiho Nobesawa, and Kengo Sato

2003 Rongorongo Character Listing Tool, Proceedings

of the 3rd IASTED Intemational Conference on

Visualization, Imaging, and Image Processing, vol.

1, pp. 158・162.

Zeits, Paul著,山口文彦,松崎公紀,三橋泉,松永多苗

子,伊知地宏訳

Syntactic Correspondence between Rongorongo and the Syllable

Sequences of Ancient Chants from Easter Island

Fumihiko YAMAGUCHI and Masaki NAKAGAWA

Wooden artifacts made in the Easter Island remain. Sequences of symbols called Rongorongo are engraved on the wooden

artifacts. Rongorongo is considered to be script, but has not yet been deciphered. As there are some historical records that

Rongorongo was read in chanting voice, we comp訂 eRongorongo with ancient chants in the Easter Island. The comparison is

S戸1旬ctic.A simple exhaustive search method is applied to nd correspondence between the order of symbols in Rongorongo and

that of syllables in ancient chants. The right correspondence is unknown, however, since Rongorongo has not yet deciphered.

Therefore, we evaluate the proposed method by adapting it to a similar problem of matching Hiragana and Kanji mixed text with

Katakana text. After conrming that the method produces very high rate of recall as well as the higher rate of precision when the

more symbols appear which have 2 or more occurrences, we match Rongorongo and ancient chants. As a result, correspondences

are found between some line of Rongorongo and some Iyric of ancient chants, whereas no correspondence is found in most of

combinations between Rongorongo Iines and lyrics of ancient chants.