聖書テキストのキアスムス構造を検出する計算言語学的手法

聖書テキストのキアスムス構造を検出する計算言語学的手法

目次

キアスムスをアルゴリズムで見つける試み

聖書研究を続けていると、独特の文学手法に出会うことがあります。

今回はその中でも代表的かつミステリアスな「キアスムス」について、「計算機でごっそり見つける方法を考えてみた」という世界初の試みを紹介する論文を読み解きます。

まずは論文「Computational Discovery of Chiasmus in Ancient Religious Text(※著者訳:古代宗教文書におけるキアスムスの計算的発見)」(2025年1月発表)の要約(Abstract)に基づいて、目的と成果を整理します。

arXive|Computational Discovery of Chiasmus in Ancient Religious Text
公開日:2025年1月18日

交差対句法を検出するための初の計算機的アプローチ

本研究の主な目的は、聖書のテキスト内にある「交差対句法(キアスムス)」を系統的に検出するための、初の計算機的アプローチを導入することです。

キアスムスは聖書学において議論の絶えない文学的技法であり、これまで多くの学者の関心を集めてきました。これを客観的かつ効率的に特定する手法の確立を目指したとのことです。

論文の主な成果

  1. 新しい検出手法の開発:ニューラル埋め込み(neural embedding)を活用し、語彙的および意味的なパターンの両方を補足する手法を開発しました。テキスト内の「節(verse)」と、さらに細かい単位である「半節(half-verse)」のマルチレベルで適用することに成功しています。
  2. 高い検出精度と信頼性の実証:提案された手法は計算効率が良いだけでなく、非常に堅牢な結果を示しました。具体的には、節レベルで0.80、半節レベルで0.60という高いシステム精度(precision@k:プレシジョン・アット・ケー)を達成しています。
  3. 専門家による裏付け:検出されたパターンの一部を専門家がレビューしたところ、高い評価者間一致率が確認され、手法の妥当性が裏付けられました。
  4. 定性的分析の提示:検出されたキアスムスの分布に関する定性的な分析を行い、手法の有効性を際立たせる具体的な事例を紹介しました。

このように、本論文は伝統的な聖書学の課題に対し、最新の自然言語処理技術を用いた定量的な枠組みを提供した点に大きな成果があります。


どんな人たちが研究したの?

研究チームは、イギリスのケンブリッジ大学とアメリカのジョンズ・ホプキンス大学に所属する、計算機科学とデジタル・ヒューマニティーズ(デジタル人文学)の専門家たちで構成されています。

主要な研究者の背景と専門性は以下の通り整理できます。

1. 研究者の所属と主な活動拠点

  • Hope McGovern: ケンブリッジ大学の計算機科学・技術学部に所属しています。彼女の研究は、異宗教間の関係を研究するウルフ研究所(Woolf Institute)およびケンブリッジ・トラストからの支援を受けており、宗教テキストの解析に計算機科学の手法を応用する学際的なアプローチをとっています。
  • Hale Sirin および Tom Lippincott: ジョンズ・ホプキンス大学のデジタル・ヒューマニティーズ・センターに所属しています。同センターは、データサイエンスやAI技術を人文学の研究に統合することに特化した機関です。

2. 専門的なバックグラウンド

この研究チームの強みは、高度な技術力と人文学的な深い素養の融合にあります。

  • 古代言語と文学の専門知識: 執筆者のうち2名(McGovern氏とSirin氏)は、古代言語および古代文学に関する大学院レベルのトレーニングを受けています。この背景があるため、AIが検出したパターンが単なる単語の繰り返しなのか、あるいは文学的な意図を持った「キアスムス(交差対句法)」なのかを、専門的な知見に基づいて人間が評価(アノテーション)することが可能になっています。
  • 計算言語学と自然言語処理(NLP): チームは、ニューラル埋め込み(neural embeddings)やコサイン類似度(cosine similarity)といった最新のNLP技術を駆使しています。彼らは、これまで主観的に議論されがちだった「キアスムス」という文学的技法を数学的に定式化し、計算機によって効率的かつ客観的に検出するアルゴリズムを開発する能力を有しています。

3. 外部専門家との協力

研究チームは、自分たちの技術的な枠組みに閉じこもるのではなく、聖書学の専門家とも緊密に連携しています。論文の謝辞では、ケンブリッジにあるティンデール・ハウス(Tyndale House)の聖書ヘブライ語学者らとの有益な議論が、研究の質を高める上で重要な役割を果たしたことが述べられています。

4. LLMに対する批判的視点

彼らは大規模言語モデル(LLM)の利便性を認めつつも、その「ブラックボックス性」や「データの汚染(訓練データに既存の解説書が含まれているリスク)」を冷静に分析しています。学者にとって検証可能で、説明責任を果たせる、より厳密な数学的フレームワークを構築しようとする姿勢は、彼らの研究者としての誠実なバックグラウンドを反映しています。

まとめると、このチームは「計算機科学の高度なスキル」と「古代聖典に対する深い言語学的理解」を兼ね備え、伝統的な人文学に科学的な厳密さをもたらそうとしているデジタル・ヒューマニティーズの専門家集団です。


キアスムス(キアズム・カイアズム、キアスム)とは?

ここで、もう少しキアスムスについて整理してみます。

交差対句法(キアスムス、chiasmus)とは、テキストの構成要素を対称的な順序で配置する文学的手法のことです。

1. 交差対句法(キアスムス)の定義

この名称は、英語の「X」に似た形のギリシャ文字「 χ(カイ/キー)」に由来しています。最も基本的な構造は「A-B-B’-A’」という形式で、対になる要素(AとA’、BとB’)が概念や言葉の繰り返しによって対称性を成します。

  • 構造の例: 「あなたの国があなたのために何ができるかを問うのではなく(A)、あなたがあなたの国のために何ができるかを問いなさい(A’)」といった有名な格言も、この構造の一種です。
  • 特徴: 偶数行の構造だけでなく、中央に孤立した要素を持つ奇数行の構造(中心強調型)や、100行に及ぶような長い構造も存在します。

2. 聖書の物語構造との関わり

聖書、特に古代ヘブライ詩や物語において、キアスムスは非常に一般的な修辞技法として使われており、以下のような役割を果たしています。

  • テーマの強調と神学的な意図: 創世記1章の創造の物語(1:19-23)に見られるキアスムスは、創造の秩序と、神が「良し」とされた繰り返しの肯定を強調しています。また、ノアとの契約の場面では、この構造が「修復の約束」や「虹」の象徴性を際立たせています。
  • 物語の緊張感と逆転の表現: ヤコブがエサウから誕生の権利を奪う物語(創世記25章)では、キアスムス構造が兄弟間の緊張や運命の逆転を反映するように配置されています。アブラハムによるイサクの献げ物の場面でも、劇的なインパクトを高めるために使用されています。
  • 神の権威の表現: 聖書の中で「神の言葉」として記されている箇所の多くはキアスムスや詩的な形式をとっており、これにより神の言葉の厳かさや権威が表現されています。
  • 物語全体の構造化: 節単位だけでなく、創世記の洪水物語のように、物語全体のプロット構造がトピックごとにキアスムスを形成している場合もあります。

3. 聖書における主な出現箇所

計算言語学的な分析によると、キアスムスは聖書のさまざまな書物で確認されています。

  • 詩篇、イザヤ書、エゼキエル書: 詩的なセクションが多く、半節単位の短いキアスムスが顕著に見られます。
  • 創世記: 叙事詩的な物語や、公式化された系図の中に多くの構造が含まれています。
  • 歴史書(民数記、サムエル記、列王記など): 「Xが王になり、Y年間統治し、主の目に悪とされること事を行った」といった定型的な物語パターンとしても検出されています。

このように、キアスムスは単なる装飾ではなく、聖書のメッセージを構造的に支え、読者に特定の視点や感情的なインパクトを与える重要な枠組みとなっています。


キアスムスをとりまく議論

キアスムス(交差対句法)が聖書学において議論の絶えないトピックである理由は、主にその検出方法の主観性と、存在の定義に関する曖昧さにあります。

検出方法が主観寄りになりがち

聖書におけるキアスムスの検出には、これまで定量的な手法が欠如していました。作業は非常に労力がかかり、かつ主観的(属人的)なものにならざるを得ませんでした。

その結果、特定の箇所にキアスムスが存在するかどうか、またその分布の度合いや正確な位置については、学者の間でも議論が続いています。

キアスムスが使われる意図がたくさんある

次に、キアスムスの目的についても複数の節が存在します。ある学者は物語の登場人物を描写するために使用されていると主張します。別の学者は詩編における詩的な技法、あるいは法的文書における儀式的な言語を表現するためのものだと考えています。このように、技法が使われている意図が多義的であることも議論の原因となっています。

専門家でも判別がムズい

さらに、意図的な対称性を持つキアスムスと、単なる言葉や概念の繰り返し(非キアスムス的反復)を区別することが困難であるという点も挙げられます。専門家であっても、テキストに構造的な反復があることには同意できても、それが明確にキアスムスであるかどうかを判別することには、わずかな不一致や混乱が生じることが研究で示されています。

プロット構造のキアスムスもある

加えて、キアスムスは「節」や「半節」といった短い単位だけなく、物語全体のプロット構造といった大きな単位でも指摘されることがあります。このような大規模な構造については学術的な定義がさらに曖昧であり、精密に定義することが難しいという性質を持っています。

上記のような要因が組み合わさり、キアスムスは聖書学者を魅了し続ける一方で、常に学術的な議論の対象となっているのです。


独自の統計的手法を採用した理由

研究において、LLM(大規模言語モデル)を避けて独自の統計的手法を採用した理由は何か、整理してみます。

1.LLMが不向きである理由

研究チームは、以下の2つの主要な懸念から、LLMの使用は聖書のキアスムス検出には適さないと判断しています。

  • データの汚染(Data Contamination):LLMは学習過程で、オンライン上の膨大な聖書注解書や、キアスムスの構造に言及した解説データに晒されています。実際、一部のモデルはヘブライ語の原文から特定の英語訳(ESVなど)をそのまま出力する傾向があり、これはモデルが学習済みの人手による注釈に依存しているリスクを示唆しています。
  • 説明責任と透明性の欠如:LLMの回答生成プロセスは不透明な「ブラックボックス」です。聖書学者が研究成果を検証し、議論の土台とするためには、解釈可能で検証可能な方法論が必要であり、LLMではその学術的な要求に応えられません。

2.採用された統計的な埋め込み手法

LLMに代わり、数学的に定式化された以下のアルゴリズムが開発されました。

  • 埋め込みモデルの使用:テキストをベクトル化するために、多言語埋め込みモデル「E5」を採用しました。これにより、単なる単語の重なり(語彙的パターン)だけでなく、概念的つながり(意味的パターン)もとらえることが可能になります。
  • コサイン類似度行列の構築:テキストの各単位(節や半節)間の類似度を計算し、行列を作成します。
  • スコアリング:
    • キアスムスを形成するペア(AとA’、BとB’など)の類似度の平均を算出します。
    • それ以外のペア(非ペア)の類似度の平均を算出します。
    • 最終的なスコアは、この「キアスムス・ペアの平均」から「非ペアの平均」を引いた差として定義されます。
  • 統計的検定:スライディングウィンドウ手法を用いてテキスト全体をスキャンし、得られたスコアをzスコア(標準得点)に変換します。平均から3標準偏差以上高いスコアを持つものを、統計的に有意なキアスムスとして特定します。

3.独自アルゴリズムの利点と数値的成果

独自の手法を用いたことで、以下の利点と成果が得られました。

主な利点

  • 客観的な枠組みの提供:曖昧さが残るキアスムスの概念を数学的に定式化し、標準化された議論の枠組みを構築できました。
  • 効率性と汎用性:この手法は計算効率が高く、4行の短いものから100行に及ぶ長い構造まで検出可能です。また、特定の言語に依存しない(language-agnostic)設計になっています。

数値的成果

  • 検出数:ヘブライ語聖書全体から、半節レベルで1,896個、節レベルで879個のキアスムス構造が特定されました。
  • 高い精度(Precision@k):検出されたパターンの上位50件を専門家が検証した結果、節レベルで0.80、半節レベルで0.60という高い精度を達成しました。
  • 専門家間の一致率:専門家の依るアノテーションの一致度を示すコーンのカッパ係数は、節レベルで0.89、半節レベルで0.76と非常に高く、システムの信頼性が裏付けられました。
  • エラーの少なさ:スコア上位100件のうち、反復要素が全く見当たらない「反復なし」と判定されたのはわずか3%でした。

この研究は、伝統的な人文学の課題に対し、LLMのバイアスを避けつつ科学的かつ定量的な解決策を提示することに成功しています。


創世記1章の天地創造の物語の構造

今回の研究手法により、5行構成の交差対句法(キアスムス)という構造が見つかりました。

具体的には、創世記1章19節から23節にかけて、以下のような対称的な構造が確認されています。

  • 構造の配置(A-B-C-B’-A’)
    • 外側(AとA’):「夕があり、朝があった。第4日(第5日)」という、日付を記す定型的な表現が対になっています。
    • 内側(BとB’):水の中の生き物や空の鳥に対する神の言葉や祝福が対応しています。
    • 中心(C):神による創造の実行と、「神はそれを見て、良しとされた」という肯定的な評価が記されています。

この構造が持つ意味や効果として、以下の点が挙げられています。

  • 秩序と意図の強調:このキアスムス構造は、天地創造の物語における秩序的正しさと、修辞的な意図を際立たせています。
  • 神の肯定の強調:構造の中心や反復を通じて、自らの創造物を「良し」とする神の繰り返しの肯定が強調されています。
  • 詩的な性質の裏付け:この発見は、天地創造の奇術が持つ詩的な性質を強調する既存の学術的解釈とも一致しています。

創世記全体としても、このような「半節」単位の構造が非常に多く検出されており、それは創世期が濃密な叙事詩的物語や文学的なパッセージ、そして定型的な系図を多く含んでいるという文学的性質を反映しています。


その他、論文内で具体的に挙げられている例は以下の通りです。

  1. ヤコブとエサウの物語(創世記25章30〜34節) ヤコブがエサウから誕生の権利を奪う場面でキアスムスが検出されました。この構造は、兄弟間の緊張や運命の逆転を反映していると分析されています。
  2. ノアの契約(創世記9章12〜15節) 洪水後の神とノアとの契約の場面でも明確なキアスムスが見つかりました。この反復的な構造は、神による修復の約束と、雲の中に現れる「虹(弓)」の象徴的な重要性を強調しています。
  3. アブラハムとイサクの物語 イサクを献げ物にする場面においても、キアスムスが物語の劇的なインパクトや神学的な影響を高めるために機能していることが示されています。

補足的なトピック

論文内で言及された補足的な内容です。

独自アルゴリズムが100行もの長い構造を検出できるのはなぜ?

この手法が「スライディングウィンドウ方式」を採用しており、ウィンドウの長さ(N)を柔軟に設定できる設計になっているためです。

具体的には、ペアとなる行同士の類似度の平均(μ chiasmus)と、ペアではない行同士の類似度の平均(μ non pair)の差を算出するという数学的な定式化を行っており、この計算式は行数が増えても運用可能です。


研究で使用された「半節(half-verse)」という単位は、どのように定義されているの?

ヘブライ語聖書の原文における「アトナハ(atnach)」という詠唱記号に基づいて定義されています。アトナハは通常、一つの節を二つに分ける位置に記されており、研究チームはこの記号が含まれる単語までを「前半」、それ以降を「後半」として分割しました。


キアスムスが最も多く検出された聖書の本は?

単位によって異なります。

  1. 半節単位:創世記(Genesis)が最多でした。
  2. 節単位:民数記(Numbers)が最多でした。

なぜ特定の書物にキアスムスが多く検出されたの?

以下のテキストの性質が挙げられています。

  1. 詩的セクションの存在:詩編、イザヤ書、エゼキエル書などは詩的な部分が多く、特に半節レベルのキアスムス構造が顕著に現れます。
  2. 文学的な叙事詩と系図:創世記には、濃密な叙事詩的物語や文学的なパッセージに加え、定型化された多くの「系図(genealogies)」が含まれており、これらが構造的な反復として検出されます。
  3. 定型的な物語パターン:サムエル記、士師記、歴代誌などの歴史書では、「Xが王になり、Y年間統治し、主の目に悪とされる事を行った」といった、イスラエルの王家に関する反復的な物語の公式(フォーミュラ)がキアスムス的なパターンとして識別されています。

このように、意図的な修辞技法としてのキアスムスだけでなく、聖書特有の儀式的・定型的な言語表現も、このアルゴリズムによって構造的パターンとしてとらえらえています。


研究の今後の展望

この研究の次の段階として、著者らは主に以下の展開を検討しています。

詩編の学術的探索

まず、開発した検出手法を用いて、聖書内、特に詩編におけるキアスムスのラベル付きコーパスを作成し、学術的な探索に役立てることが挙げられています。

他テキストへの展開

また、この手法は特定の言語に依存しない(language-agnostic)設計であるため、聖書以外の様々なテキストや翻訳版に対しても、キアスムスを発見するために広く適用していくことが期待されています。

物語レベルの大規模な構造の分析

さらに、現在は節や半節といった単位での構造に焦点を当てていますが、将来的には物語レベルのより大規模なプロット構造(例えば創世記の洪水物語のように、トピックが対照的に配置された構造)の分析も、潜在的な領域として言及されています。

ただし、物語レベルのキアスムスは語彙的な特徴が少なく、学術的な定義も現時点では精密さに欠けるため、今回の研究範囲からは除外されていました。

以上のように、高度な計算技術を文学分析に活用し、これまで主観的な判断に頼るしかなかった文学的パターンを明らかにすることが、今後の大きな目標とされています。


前回取り扱った論文以上に緻密な内容を含んでいました。

そんな中でも慣れ親しんだ書物のタイトルが出てきたり、系図やキアスムスやアトナハなどの聖書研究で必ず耳にするワードが飛び込んでくると、一気に親近感がわきませんか?

計算機科学は、倫理や人間の存在意義など、つい抽象的な枠組みでとらえてしまいがちです。

しかし大学院レベルの古典理解や、新しいアルゴリズムを開発する専門性は、日々の緻密は研究成果の積み重ね意外の何ものでもありません。

今後も、聖書研究と最新のテクノロジーとの懸け橋となる研究や取り組みを紹介していきたいと思います。

コミュニティやSNSでシェアして、話題にしていただけたら嬉しいです。記事への「いいね」も励みになります!


論文内で紹介された専門用語の解説

学問・技術分野に関する用語

計算機科学(Computer Science) 著者らの専門分野であり、本研究では聖典内のキアスムス(交差対句法)を系統的に検出するための計算論的なアルゴリズムを開発・適用するために用いられています。

キアスムス(交差対句法) テキストの単位が意図的に対称的な順序で配置された構造を指します。ギリシャ文字の「 $\chi$ (カイ)」が「X」の形をしていることに由来し、基本的には「ABB’A’」のようなパターンをとります。現代語では稀ですが、古代ヘブライ詩や演説では非常に一般的な修辞技法です。

計算言語学(Computational Linguistics) 言語を計算可能な形式で扱う分野です。本研究では、ニューラル埋め込みや統計的手法を用いて、伝統的に主観的な判断に頼っていた文学的技法の検出を客観的に定式化しています。


モデルとアルゴリズムに関する用語

ニューラル埋め込み(neural embeddings) テキストをベクトル(数値の羅列)として表現する技術です。単なる単語の繰り返しだけでなく、行同士の意味的な類似性や修辞的な意図を含むパターンを捕捉するために使用されます。

多言語埋め込みモデル「E5」 本研究で特徴ベクトルを抽出するために採用されたモデルです。ヘブライ語を含む複数の言語に対応しており、テキストの意味的なつながりを捉えることができます。

スライディングウィンドウ方式 テキストのすべての開始位置を潜在的なキアスムスの起点と見なし、固定された長さ(ウィンドウ)の範囲内でスコアを計算しながら、少しずつ位置をずらして分析を繰り返す手法です。

language-agnostic設計 特定の言語に依存しない設計のことです。英語やドイツ語に限定されていた従来の研究とは異なり、ヘブライ語原文やその他の様々な翻訳版にも広く適用可能な汎用性を持っています。


評価と統計に関する用語

コサイン類似度(cosine similarity) 2つのベクトルの間の類似性を測定する指標です。これを用いて類似度行列を構築し、キアスムスを形成するペア(AとA’など)がどれだけ似ているかを計算します。

zスコア(標準得点) 算出されたキアスムススコアを標準化し、全体の中でどれだけ特異な値であるかを示す数値です。本研究では、平均から3標準偏差以上高いスコアを「統計的に有意なキアスムス」として特定しています。

precision@k システムが提示した上位k個の候補のうち、専門家によって正解と判定された割合を示す精度指標です。本研究では節レベルで0.80(80%)、半節レベルで0.60(60%)という高い精度を達成しました。

コーンのカッパ係数(Cohen’s Kappa) 2人の評価者(専門家)による判断がどれだけ一致しているかを定量化した指標です。節レベルで0.89、半節レベルで0.76という数値が得られており、評価者間で強い一致があることを示しています。


大規模言語モデル(LLM)に関する用語

大規模言語モデル(LLM)のブラックボックス性 モデルが回答を生成する内部プロセスが不透明で、なぜその結論に至ったかを説明できない性質のことです。学術的な聖書研究においては、結果の検証可能性と説明責任が重視されるため、この不透明さが採用の障壁となります。

大規模言語モデル(LLM)のデータの汚染 LLMの学習データに、インターネット上の聖書注解書や、すでに人間が指摘したキアスムスの解説が含まれてしまっている状態を指します。これにより、モデルが自ら構造を分析しているのではなく、既存の知識を「カンニング」して回答しているリスクが生じます。


聖書研究の単位に関する用語

聖書における「節(verse)」と「半節(half-verse)」 本研究で分析の対象となったテキストの粒度です。ヘブライ語聖書の原文では、「アトナハ」という詠唱記号が通常1つの節を前後に分ける役割を果たしており、これに基づいて「半節」という単位が定義されています。


本稿では、生成AIを用いた文献整理および技術的検討を行っています。AIは分析補助ツールとして使用しており、神学的評価・批判的視点は筆者自身の立場に基づいています。


こちらもおすすめ


姉妹サイト『聖書ファンタジー講座』もよろしくお願い致します

https://theologyfantasy.com/

聖書ファンタジー講座 TheFa|Theology Fantasy|サイトへの画像リンク