生成AI対話システム「ヒューマニテクスト」を開発

 名古屋大学デジタル人文社会科学研究推進センターの岩田直也准教授、桜美林大学リベラルアーツ学群の田中一孝准教授、大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)/ROIS―DS人文学オープンデータ共同利用センターの小川潤特任研究員らの研究チームは、生成AI技術を用いて西洋古典学の研究と教育に新たなアプローチを提供する「ヒューマニテクスト」(Humanitext Antiqua)を開発したと発表した。生成AIが直面する偽情報生成問題に対処したことを重要な成果としており、研究チームは西洋古典原典のデータベースを再整備し、学術的水準を保った回答を出力するシステムを開発。さらに、生成内容の出典を確認できる機能も搭載した。このような試みは国内外でも初めてとしている。
 研究チームによると、「ヒューマニテクスト」は、言葉の意味に基づく文脈での探索を可能にすることで、専門外の人々でも効率的に文献を見つけることができ、将来的には、データ基盤のさらなる拡充を図り、時代や文化、学問分野を超えた新しい知識の発掘を目指すとしている。今後このプラットフォームには、論文データや辞書、翻訳、註釈が組みこまれ、人文学の研究に最適化されるよう進化し続け、また教育機関での学習ツールや公共施設での情報提供手段、創作活動へのインスピレーション源としても期待され、西洋古典の普及に重要な役割を果たす見込みという。
 2022年11月にChatGPTが登場して以降、文章やプログラムコードなどを生成するAI技術が世界中で注目を浴びている。その核にある大規模言語モデル(LLM)とは、学習したデータに基づき言語の出現確率を予測する人工知能を指す。
 OpenAI社が2023年3月に公開したLLMであるGPT―4は、古代ギリシア語やラテン語を含む多言語での文脈処理と文章生成において非常に高い精度を実現し、人文学分野での活用可能性を急速に高めた。これまで人間にのみ可能だと思われてきた人文学のテクストを機械が「読解、解釈、分析」するという革命的な事態が急に現実化した。LLMや生成AIの技術を人文学の研究と教育にどのように生かしていくかという問題は、私たちが真剣に検討すべき喫緊の課題となっている。
 人文学分野へのLLMや生成AIの導入は、他の学術分野に比べて著しく遅れをとっている。その背景には、LLMが使用する学習データの信頼性への懸念や、誤った情報を生成するリスク、対話型AIに適切な指示を与えるスキルの必要性といった課題がある。しかし、信頼できるデータ基盤に基づいた研究手法や倫理規定、教育システムがしっかり整備されれば、人文学分野でもAI技術の導入は十分に可能となる。そこで研究チームは、これらの課題を解決し、人文学分野でLLMの多言語による文脈処理の能力を駆使した新たな研究方法を提示することを試みたという。
 ヒューマニテクストの特徴は、西洋古典分野で広く利用されているPerseus Digital Libraryにおけるオープンリソースのテクストデータなどを再構成することで、信頼できる原典テクストに基づいた回答を生成できること。さらに、回答の典拠となる原典テクストとその典拠情報も同時に出力することができ、ユーザーは出力の正確性をいつでも容易に確認することができる。
 このような仕方で、偽情報生成(ハルシネーション)の問題を可能な限り低減させることで、ユーザーが安心してヒューマニテクストを使用することができる。
 ヒューマニテクストの活用によって、これまで個々の著者や著作の研究に細分化されてきた西洋古典分野において、領域横断的な研究が加速度的に進展することが期待できる。
 現在、古代ギリシア語やラテン語の古典テクストを研究する際に使用されるデータベースは、特定の単語の用例を検索することはできるものの、そのデータ量が膨大であるため、すべての検索結果を一つ一つ調べるのはほぼ不可能となっている。このため、研究者は特定の著者や著作に調査対象を絞り、手作業で用例を確認するしかなかった。
 しかし、ヒューマニテクストは、テクストの文脈を高度に理解できるため、ユーザーが自らの興味のある事柄について母語で質問するだけで、それに関連する原典テクストを特定した上で回答を出力できるという。
 これにより、古代ギリシア・ローマの哲学、文学、歴史文献をより広い視点で比較しながら研究することが可能となる。この新しいテクスト探索・分析手法は、西洋古典学だけでなく、人文学全体で幅広い比較研究を進めるための大きな一歩となるとしている。
(全文は7月26日付紙面に掲載)

この記事を書いた記者

アバター
kobayashi
主に行政と情報、通信関連の記事を担当しています。B級ホラーマニア。甘い物と辛い物が好き。あと酸っぱい物と塩辛い物も好きです。たまに苦い物も好みます。