「日本語が辿ってきた歴史」という終わらない問いから「今LLMと言われているものの未来」に少しだけ思いを馳せる
年初からオンエアが始まったNHK大河ドラマの「光る君へ」の背景となっている平安時代の歴史や当時書かれた書物を目にすることができるという状況は、本当に素晴らしいと思っています。もちろん平安時代どころか更に遡って1300年以上前に成立したとされる日本書紀や古事記まで遡って日本語(勿論古語ですが)で書かれた書物を目にすることができるということ、そしてその現代語訳までを読むことができるというのは本当に凄いと素直に思っています。私ごときが今更何を言うんだという話は当然あるかとは思うのですが、素直な気持ちとして本当に凄いと思っています。
でもなぜ今更そんな話を?
なぜ古典に?
勿論大河ドラマの話はあるのですが、よくある「昔のある時期にタイムリープしたらどうなるか」系のお話から元々気になっていました。自分的に例えば昭和の頃の「戦国自衛隊」から始まって「JIN−仁−」とか、あるいはもっと近場だと「不適切にもほどがある」といったドラマや映画があるわけですが、令和と昭和くらいならともかく、もっと昔に遡ると日本語の系譜ではあるけれど言葉として通じない事が起きないか?とずっと思っていました。
残念ながら学問としてそういったところを体系だって学ぶ機会を得られていないのですが、長生きしてきた中で時々古典に触れたり、あるいは古語と現代語の違いといった内容に関わる文献などに触れる機会があったりします。もちろん学問として専門に取り組んでいらっしゃる方は歴史上多くいらっしゃっただろうし今でもいらっしゃると思う中で素人が妙なことを言うべきでは無いと言うのは百も承知で、でも時々「この違いって凄いよな」と思うところだけに触れたいと思います。
実は平家物語が大好き
私の母親は揚羽蝶紋のついた着物を代々受け継いでいます。母親の母親(祖母ですね)から更に昔から代々その家系の女性が受け継いで来たもので、いわゆる家紋とは違う扱いになっています。いわゆる「平家」の紋です。
そちらの「本家」は広島県の瀬戸内沿いの某所に今でも続いてる家系で、そちらには平安時代まで遡る家系図が今でもあり、私の母親は一番端っこに自分の名前が入ってるところまで何度か見ているとのこと。ちなみに予言の書ではないので未来の人の名前は入っていないそうです(笑)。
そして揚羽蝶紋を女系で揚羽蝶紋を継いでいるのは壇ノ浦の後の男系断絶の流れのなかで女性のみ生き残った流れだと言う話が今でも伝わっているそうです。母親の実家そのものは江戸後期に今の広島県内の本家から商家として下関に分家したような形らしいのですが、特に大正期から第二次大戦終戦しばらくの時期に本家との間で本当に色々あったらしく私が物心ついた頃には既にそちらと私の母親の実家とは殆ど行き来がなくなっており、私自身物心ついた頃から既に「気になるかもしれないけれど一生関わらないほうが良い」とはっきりと言われていて、実際私自身は母親側の「本家」には行ったことがありませんし、記憶の限り年賀状などでもそちらの家から来た手紙など一度も見たことがありません。
自分のルーツとしての「家系」に思う事
ここにはもう自分が触れないほうが良い世界があるといことだけははっきりしていますし、行き来をするなと言われている以上(というか探し出して訪ねてみてもどうなるかよくわからないので)確証はないのですが、そんな話があるおかげで中学の頃から平家物語が好きです。最初は現代語訳から入りましたが、高校の頃に角川の古典文庫本を買ってから一体何度読み返したことか。自分自身も出生地が下関で、その下関に親の転勤のおかげで小学校から中学にかけて3年ほど住んだこともあり、気持ちの上ではご先祖様の物語として接してきました。
その後、たとえば今は実家は神戸市内なのですが、元々平家に繋がる経緯は無いと思われる父親が自分のために設けた墓所は平家に縁の有る古刹須磨寺だったりして、少なからず平家には縁があるのだろうと勝手に思い込んでいたりします。
あ、でも本題はそこじゃなくて、ちゃんと勉強したわけではないですがそれでも比較的「古典」あるいは「古文」の世界って言い回しが時代とか書物の内容によって色々変化したりしてるのが好きなんですよね。趣味にすらならないレベルの知識ですけれど。
文語としての古文の表現と話し言葉に思いを馳せる
話し言葉をそのまま記述したものというのはなかなか残っていないわけですが、それでもたとえば天草版伊曽保物語は1600年代にアルファベット=表音文字で書き記された事によって当時の発音がかなりしっかりと推察できて、本当に好きなんです。
たとえば現代語の「はひふへほ」は「ふぁふぃふふぇふぉ」という発音だったり、「を」は「うぉ」に近い発音だったり。
たとえば割と最近の「チコちゃんに叱られる」で「こんにちは」の「は」な何故「わ」ではなく「は」なのかといった話が出ていて、もちろん歴史的に言葉の変化を完全に追うことは難しいので最終的に諸説あります系の話に近くはなりますが、それでも実は現代語で「はひふへほ」として発音されている部分は元々発音として「ぱぴぷぺぽ」であり、それが変化するなかで「ふぁふぃふふぇふぉ」の時代が長くあり、それが現在は「はひふへほ」と変化してきているという話がありました。
実はこの流れを歴史ドラマとして再現した「平安時代の口語でセリフを構成した平家の貴族と下級武士が出てくる平安期の短編ドラマ」を随分昔に見た覚えがあります。多分20年以上前なので番組名も覚えていないのですが、例えば今で言うNHKの「歴史探偵」のような番組の中での再現ドラマ的なモノだった筈なのですが、それが実際「はひふへほ」にあたる部分を「ぱぴぷぺぽ」と発音していて、勿論それ以外に当時の口語としておそらくこういう言い回しがされていたであろうセリフで構成されていて、字幕が無いとさっぱり分からず何故か大笑いしてしまったのを今でも覚えています。
なお、方言については深く考慮されていなかった...というか考慮することが殆ど不可能であったかもしれませんが、これについてはどのような扱いになっていたか記憶がありません。
しかし、そのドラマを見て素直に思ったのが「SFの世界にあるようなタイムマシンで昔や未来の日本国内に行っても言葉がわからんって普通にあっておかしくないよね」ということ。
翻ってネット上に時々ある「2XXX年から来たけど聞きたいことある?」系の話、まぁ自動翻訳機を持ってたり超絶優れた頭脳で現代の言葉を現代人と同じレベルで使えるスーパーマンであれば別に何世紀先の未来から来ても全然OKでしょという推理小説で「犯人が双子」と同じくらいの禁じ手を使って解決してしまうこともできるのですが、おそらく苦労するんだろうなと誰の役にも立たない心配をしてしまいます。
とりあえず今の日本語という言語が持つ歴史的背景からくる超絶技巧
過去からいろんなバリエーションがある一文ですが、これを「3月1日は日曜日で祝日、日中から月曜日にかけて2日間ずっと快晴でした」とか色々細かくバリエーションが作れて、かつ難易度をどんどん上げられる代物。日本語ネイティブだと割りと普通に読める一文だったりするわけですが、「日本語ネイティブではない方が日本語を学ぶ際の非常に大きな障害」でもある言い回しの一つの形ですね。あるいは「日本人をカタる誰かの正体を多くの場合一発で暴くことができる技」と言われたりもしていますが、まぁそれはそれ。そもそも単一言語で文字が3種類ある言語など世界的にあまり例が無いのもよく言われる話ですが、歴史の中で例えば明治初頭に日本語としての文字を廃止してアルファベット表記にしようという流れがあったり第二次大戦後に同様の話あるいは公用語を英語にしようとする動きがあったりとか色々あったのですが、それでも今でも日本語として成立していて1000年以上前の古典にすら触れることができること自体は本当に素敵だと思っています。
別に日本語が偉いとかそういう話ではありません。
でも、そういう古典ですら自分の言葉の先祖として読めることは素敵だと思っています。
そして、日本語のLLMって文字の選択や読み方読ませ方まで含めた表記次第でニュアンスを変化させることができるから大変だよねと改めて思ったりしてます。
まぁ今のAIの仕組みとLLMのモデルでは情報として存在しないものを推論して作り出すことはできず、食わせた情報から組み上げてくるしかない訳です。しかも何らかのバイアスがそこにかけられたとしてもそれを証明できないという非常に大きな問題があると思ってるんですが、まぁそれはそれ。
それはともかく、いずれにしても勿論未来にどう変化していくかなんて誰にもわかりません。それこそ何十年何百年のスパンで見たときにもし今の日本語の体系が残っている場合に例えば「ら抜き言葉」レベルの話ではなく、大きく変わっているかもしれません。未来に行けるタイムマシンが開発されない限り今の私たちが確認する術はありませんし、今の私達の言語をその頃の人たちがどれほど理解してくれるかも解りませんが。