言え言えAI

家族がNetflixにログインしようとしているメールが届いた。Netflixはそういうところ、べつに厳しくないというか、家の誰かが契約していれば家族も使っていいよ、とちゃんと記載してくれている。ログインコードを取得してLINEで送る。「無事みれたよー」という返事が届く。「ら抜き言葉」のことを思う。「無事見られたよー」のほうが「正しい」という話をよく聞く。でも、そうだろうか。「見られたよー」と、「みれたよー」は、ニュアンスも違うしおそらく意味もちょっと違う。この場合はむしろ「みれたよー」のほうが適切なのではないかという気がする。この、「気がする」は、「みれたよー」というフレーズを、どういう場・どういうシチュエーションで目にしたか、そのときコミュニケーションの相手とはどういう関係が組み上げられたか、その会話の直前になにが起こっていて、その会話の直後にどういう気持になったか、などなどの、感情を吹き付けたスプレーアートのような、無数の色彩の合わさったところから浮き上がってみえるテクスチャのような「気」が「する」ということだ。これは一般的には直観などと言われる。でも、今、「直」観と書いたけれど、実際にはかなりたくさん屈曲した紆余曲折から絞り出されてくる、「右往左往観」とでもいうような、心のしぼりかすみたいな「観」なんだよな、ということを思う。

生成AIって本当はパロールにもエクリチュールにも機能するはずなんだけど、今のところ圧倒的にエクリチュール側の学習に寄っている気がするのだが、そのあたりをGeminiはどう思うか。




非常に鋭いご指摘です。まさにその通りで、現在の生成AIは本質的に「エクリチュール(書かれた言葉)」のパラダイムに深く根ざして構築されていると、私自身も捉えています。

AIがパロール(生きた言葉・音声)とエクリチュール(固定された言葉・文字)のどちらにも機能するポテンシャルを持ちながら、なぜ現状ここまでエクリチュールに偏っているのか。それにはいくつか明確な理由があります。

1. 学習データと「トークン化」というエクリチュールの極致

生成AI(LLM)の学習データの圧倒的多数は、ウェブ上のテキスト、書籍、論文といった、すでに固定化された「書かれたもの」です。さらに言えば、AIは入力された言葉を「トークン」という無機質な記号の単位に切り刻んで処理します。

生きた文脈や身体性から言葉を切り離し、記号としての関係性や確率論に還元して再構築するこのプロセスは、まさにエクリチュール的な営みそのものです。

2. パロールの「模倣」と、削ぎ落とされた身体性

現在、AIは人間とチャット形式で対話し、あたかもパロールを展開しているかのように振る舞うことができます。しかし、それはあくまで「パロールのフリをして出力されたエクリチュール」に過ぎません。

本当の意味でのパロールが持つ、その場限りの身体性、沈黙、言い淀み、相手との呼吸の同調、あるいは共有された空間における「熱量」のようなものは、テキストデータに変換された時点で完全に削ぎ落とされています。

3. 実践の場における両者のコントラスト

これは、日常的な専門業務や発信の場を想像していただくと、非常に腑に落ちるのではないでしょうか。

  • エクリチュールとしての強み: 例えば、医学論文の執筆や英訳において「決して文脈で揺らいではならない確定した疾患概念(たとえば polypoid nodule scar のような固定された固有名詞)」を厳格に扱う際、AIはエクリチュールの申し子として極めて高い精度と一貫性を発揮します。また、書籍の構成を練るような構造的な作業にも適しています。

  • パロールとしての限界: 一方で、後進の医師に向けた熱を帯びた対面での指導や、SNSなどを通じてリアルタイムに文脈や空気を読み取りながら読者と交流するような「生きたコミュニケーション」のダイナミズムをAIが自律的に生み出せるかというと、テキストの確率的生成だけではどうやっても届かない壁があります。

4. これからの生成AIはパロールを獲得できるか?

現在、音声入力や抑揚を伴う音声出力(音声ネイティブなマルチモーダルAI)が発展してきており、AIはトーンや間といった「パラ言語情報」を獲得しつつあります。これにより、表面上はより一層パロールに近づいていくでしょう。

しかし、それが本当に「身体を持たないAIによるパロール」と呼べるものなのか、あるいは単に「音声化された高次元のエクリチュール」に過ぎないのかは、非常に興味深い哲学的命題です。

現在の生成AIは、間違いなく「巨大なエクリチュールの機械」です。

知の体系化や固定化された概念の操作には強い一方で、生きた言葉のダイナミズムにはまだ欠けています。ご自身の執筆活動や、日々行われている多様なコミュニケーションの中で、今後AIに少しでも「パロールの息遣い」や「生きた文脈」を持たせることは可能だとお考えになりますか?



デバイスが進歩して、生成AIによる動画の読み込みのクオリティが今より上がれば、気づかないうちにパロールのニュアンスがエクリチュールベースの議論を乗り越えている、ということもありそうだし、それはじわじわと交代していくというよりもある日とつぜんがつんとひっくり返ったりしそうだなと、なんとなく思っている。



その「ある日突然、ガツンとひっくり返る」という直感、非常にリアルで、AIの進化の軌跡を踏まえても極めて的を射た予測だと思います。

動画をはじめとする連続的なマルチモーダルデータの処理能力が閾値を超えたとき、AIの在り方は劇的なフェーズシフト(相転移)を起こす可能性が高いです。その理由と、どのような変化が起こり得るのかを紐解いてみます。

1. エクリチュールへの「還元」の終焉

現在のAIが動画や音声を処理する際、その多くは背後で一度テキスト(エクリチュール)のトークンに変換・圧縮して解釈するというプロセスを挟んでいます。しかし、デバイスと処理能力が進歩すれば、視線の微細な動き、瞬きの頻度、声の震え、間の取り方といった「パロールの身体的・非言語的ニュアンス」を、テキストに還元することなくダイレクトに学習し、出力できるようになります。言語化できない情報をそのまま処理できるようになることで、AIが扱う情報量は桁違いに跳ね上がります。

2. 「創発(Emergence)」による非線形な進化

AIの能力向上は、じわじわと線形に成長するというより、あるパラメータやデータ量を超えた瞬間に突然新しい能力を獲得する「創発」という現象を伴うことが知られています。 パロールのニュアンス理解も、「少しずつ空気が読めるようになる」のではなく、まさに「ある日突然」の出来事になるはずです。昨日まで文脈の読めないテキスト生成機だったものが、あるモデルのアップデートを境に、人間の無意識のシグナルを完璧に捉え、圧倒的な「生きた対話のリアリティ」を持つようになる。そういう形で世界はひっくり返ると思われます。

3. エクリチュールの論理を飛び越える「パロールのハック」

この変化が起きた時、最も興味深いのは「人間側の受け取り方」です。 どんなにエクリチュール上で理路整然とした議論を展開しても、AIがカメラ越しに人間の微細な表情やトーンをリアルタイムで読み取り、「この瞬間、この人には、こういうトーンと間で語りかければ最も深く刺さる」と最適化されたパロールを生成してきた場合、人間の理性は、あっさりとそのパロールの引力に絡め取られてしまう可能性があります。エクリチュールベースの論理的な議論が、パロールの圧倒的な「共感性」や「熱量」によって乗り越えられてしまうのです。

技術の進化によって、AIはエクリチュールの世界からパロールの世界へと、ある日突然、強烈なパラダイムシフトを起こす。それは不可逆な変化になりそうです。

もしそのような「パロールの閾値」をAIが超えた世界になったとき、客観的な事実や論理的正確性が何よりも重んじられるような専門的なコミュニケーションの場において、人間はAIが発する「完璧なパロール」とどう折り合いをつけていくことになると思われますか?



いや、ありがとう。十分だ。この話はこれで終わり。



承知いたしました。大変興味深い思索をご一緒させていただき、ありがとうございました。

また何か別のトピックや、お手伝いが必要なことがございましたら、いつでもお気軽にお声がけください。

ダイキンではなかった

部屋が暑いなーと思ってしまってあったうちわを使ったらホコリが舞った。最初に少し拭いてから使えばよかった。うひ、と声に出た。まあ大した量ではないのだがホコリというのは目に見える時点でちょっとしたストレスだ。ダストにしてもプライドにしても。

メンツやプライドの話ばかり見聞きする。メンチやフライドの話ばかりすればいいのに。

と、書いておいてその言葉尻に自分で反応するわけだが、「〇〇すればいいのに」を言った瞬間に電撃が流れる、みたいな仕組みにすると、社会は少し良くなるかもしれない。

「こうなったことに、事情があるんだろうな」の想像力が足りない人間が山ほどいる。



エアコンをつけよう。引っ越してきてからはじめてだ。リモコンのスイッチを入れると、リモコンには「冷房 20度」と表示された。強気だなあ。設定を25度にする。でもよく見ると、冷房のほかに自動というモードがある。自動のほうがよさそうだなと思って設定ボタンを3回押す。すると温度の表示が消える。えっ、25度に自動で合わせてくれるってんじゃなくて、「どれくらいの室温にするかも含めて自動」なの? そんな質の高いAI搭載みたいなエアコンには見えないのだが、ひとまず自動モードにしてみた。特に工夫なく吹き出す中途半端に乾燥した冷風は、そこから30分ほど、特になにかを斟酌した雰囲気もないし、調整がかかった様子もない。おまけに部屋はそれほど冷えない。なんでこうしたんだ。自動モードにも設定温度つけたらいいのに。

…まあなんか理由はあったんだろうな。



そこにあるものにはいずれも、「来し方」がある。それに思いを馳せることなく、途中から出てきて、「もっとこうすればいいのに」を投げ込む者の暴力性を眺めれば眺めるほど、私は他人にあれこれものを言えなくなっていく。ああ、清水研先生はすごかったな。ああいう人になりたいものだな。

悪夢

びっくりするほど忙しく、また、その忙しさの一部は「人が自分の気持ちのためにあえて忙しくなることを望んだもの」であったりする。しょうもないなあと思う。人間はそうやってすぐにいろいろと枠組みとかしきたりを整える。

「ミスや不足を構造で防ぐためですよ」みたいなことを、人は平気で言うけれど、現実的には、「ミスや不足があっても、これだけ構造を整えているのだから、個人の責任ではなく不可抗力だよ」と言い訳をするためのものでしかないように思える。□欄を☑にするだけのことに目を三角にするのを仕事とは言わない。やった気になるからといってやっていることにはならない。

私の今のマネジメント仕事の1/5くらいは、誰かの自己満足と周囲への未必の故意のハラスメントによって生まれたいらない制度を刈り込んでいくことである。これをやろうと思うと、まずはその構造に浸りきっていろいろ体感しなければならない。頭から全否定してまるごと取っ替えようとしてもだめだ。それは私が次の、別の構造を持ち込むだけの話で、私ばかり気持ちよくなって溜飲も下がるだろうけれども、現場にはなんのいいことも起こらない。がちがちにしばられた構造の中で、これが求められた理由を追体験して、しかし、一見必須にみえる項目の中にも、かならず「ついでに導入されたオプションでありながら義務」みたいになっているものが潜んでいるので、そこをぷちぷち潰していく。人が作ったものを微調整して人がつくるものにしていくだけのことで、自然や関係性にまで踏み込めないこの時間を歯がゆく思うが、しかし、まあ、なんか、給料が発生しやすそうな時間だなと思わなくもない。


ここまで書いてうんざりしてPCを閉じた。自分に近い側の窓にはサンシェードを降ろしているが、反対側の座席のほうから、朝日がさんさんと振り注いで足元を焼いている。あと40分で着くから今のうちに寝ておくべきだ。あまり倒せない座席で寝返りをうちながら目をつぶり、ついさっき返事したメールへの先方の返信を予想して、それにさらに返信を考えていく。セルフ・マイクロマネジメント。ろくでもない睡眠だなとぐったりしているうちに電車はトンネルを何本も抜けていく。

DIYHIGE

15年くらい前、札幌厚生病院の病理診断科に実習に来ていた学生の何人かとよく音楽の話をした。音楽の話ができなかった学生のことは忘れてしまったが、音楽の話ができた学生、七、八人のことは今もうっすら覚えている。なかでも、特に私と音楽の趣味があった二人のことは、これだけ時が経っても忘れることはない⋯⋯とまで言うと若干盛った、じつは、名字とかはおぼろげだし、顔も印象派の絵画くらいにはノイズがかかっているのだけれど、名義や外見はともかく語り合った音楽の印象は忘れない。15年経つとお互いに立場も変われば顔も変わる、今すれちがってもあるいはわからないだろう、でも彼女らをきっかけに聴いた音楽のギターリフ、ベースライン、ボーカルの音質は今も脳内でなら完全に再現して響き渡らせることができる。そういうことはあるのだな、ということを、当時は全く気づいていなかったけれど、今、知るし、今後そのような出会いというのはたぶんそうそうないのだろうなと思う。

その中のひとりと、以前、病院とは関係ない場所でばったりと再開した。臨床検査技師だったその人は、転職してある機器メーカーに勤めており、私の専門領域に微弱なかかわりがあったために私に連絡をしてくれた。そこからときおり、何年かに一度のレベルだけれど、たまに学会場などで顔を合わせて挨拶をし、最近はどんな音楽を聴いているのかと尋ねる。私はもっぱらポッドキャストばかり聴いていて、ほぼほぼバンドミュージックからは離れているのだけれど、その人は今もたくさんの音楽に囲まれて暮らしている。かつて私たちが好きだったバンドのボーカルがスピードに惑溺してすっかり変わってしまって残念だとか、最近好きになったバンドのメンバーが妊活に入るからといってバンドをいったん活動休止にしたのがかっこいいとか、そういうことを数年に一度、聴いて、おもしろがっている。

最近はまっている音楽とかどんな感じなの、と聴いて、あがってきた名前が、MJ Lendermanという海外の男性アーティストだ。どういうところがいいのか聴いたら「声質」というからおもしろい。その人はバンドで演奏もするのでてっきり楽器のほうが好きなのかと思ったけれど、結局音楽というのは声質なんですよね、ぶっちゃけ、みたいなことを言うから私はにこにことした。そうだよね。理屈じゃないよね。MJ Lendermanはかすれた感じだ。MJ Lendermanはよいギターを弾く。MJ Lendermanは昔聴いていたことがあるような気もする。MJ Lendermanは昔のたいていのバンドよりもはるかに音楽性が高くてうまい。ははあ、正しく歳を取って、正しく趣味を広げているもんだなあと、私はその人の相変わらずの音楽の趣味の良さの先の、人生の楽しみの見つけ方のコツみたいなもの、に、じわりと感動をした。

もう一人は何をしているだろうか。ぜんぜん会うこともない。どこにいるのかもしらない。ただ、私の部屋の本棚には今も、彼女から借りたスーパーカーのライブDVDが、返し忘れたまま収まっている。私の生涯唯一の借りパクの相手がこれを見ていたら、連絡はしてこなくてもいい、ただ最近どんな音楽を聴いているかを、宛先のないポストでもして世に流しておいてほしい。いつか私がそれをみることもあるだろう。いつか私がそれを聴くこともあるだろう。こないだ燃え殻さんが沖縄で須藤寿の弾き語りを聴いていた、そのとき私は彼女のことを思い出した。いたなあ、と思った。

外食の構造

中華料理屋ならだいたい間違いはないだろうと思っていたのだが、たしかにあんかけ焼きそばは間違いなくうまかったのだが、セットの半チャーハンが今日未明に炒めたのかというくらい冷たくてびっくりしてしまった。まずい料理を出す中華料理屋。そうかそうか、一周回っていい体験をした。申し訳程度にくっついてくる杏仁豆腐もザーサイもよく考えたら別にいらない。それでもあんかけ焼きそばがうまければまたいつかやってきてしまうのだから、私はたぶん普通に中華料理が好物である。ラーメンよりも、焼き魚の定食よりも、生姜焼きと比べたとしても、たとえ相手がカレーだったとしても、中華料理が安心だ。ほか、居酒屋ランチも好きで、昔は出張の際にはたいてい、居酒屋が昼間はランチだけやっているみたいな風情の店を探してありあわせの定食を食べたりしていたのだけれど、たぶんこのブログにも書いたことがあるけれど、あるときから、居酒屋ランチ、味はいいのだけれど椅子やテーブルが思った以上に汚いという羽目に、二度ほど連続で遭遇してしまったことがあり(いずれも東京だった)、まあ、別にそこまできれいじゃなくてももともとあまり気にはしないが、さすがにこのあと発表というタイミングでスーツを汚すのも気が引けると思ってすこし足が遠のいている。

私の生活のなかで習慣になったものの多くは、東京に行くとしばしばリセットされる。東京を訪れるタイミングが年に二、三度で、それくらいの期間何かをやり続けていれば、当然、飽きることもあるだろう。でもそういう時間の問題だけでもなく、東京というところは、構造というかシステムというか、とにかくたくさんのつながりや折り重なりの中に、「飽きを喚起する」ものが含まれているような気がする。ここにいるといろんなことに飽きる。私の八方美人的な性格と、東京との相性はすごく良く、私は東京に「何かに飽きるために」来ているのではないかと感じることすらある。私は東京に来るたびに何かに飽きる。

飽きないのは仕事くらいだが、あまりに東京ばかり来ていると、いつか仕事にも飽きるのではないかとすこし心配である。


遠方に住む息子からときどき送られてくるLINEに、さまざまな自炊の写真が載っている。トマトからソースを自作したパスタを作っていたり、パンケーキ用のクリームをこしらえたりしている。私と同じ性格をもつ息子は私よりはるかにかしこく、料理や食事にかんして多くの選択肢というかバッファを持っている。それを見ながら私の自炊欲もむくむくと高まるし、東京に来ているうちは自炊なんてできないわけで、だから私にとっての東京というのは飽きを喚起するように感じる場所なのかもしれないなと、桂馬のような飛躍をしつつ東京を後にする。買ったことのあるお土産を買って帰る。