生物学の知識や技術を援用した作品群を始めとし、科学的なアプローチで表現活動を行う石橋友也さんと、データ・サイエンティスト/エンジニアである新倉健人さん。共に広告会社に勤務し、石橋さんはウェブやテクノロジー関連の企画・制作、新倉さんはデータを用いたマーケティング業務に従事しています。今回採択された企画は、人間によってSNS上に日々生み出される「トレンドワード」(*1)を素材に、AI(人工知能)が詩を生成するという、広告やウェブというメディアの現在を意識した試みです。
アドバイザーを担当するのは、ソニー株式会社コーポレートテクノロジー戦略部門テクノロジーアライアンス部コンテンツ開発課統括課長の戸村朝子氏と、アニメーション作家/東京造形大学准教授の和田敏克氏です。
*1 トレンドワード……ウェブ上で検索数や発話数が急上昇している今現在関心を集めている言葉のこと。
システム開発の現状について
―前回同様、詳しくまとめられた資料に沿って中間面談がはじまりました。
石橋友也(以下、石橋):初回面談以降は主にエンジニアリングに費やしてきたのですが、前回の面談を受け、まず俳句ではなく、短文の詩を生成することに決めました。つくりたい詩のイメージをより明確にするため、既存の詩をリサーチしたところ、子供の詩、知的障害のある人の詩、ダダイスムの詩などが持つ、「素朴さ」や「論理の成立と飛躍のバランス」などが、求めているものに近いと感じました。
加えて、詩を生成する工程では鑑賞者とのインタラクティブ性は持たせず、全自動化する方向で進めています。
流れとしては、
① ウェブ上からリアルタイムにトレンドワードのピックアップ。
② そこから、複数の共起語(*2)を取得。
③ その中から選出した2つの共起語をもとに、詩の最初と最後の1文をつくる。
④ その間を埋める数文を生成し、詩が完成。
となります。
新倉健人(以下、新倉):まずプロジェクトの核となる、終盤の詩の生成(④)に用いるAIの開発状況についてお話しします。日本語学習には、整った文章を大量に収集できるものが良いと考え、機械翻訳の学習データなどのために構築された言語資料体「日英対訳コーパス」とウェブ上で公開されている小説のデータを用いました。この2つのソースより、計20万文を自動収集しました。前回の初回面談で問題視していた助詞の学習については、整った文章を学習させることでクリアできそうです。
学習した上で、品詞分解された単語をマッピングした16次元のベクトル空間を作成します。「〇は▲だ」と「〇は△だ」という文章があるとしたら、▲と△は似ている語として、近くに配置されるようなイメージです。
2文の間に数文を生成する部分では、このベクトル空間内に配置されている、2文を起点として、それらを線で結んだときにその線上にある語を用いて文を生成します。そうすることで、徐々に意味などが推移していく文が生成でき、これが人間にとって「詩のようなもの」に見えるのです。
石橋:トレンドワードの選出(①)については、僕たちなりの選出条件を探っているところです。実際のトレンドワードにはジェネレーターや芸能ニュースなども頻出するのですが、それらは詩のテーマには不向きと考えています。時代性やリアルタイム性を帯びたもの、響きに面白みがあるものが頻出するよう、ある程度コントロールしたいと考えています。また、数日から1週間程度のトレンドワードを織り交ぜることで、話題の均一化や王道感のあるワードの頻出を図りたいと考えています。
新倉:共起語の生成(②)にはインターネットで公開されている、フリーの共起語検索ツールを利用します。これはGoogleの検索データを活用したものなので、トレンドワードにも対応できるのですが、「ニュース」や「画像」などといった検索における頻出ワードも混在するため、それらを除去する方法を探っています。
共起語をもとにした詩の最初と最後の2文(③)については、その後の工程(④)にも用いるベクトル空間から生成するつもりだったのですが、想定以上に技術的な難易度が高く、ちょっと難航しています。生成ではなく、学習した文から共起語を含む文章を引用するのは比較的容易だったので、そちらも検討しています。20万文の中からなので、引用でも多様性は十分あります。
*2 あるキーワードを含むコンテンツ中に、一緒に頻出する単語のこと。
普段とは違う方法で言葉をつなぐ、詩の役割
石橋:部分的に人力を用いて流れをテストしてみたところ、詩の最初と最後に置く2文が長文だと、詩全体の文意が保てないことがわかりました。ワードサラダ(文法は正しいが意味の通らない文章)的になったり、ふいに助詞が連続して出てきたりしてしまいます。
そこで、初回面談でアドバイスをいただいた、「翻訳をかけてみる」という方法で解決を図ってみました。生成された詩を英訳し、さらに日本語に戻すと、文が滑らかになり、かつ言い回しの多様性が増して文章らしくなりました。その一方で、元の詩にあった音としての面白みや、リズム感などは失われています。文字を視覚的に表示するなら翻訳した文章が読みやすく、音として聞くなら、翻訳しないままの方が魅力的な気がしています。どちらを取るかは、アウトプットの形態次第かなと。
戸村朝子(以下、戸村):確かに、翻訳するとより文章らしくなりますね。ただ、そもそも詩には、言語を普段とは違った使い方、繋げ方をしてみせることで、読む人の想像や妄想を引き出すような、脳のマッサージをするような役割があります。そういう意味では、文意は多少通っていないくらいの方がいいとも考えられます。多少は整えられた方がいい気もしますが。2択ではなく、ハイブリッドにできないものでしょうか。
和田敏克(以下、和田):そうですね。意味が通り過ぎてしまうと、かえって詩ではなくなってしまうかもしれません。翻訳をかけていないものの方が、視覚的にも新鮮さや、機械らしさ、面白みがあるように思います。
新倉:部分的に翻訳をかけるのも一つの選択肢だと思うので、もう少し試行錯誤してみたいと思います。
機械の中の新たな知性をどう見せるか
石橋:生成過程のアニメーションもつくろうと思っていますが、第3のクリエイターや新たな知性などの存在を感じさせる見せ方として、人がPCやスマホでテキストを打つ際の、漢字変換やフリック入力の様子を再現してはどうかと考えています。
展示については、壁面の上部にディスプレイを設置して、その下にプリンターを設置するような、情報が流れ落ちるイメージで配置することで自動生成の様子を見せる案や、サイズダウンして、スマホとレシートプリンターを用いる案などを検討中です。合わせて周囲の壁面には生成結果を膨大に掲出するなどして、蓄積も見せたいですね。
和田:アニメーションをその方向性で制作するなら、入力の再現などの映像が続くと、見る側はすぐに飽きるので、味付け程度に留めるか、リズムが単調にならないように工夫すべきだと思います。ただ僕としては、アニメーションの雰囲気は、前回の面談で見たような、1行ずつフワッと出てくるようなシンプルなものがいいように思いますが。
戸村:機械が自動的に生み出しているということは、アニメーションのつくりではなく展示形態の方で伝えられると思います。ディスプレイやプリンターといったセットが複数並んでいて、同時多発的に動き続け、それぞれに別の詩を生成していれば、その様がちゃんと機械であることを物語ってくれます。機械的な展示空間と、アニメーションのしっとりとした温かみのあるイメージとの対比で、無機質さの中に人格や知性を感じさせるというのはどうでしょうか。
新倉:なるほど。僕らとしても、生成された詩をちゃんと読んでもらいたいという思いもあるので、そのためにもアニメーションはよりシンプルに見せた方がいいのかもしれません。
石橋:作品タイトルは今、「詩」「AI」「トレンド」などのキーワードから考えています。「3 Seconds Poetry」「刹那詩生成装置」「バズの響き」などが案として出ています。
戸村:せっかくならタイトルも、今回つくるシステムを用いて、そのキーワードをもとにAIにつくってもらうのはどうでしょう? よくわからないものが生成されたとしても、それもまた作品を物語るための要素になります。あるいは、わかりやすいタイトルをつけた上で、サブタイトル的に用いるのもいいかもしれません。
―次回の最終面談では、成果プレゼンテーションに向けた進捗について報告される予定です。