異分野融合/連携ゼミナール②「AIと知能」開催レポート

ニュース
2023-11-22

2023年11月18日(土)にMDA異分野融合/連携ゼミナールAIと知能」を行いました(MDAセミナーとしても併催)。数理物質系の照井章准教授と東北大学の斉藤いつみ准教授をお招きして、講演いただき、また、参加者とのディスカッションを行いました。当日の両氏の講演概要を以下にまとめましたので、ぜひ、ご一読ください。

「アルゴリズムとデータサイエンスによるAIの新たなる地平に向けて」照井章准教授(数理物質系)

数式処理の話を中心として、AlgorithmやData Scienceのアプローチにより未来のAIにいかに貢献できるのかを、ご自身の研究の取り組みを軸にお話しいただきました。

例えば、多項式の因数分解を行うための数学の理論があり、その理論を元にアルゴリズムを組めば、因数分解を実行できる。代数計算の理論があり、理論をアルゴリズム化し、そのアルゴリズムを実装し応用するようにするということが計算機代数(Computer Algebra)の分野で行われており、数式処理である。

この数式処理を用いた大規模なプロジェクトとして、東ロボ君(ロボットは東大に入れるか)というプロジェクトがあり、2011年から5年間にわたって、進められた。「人工知能にできること/できないことを調べる」という大きな目標の中で、学習分野が明確であり、人間との比較がしやすく、質問文も明確な大学入試をターゲットに人工知能の構築に取り組んだ。担当した数学分野では、問題文を自然言語処理により限量子消去(Quantify Elimination:QE)の形に書き換え、限量子消去を解くというアプローチで、臨みました。QEで解ける問題・解けない問題、得意な問題・苦手な問題があり、問題の種類によってはQEを経ずにソルバーを使うということも行った。また、ソルバーやQEへの入力の仕方によって、回答にかかる時間は大きく異なり、入力方法自体を機械学習で決めるというやり方も用いた。プロジェクト開始当初から、数学分野ではQEによるアプローチが有効と見込まれていて、QEによって解ける範囲を拡大していく研究開発が功を奏し、一定の成果を上げることができた。

現在、取り組んでいる研究として、数式処理によるロボットアーム制御がある。数値計算Numerical Computation)で局所最適を時々刻々と解いていく(ロボットアームを動かしていく)というロボット分野での主流アプローチに対して、数式処理により得たい状態に到達できるか・大域解はなにかを求めるというアプローチである。ロボットアームはジョイント部分の角度など操作できる変数の数が決まっており、連立方程式を解き、解を求める。初期の位置座標がパラメータとなるが、このパラメータを含んだまま連立方程式化することを行っている。求解性を保証するため、包括的グレブナー基底を用いて、パラメータによる条件分岐を設定した上で、解を保持することで、任意の状況で数秒以内に解を求めることができるようになった。

ロボットのタスク実行にあたって、障害物の把握と移動経路の計算といった人の操作を補助するという広い意味でのAI開発につなげていきたい。

「AIと知能:自然言語処理の進展」斉藤いつみ准教授(東北大学)

 土木・都市系で学士・修士課程を終えた後、修士研究で個人の行動履歴データを扱っていたこともあり、情報分野に興味があり、NTT研究所に就職した。研究所では、自然言語処理の研究開発を行い、並行して博士号も取得し、4月から東北大学で働いている。このようなバックグラウンドをもつ斉藤先生に、近年、成長が著しい自然言語処理・大規模言語モデルの話を中心に、人工知能の現在について、話していただきました。

 NTT研究所では、COTOHA Summerizeという長さやキーワードを指定した出力ができる自動要約モデルの開発に関わっていた。自然言語処理分野の変化をみると、この10年ちょっとで変化は著しい、Word2Vecという文章をベクトル化して入力する技術が出たのが十数年前で、2013年にAttention Encoder-Decoder、さらにTransformerを経て, 2018年頃にはBERTというPre-TrainingやFine-Tuningに特徴のあるモデルが発表された。文章の中の一部の単語を隠してその穴埋めを行うことで学習するMasked Language Modelといった事前学習の方法などにより、言語生成の技術が格段に上がり、現在のChat-GPTなどの大規模言語モデル(Large Language Model)につながってくる。

Chat-GPTは2022年に広くOpenAIが公開されて以来、爆発的なユーザー数を獲得しているが、高い汎用性を示していることが理由の一端だと思う。普通の文書を打てば、多様な問いかけに的確に回答するサービスとなっている。これまでのプログラミングに特化したAI、要約に特化したAIなどのある領域に特化したAIでは、サービス(AI)を人が選ばないとならなかったが、Chat-GPTは範囲の広い問いに答えてくれるので、サービスを選ぶ必要がない。このような人工知能を構築・サービス展開するために、複数の指示に応じた答え方を学ぶといったことや人間の選好に応じた回答をするための強化学習を行ったりしている。

言語のやりとり以外にも、画像と言語の両方の情報から画像を判別する、web検索も活用して最新の正確な情報を回答する、その他のツールを用いて(計算など)苦手な分野にも正確に回答するようにするといった形でできることが増えつつある。また、Self-AskやSelf-Refine、Self-Collaborationなど、問いに対して正確に回答するために自律的に行動するようなフレームも最新の研究成果として発表されている。

 また、人工知能分野では、Artificial General Intelligence(AGI)として、そのAGIのレベル設定と汎化性を基準に、進歩を表現しようという議論が起こっている。目的に特化したAIは、AlphaGoなど人間の専門家を超えるレベル(SuperHuman)に到達しているが、人間の能力の50%を総合的に超える汎化AIは、まだできていないという認識である。いずれにせよ、人間をサポートするためにAIをどう構築するのかという中で、まだまだ日進月歩の中にあるといえるだろう。