大学のAI開発環境をGoogle Cloudで短期間構築
計算リソースの適切な管理など最適な演習環境を整備
国立大学法人東北大学 様
AI人材の育成に注力している東北大学、最新のAI技術を使った演習に取り組んでいる。しかしながらGPUを用いた演習の適切な開発/運用環境の準備に課題を抱えていた。その解決のため、日本コムシス株式会社(以下、日本コムシス)の支援を得て、Google Cloudを基盤としたAI学習用のクラウド環境を新たに短期間で構築した。それにより、GPUが必要である演習を効果的に実施することが可能となり、さらにこの環境は、GPUが不要な演習でも使うことができるため、演習環境全体の効率化も実現した。
- 課題
-
- 講義期間中に発生する学生の計算リソース(GPU)利用制限の管理ができない
- 利用時の教員の負担を減らしたい
- 後期開始後から構築を始め、新年度の授業に間に合わせたい
- 効果
-
- 計算リソースをGoogle Cloudにすることで利用量管理が可能に
- ダッシュボードによる一元管理で教員の負担軽減を実現
- 実質約2カ月で構築を完了
AIと数理とデータ科学の教育を全学横断組織の主導で推進
AI(人工知能)の活用などDX(デジタルトランスフォーメーション)によって社会の変革が加速するなか、東北大学はAIと数理、データ科学の3分野を重要な素養とする「AIMD(AI, Math & Data science)教育」に注力している。
東北大学 データ駆動科学・AI教育研究センター教授 鈴木 潤氏は「数理とデータ科学はAIの下地となります。これから著しく発展していくであろうAI技術を正しく理解し有効活用できる人材になってもらうためには、これらの素養を磨くことが望ましいと考えています」と語る。
AIMD教育を推進するための組織として、2019年10月に設立された学内共同教育研究施設が「データ駆動科学・AI教育研究センター」(Center for Data-driven Science and Artificial Intelligence, Tohoku University、以下CDS)だ。「CDSは 、AIMD教育に関する授業カリキュラムを全学横断的に統括する組織です。AIMD教育のさらなる高度化に取り組み、理論と実践 を兼ね備えたAI人材の育成を目指しています」(鈴木氏)
授業で用いるAI開発環境でリソースや運用管理に課題
東北大学では、AIに関する授業で学生がプログラミングの演習課題に用いる開発環境を提供している。従来は主にGoogleの個人向け開発環境「Google Colaboratory」(以下、Colab)を利用していた。
Colabはクラウド型の開発環境であり、無料で即座に利用可能などのメリットがあるものの、大学の授業で利用するとなると、いくつか考慮すべき課題がある。まず挙げられるのがGPUの利用量上限と料金の支払いに関する問題である。
「Colabでは、計算処理に用いるGPUは一定の使用時間が過ぎると、料金を支払わなければ使えなくなります。無料枠内で使い続けることを仮定すると,GPUを使った演習の実施中に受講生がGPUを使えなくなる事態が発生し,演習の進行に支障が出ることが想定されます。また、もし料金を支払ってGPUの無料利用枠を超えて利用したいと考えた場合も、その当時はColabの有料利用には個人でしか契約ができなかったため、大学の予算で契約・支払いができない状況でした」(鈴木氏)
東北大学はこれらの課題に対応するため、授業・研究におけるAI学習クラウド基盤を新たに構築することにした。さらにはこれを契機に、一元管理の仕組みの追加など、演習環境のさらなる改善も進めることにした。
「構築の検討を始めたのは2022年の秋口でした。新年度の授業が始まる翌年4月から運用を開始したいという要望があり、短期間での構築を希望していました」(鈴木氏)
Google CloudおよびVertex AIを軸にAI学習クラウド基盤を実質2カ月で構築
AI学習クラウド基盤の要件には、Colabと同等の開発環境の機能を前提に、計算リソースの課題に対応する機能を盛り込んだ。それに加え、「例えば、教員の負担軽減のため、一元管理を可能とする管理ダッシュボードを必要としました」(鈴木氏)など、改善の要件も盛り込んだ。
これらの要件にて入札を行った結果、日本コムシスの提案が選ばれ、さっそく構築に取り掛かった。
AI学習クラウド基盤のシステムは、GoogleCloudをベースとした。クラウドにすることで短期構築の容易化を狙った。Google Cloudはサブスクリプション契約とし、利用時の細かいコスト管理を不要とした。
開発環境には「Vertex AI」を採用。GoogleCloudが提供するフルマネージメントの開発環境であり、Colabと同等以上の機能を利用できる。あわせて、日本コムシスが一元管理用のダッシュボードを作成し、組織ポリシーの有効・無効や許可サービスの追加・削除などをGUIで行えるようにした。他にセキュリティのさらなる強化なども果たしている。
システム構築は日本コムシスがGoogleCloud Japan社の支援を受けつつ実施し、2023年4月から本格運用を開始した。「実際の構築作業は約2カ月間で終わらせたなど、限られた時間のなか予定通りカットオーバーできて満足しています」(鈴木氏)
これら日本コムシスのソリューション全般への評価を鈴木氏は次のように話す「GoogleCloudの知見が深く、安心して任せられました。また、私自身は構築期間中に別業務が複数重なり多忙で、実装レベルの細かい仕様決めなどに十分な時間を割けませんでした。日本コムシスはそのような状況下、私たちが最初に示した大きな方針や目的から要望を汲み取り、細かい仕様などを先回りして提案してくれました。どの提案も的確であり、私はほとんど承認するだけで済んだので、大変助かりました」(鈴木氏)
計算リソースの最適な管理を実現
将来は東北地方の教育機関で共用も
東北大学はAI学習クラウド基盤によって、GPUなどを利用した最先端の高度なAI技術に関する演習を講義の中で実施するのに適した効果的な計算環境が構築できた。
リソースの問題については、サブスクリプション契約などによって、「支払いの関係でGPUが途中から使えなくなる事態の発生を解消できました。教員は安心して講義を進められるようになりました」と鈴木氏は語る。
さらに組織ポリシー適用などの一元管理体制を整備したことで、授業以外の不適切な利用の抑制も可能になった。
教員の運用管理についても狙い通り課題を解決できた。Vertex AIは必要とする開発環境(ノートブック型)をあらかじめ定義しておき、簡単な操作で素早く提供できる。
「統一した開発環境を提供可能になりました。現時点では本格運用直後なので、展開する学生数が少ないのですが、これから規模が大きくなるに従い、さらなる効果が期待できます」(鈴木氏)
その上、開発環境の統一は学生にも副次的なメリットをもたらした。「異なる講義で同じ演習環境を使うことで操作方法を覚えるコストを低減することができ、効率的に演習を進めることができるようになります」(鈴木氏)
しかも、Vertex AIは教員と学生で画面を共有できるため、プログラムの現物を一緒に見ながら質疑応答ができるなど、より効率的な学習指導も可能となった。
今後は規模の拡大を順次進めるとともに、使用時間や入力コマンドのログを収集によるきめ細かな管理体制など、AI学習クラウド基盤の拡充を進めていく。さらには大きな視座のもと、今回構築したAI学習クラウド基盤を発展させていく予定だ。
「演習課題の自動採点システムを追加で構築し、教員の負担をより軽減することなどを考えています。そして、理想としては将来、AI学習クラウド基盤を当学のみならず、東北地方の他大学や高専など教育機関の共通プラットフォーム化する構想も抱いています。それら前例のない取り組みに積極的に挑戦していくので、日本コムシスとGoogle Cloudには今まで通りの支援を期待しています」(鈴木氏)